{"id":14276,"url":"\/distributions\/14276\/click?bit=1&hash=721b78297d313f451e61a17537482715c74771bae8c8ce438ed30c5ac3bb4196","title":"\u0418\u043d\u0432\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0432 \u043b\u044e\u0431\u043e\u0439 \u0442\u043e\u0432\u0430\u0440 \u0438\u043b\u0438 \u0443\u0441\u043b\u0443\u0433\u0443 \u0431\u0435\u0437 \u0431\u0438\u0440\u0436\u0438","buttonText":"","imageUuid":""}

Понижение мощности видеокарты Nvidia RTX 3090 в Linux для борьбы с перегревом

Иногда требуется, чтобы GPU работал с меньшей мощностью. Например, при слишком долгом трэйне не хочется перегревать карту. Либо GPU со слабой заводской системой охлаждения и всегда сильно греется при максимальных нагрузках. Также в летнее время в комнате без кондиционера будет полезно. Еще один случай: несколько видеокарт слишком близко. Могут случится все факторы сразу.

В Linux системах можно понизить мощность Nvidia GPU стандартной утилитой nvidia-smi, которая входит в пакет драйверов. Например, команда для OS Ubuntu:

sudo nvidia-smi -pl 300

Где 300 это любое число в ваттах, выше которого не будет потребление. Действует сразу на все установленные карты Nvidia. После перезагрузки компьютера значение сбрасывается к заводскому.

Как измерить температуру GPU?

В Linux cамый простой способ наблюдения за температурой это запустить nvidia-smi через watch с обновлением в 1 секунду.

watch -n 1 nvidia-smi
Ежесекундной обновление nvidia-smi

Как снижается производительность карты при понижении мощности?

Данные теста для 2 х Gainward RTX 3090 Phoenix 24G NVlink, режим работы видеокарты P2 (Balanced 3D performance-power).

Сравнительная таблица понижения мощности.

При уменьшении почти на 30% мощности GPU, трэйн выполнился на 20% дольше. Выигрыш в температуре существенный 7-10 градусов. Более длительные, многочасовые задачи могут дать другие данные в том числ.

Какие пределы температур безопасны?

Пределы рабочей температуры отличаются внутри одной серии в зависимости от производителей. Более качественная система охлаждения сказывается и на стоимости.

Карты NVIDIA GTX 10-й серии, например, имеют максимальную температуру 94C, а карты RTX 20-й серии имеют максимальную температуру всего 88C.

Разные специалисты указывают, что безопасная для RTX 3090 температура находится в пределах до 85C при 100% нагрузке.

Nvidia публикует максимальную температуру видеокарты Founders Edition 3090 в 93 градуса.

С помощью команды:

nvidia-smi -i 0 -q

Можно увидеть какие предельные температуры возможны для текущей видеокарты. Для моей RTX 3090:

Температура выключения (GPU Shutdown Temp) - 98 С. Температура замедления (GPU Slowdown Temp) - 95. Максимальная рабочая температура - 93 С. Рекомендуемая температура - 83 С.
0
2 комментария
Коля Бандурченко

А можете ли вы уточнить, это температура по хотспоту или в целом по чипу?

Ответить
Развернуть ветку
miteigi nemoto
Автор

По данным nvidia-smi

Ответить
Развернуть ветку
-1 комментариев
Раскрывать всегда