{"id":14275,"url":"\/distributions\/14275\/click?bit=1&hash=bccbaeb320d3784aa2d1badbee38ca8d11406e8938daaca7e74be177682eb28b","title":"\u041d\u0430 \u0447\u0451\u043c \u0437\u0430\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u044e\u0442 \u043f\u0440\u043e\u0444\u0435\u0441\u0441\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u044b\u0435 \u043f\u0440\u043e\u0434\u0430\u0432\u0446\u044b \u0430\u0432\u0442\u043e?","buttonText":"\u0423\u0437\u043d\u0430\u0442\u044c","imageUuid":"f72066c6-8459-501b-aea6-770cd3ac60a6"}

Понижение мощности видеокарты Nvidia RTX 3090 в Linux для борьбы с перегревом

Иногда требуется, чтобы GPU работал с меньшей мощностью. Например, при слишком долгом трэйне не хочется перегревать карту. Либо GPU со слабой заводской системой охлаждения и всегда сильно греется при максимальных нагрузках. Также в летнее время в комнате без кондиционера будет полезно. Еще один случай: несколько видеокарт слишком близко. Могут случится все факторы сразу.

В Linux системах можно понизить мощность Nvidia GPU стандартной утилитой nvidia-smi, которая входит в пакет драйверов. Например, команда для OS Ubuntu:

sudo nvidia-smi -pl 300

Где 300 это любое число в ваттах, выше которого не будет потребление. Действует сразу на все установленные карты Nvidia. После перезагрузки компьютера значение сбрасывается к заводскому.

Как измерить температуру GPU?

В Linux cамый простой способ наблюдения за температурой это запустить nvidia-smi через watch с обновлением в 1 секунду.

watch -n 1 nvidia-smi
Ежесекундной обновление nvidia-smi

Как снижается производительность карты при понижении мощности?

Данные теста для 2 х Gainward RTX 3090 Phoenix 24G NVlink, режим работы видеокарты P2 (Balanced 3D performance-power).

Сравнительная таблица понижения мощности.

При уменьшении почти на 30% мощности GPU, трэйн выполнился на 20% дольше. Выигрыш в температуре существенный 7-10 градусов. Более длительные, многочасовые задачи могут дать другие данные в том числ.

Какие пределы температур безопасны?

Пределы рабочей температуры отличаются внутри одной серии в зависимости от производителей. Более качественная система охлаждения сказывается и на стоимости.

Карты NVIDIA GTX 10-й серии, например, имеют максимальную температуру 94C, а карты RTX 20-й серии имеют максимальную температуру всего 88C.

Разные специалисты указывают, что безопасная для RTX 3090 температура находится в пределах до 85C при 100% нагрузке.

Nvidia публикует максимальную температуру видеокарты Founders Edition 3090 в 93 градуса.

С помощью команды:

nvidia-smi -i 0 -q

Можно увидеть какие предельные температуры возможны для текущей видеокарты. Для моей RTX 3090:

Температура выключения (GPU Shutdown Temp) - 98 С. Температура замедления (GPU Slowdown Temp) - 95. Максимальная рабочая температура - 93 С. Рекомендуемая температура - 83 С.
0
2 комментария
Коля Бандурченко

А можете ли вы уточнить, это температура по хотспоту или в целом по чипу?

Ответить
Развернуть ветку
miteigi nemoto
Автор

По данным nvidia-smi

Ответить
Развернуть ветку
-1 комментариев
Раскрывать всегда