На сервере с двумя процессорами нормально ли, чтобы один процессор работал горячее, чем другой?

51

У меня есть двойной сервер Opteron под управлением Linux с libvirt для размещения нескольких виртуальных машин. Виртуальные машины работают нормально, а сервер работает нормально, но я заметил, что один процессор всегда работает при температуре около 69C (дросселирует при 70C), а другой - около 15C.

Это не кажется мне нормальным? Разве они оба не должны быть немного ближе по температуре?

Я не уверен, как дианозировать дальше. Может быть, на одном из процессоров недостаточно термопасты?

Изменить: Материнская плата ASUS KGPE-D16 и охлаждается двумя вентиляторами Noctua NH-U9DO .

Обратите внимание, что я думаю, что температура может быть ниже температуры окружающей среды, а не абсолютные значения? Когда сервер работает на холостом ходу, температура процессора падает до 2C и 13C. Я использую конфигурацию lmsensors отсюда

samoz
источник
1
Что такое сервер / модель?
ewwhite
2
Как распределяется загрузка процессора? mpstat -P ALL 1на Linux поможет
Кристофер Перрен
3
звучит как разбитый датчик температуры
matcheek
14
15C, скорее всего, сломлен цензор ....
Reaces
Похоже, сломан или плохо откалиброван датчик, если вы можете перезагрузить сервер, взгляните на BIOS, который должен отображать правильные значения.

Ответы:

106

Проблема закончилась тем, что радиатор был плохо приспособлен. Может быть, плохо подходит не правильное описание. Оказывается, вы должны нанести термопасту на радиатор, а не пластиковую крышку, которая проходит над радиатором.

введите описание изображения здесь

Сняв пластиковую крышку, процессор хорош и крут, всем спасибо!

samoz
источник
51
+1 только потому, что это смешно
HBruijn
9
Вы имеете в виду, что кто-то оставил пластиковую крышку на месте, а затем на нее наклеил пасту, а затем на нее радиатор? Эпическая.
TomTom
4
Baaaaaahaaahaaahahahaa !!
Крейг
8
Мне нравится, как вы можете видеть условия, ограниченную гарантию и политику возврата в фоновом режиме. :)
Легкость гонок с Моникой
6
Если это заставляет вас чувствовать себя менее глупо (и не будет), я сделал то же самое с моей новой офисной кофеваркой. Кофе был слишком холодным, чтобы его можно было пить, и я собирал его обратно в магазин, прежде чем диск защитного картона упал с нагревательного элемента :)
Мартин Джеймс
25

По моему опыту, это нормально для парных компонентов в случае, когда они работают при разных температурах, потому что поток воздуха не везде одинаков. Вот график температуры жесткого диска из моей коробки. Диски зеркальные, поэтому рабочие нагрузки на них практически идентичны.

Муни График температур HDD за прошедший год

Как вы можете видеть, они отслеживают друг друга, но они не одинаковы; они также, в среднем, только 6C друг от друга. Независимо от того, сообщают ли ваши датчики абсолютную температуру или перегрев, разница в 55 ° C под нагрузкой кажется очень неправильной. Если вы уверены, что данные верны, то с учетом того, что разница покоя падает до 10C, что является той разницей, которую я вижу из-за воздушного потока, я бы заподозрил плохо установленный радиатор.

MadHatter поддерживает Монику
источник
1
Используя mpstat (от Кристофера Перрина, спасибо!) Я подтвердил, что нагрузка распределяется довольно равномерно. Вещи бездействуют прямо сейчас при + 3C и + 20C. Я попробую поиграть с радиатором, чтобы проверить, не болтается ли он. Как вы думаете, это может быть проблема термопасты?
Самоз
Это очень возможно (и тем более после того, как вы начнете шевелиться).
MadHatter поддерживает Монику
8

Это не так. Если у вас нет серьезных проблем с воздушным потоком. Или один из кулеров плохой. Температура будет варьироваться - но не так сильно (70 против 15 градусов по Цельсию).

Учитывая, насколько низок 15 градусов, я бы предположил (а), что ваш датчик выключен (вы действительно храните сервер в той прохладной комнате?).

Я также предположил бы, что по какой-либо причине один из процессоров просто не работает вообще.

Небольшие отличия нормальные. Некоторые более крупные из них могут быть (воздушный поток приходит мне в голову). но здесь мы говорим об одном быть ХОЛОДНЫМ.

TomTom
источник
2

Это может быть либо охлаждение, либо неравномерная загрузка (учитывая разницу во времени, ваша ситуация, вероятно, неравномерная загрузка). Вы должны использовать что-то вроде prime95, чтобы равномерно загрузить все ядра и посмотреть, не меняется ли температура. Если это не так, вам нужно сбалансировать виртуальные машины, убедитесь, что ваши приложения многопоточные и заняты. Как это сделать, зависит от вашего программного обеспечения и индивидуальной рабочей нагрузки, поэтому на самом деле выходит за рамки вопроса. Имейте в виду, что в этом нет никакого реального преимущества, если у вас недостаточно нагрузки для загрузки одного процессора / ядра, фактически ваша виртуальная машина может сознательно избегать использования второго процессора, чтобы она могла перейти в режимы энергосбережения на нескольких компьютерах. системы.

Если вы сузили его до охлаждения. Небольшая разница до 10C может быть слишком маленькой (или слишком большой!) Термопастой. Большая разница указывает на значительную проблему или разницу между процессорами кулера. Может случиться так, что кто-то заблокировал поток воздуха, радиатор был ослаблен и т. Д.

JamesRyan
источник
0

Я должен согласиться с, неполноценный темп. датчик, так как 15С это только 59F !!! Если бы компьютер не находился в чрезвычайно холодном центре обработки данных, я бы предположил, что температура окружающего воздуха будет выше 59F! Вы пытаетесь назначить виртуальные машины низкотемпературному ядру и посмотрите, есть ли какие-либо изменения; если нет, я бы очень подозревал, что датчик неисправен.

Вы также можете посмотреть вывод dmesg(загрузочных сообщений) и посмотреть, есть ли что-то необычное там.

Дж. Симонс
источник