Ноутбук работает на 30 ° горячее, чем обычно; CPU / Load нормальный. Что может вызвать это и как я могу диагностировать это?

10

Я использую последнюю версию Arch Linux на своем ноутбуке ThinkPad t420, и у меня периодически возникают проблемы с нагревом, когда моя температура поднимется с типичной температуры ~ 45 ° C до ~ 75-90 ° C и останется там до перезагрузки.

Я запускать несколько диагностических инструментов, включая очевидное htopи других, прибегая к помощи предложил, в том числе powertop, iostatsи , конечно , другие я не помню. До сих пор у меня не возникало никаких явных проблем и якобы никаких различий в показаниях, независимо от того, работает ли мой компьютер нормально или в этом горячем состоянии.

Я также убил большинство подозрительных процессов один за другим (базы данных и другие демоны), надеясь найти скрытого преступника, но безрезультатно.

Помимо этих попыток, я не знаю, с чего начать устранение неполадок . Я надеюсь, что кто-то может указать мне правильное направление, чтобы начать поиск более глубокой проблемы.

Если быть точным, мой вопрос не в том, как охладить мою машину, а в том, что может вызвать постоянное изменение температуры на 30 градусов в системе, где (по сообщениям) процессор и нагрузка в норме? И какие инструменты / практики я могу использовать для диагностики?

Некоторые заметки, которые могут быть полезны:

  • Я могу охладить систему (например, полностью отключив управление вентилятором), но она немедленно снова нагревается, если ее оставить в покое. Кажется, это говорит о том, что удержание тепла не является проблемой, а скорее что-то постоянно генерирует тепло.
  • Загрузка процессора и загрузка регистрируются htopкак нормальные после входа в это горячее состояние. Это включает в себя потоки ядра. Согласно данным htop, система в основном простаивает (загрузка процессора составляет 1-2%, загрузка 0,10).
  • Моя машина использует интегрированную графику Intel HD и не имеет другой видеокарты . Карта nVidia была опцией для этой модели, как отмечает @braiam; Я не выбрал это.
  • @terdon поднял настройки регулятора ЦП. Мои процессоры настроены наpowersave
  • Мой конкретный процессор - Core i7-2620M с частотой 2,7 ГГц.

Изменить : на момент написания этого вопроса, мой FanControl не работал должным образом и работал постоянно на среднем диапазоне оборотов (3900 об / мин), даже при высоких температурах. По предложению @Alex и @JustDanyul это было исправлено. Основная проблема, однако, все еще остается.

numbers1311407
источник
1
Как подразумевает slm, если процессор простаивает, но температура ядра слишком высокая, единственное возможное объяснение состоит в том, что избыточное тепло не рассеивалось после некоторого события - единственное, что может выделять значительное количество тепла, - это процессор. Подумайте о том, чтобы полностью включить горелку, чтобы вскипятить немного воды, затем накрыть ее крышкой и поставить горелку на низкую температуру: вода постоянно кипит, потому что тепло не может рассеиваться так быстро, как низкая горелка заменяет ее, пока крышка на . Разберите его и почистите, если это так плохо, просто вдыхание воздуха, вероятно, не сильно поможет в этой точке.
Златовласка
Я обязательно разберу его и почисту, так как подозреваю, что у меня возникли некоторые проблемы с воздушным потоком, но, поскольку это так, процессор будет поддерживать постоянную высокую температуру в течение неопределенного времени после любого события, которое вызывает экстремальное изменение температуры. Даже если вы оставите крышку на кастрюле, температура воды в какой-то момент понизится. Моя временная шкала набирает номер и просто остается там постоянно, до тех пор, пока я не перезагружусь. Там нет постепенного накопления тепла, которое бы указывало на то, что у него есть проблемы рассеивания. Я работал под полной нагрузкой все утро и сижу под 41 градусом.
1311407
Иными словами, моя температура будет нормально регулироваться при ожидаемом стрессе. Если я делаю какую-то сложную компиляцию, она может нагреться до 60, 70 градусов, но когда это будет сделано, она остынет.
1311407
Помимо вентилятора, вы можете повторно нанести термопасту. Дешевле термопаста со временем рассеется.
BlueRaja - Дэнни Пфлугхофт
1
Может быть, это глупый вопрос, но случайно ли вы отключили ACPI? Некоторое время назад у меня были похожие проблемы со старым ПК, который не загружался с включенной этой опцией, после отключения он, наконец, загрузился, но также перегрелся.
Алко

Ответы:

6

Веселье

Моя тоже это делает, запустив Fedora 14. Попробуйте получить сжатый баллончик с воздухом и продуть вентиляционные отверстия сзади и сбоку корпуса.

Также периодически вам захочется снять клавиатуру и подавать сжатый воздух прямо на лопасти вентилятора. Они запекаются пылью и начинают влиять на ее эффективность, утяжеляя ее.

Лучшее в Thinkpads - это руководства по обслуживанию! Они показывают вам, как снести ваш ноутбук и собрать его обратно.

Плохой процесс

Еще одна вещь, которую я заметил, - это то, что у меня иногда бывает сбойный процесс, и он будет потреблять 100% одного из ядер. Убить этот процесс обычно возвращает температуру к норме.

Вы можете использовать htopили, topчтобы увидеть, что это за процесс, и либо убить его из своего или из терминала, используя его PID.

что-то еще?

См. Мой ответ на эти вопросы и ответы от U & L для получения дополнительных советов о том, как получить показания температуры для различных компонентов вашего ноутбука. Вопросы и ответы озаглавлены: Как получить температуру ядра для ядер haswell i7 в i3status .

SLM
источник
Это определенно то, что я должен сделать, но странным для меня является то, почему он только иногда переходит в горячее состояние и сохраняется до перезагрузки, что немедленно решает проблему. Похоже, что- то должно происходить, что вызывает постоянное изменение тепла. Я запустил htop безрезультатно. Загрузка процессора нормальная.
1311407
Может, какой-нибудь будит сигнал с ядром?
Брайам
1
@ спасибо, я не пробовал это. Я сделаю это в следующий раз, когда он начнет нагреваться и сообщу о результатах.
1311407
1
@ numbers1311407: Причина, по которой перезагрузка быстро решает проблему, заключается в том, что это отключает процессор на несколько секунд, позволяя температуре упасть ниже точки отсечки. Процессор всегда горячее окружающего, какой бы ни был «окружающий».
Златовласка
1
Обратите внимание, что в topкоманде вы можете нажать «1», чтобы увидеть загрузку отдельных ядер.
Кристиан Стюарт
3

Это более длинный комментарий, но вы должны взглянуть на thinkwiki.org - это ресурс для Linux на ThinkPads. Что касается температуры, у меня были подобные проблемы с моим T4500 и разобрался с ним, поиграв с

  1. Регулятор процессора, который управляет масштабированием частоты процессора. Ваш выбор:

    • Производительность поддерживает процессор на максимально возможной частоте
    • Powersave поддерживает процессор на минимально возможной частоте
    • Userspace экспортирует доступную информацию о частоте на пользовательский уровень (через файловую систему / sys) и позволяет контролировать частоту процессора в пространстве пользователя
    • Ondemand масштабирует частоты процессора в соответствии с использованием процессора (как это делают демоны масштабирования частоты в пользовательском пространстве, но в ядре)
    • Консервативный действует как по требованию, но шаг за шагом увеличивает частоту

    С помощью ondemand ваш процессор будет работать на максимальной скорости только при необходимости. В идеале это будет полностью прозрачно для вас, ваша машина будет просто работать так быстро, как необходимо для текущих задач. Для активации сделайте

    sudo echo ondemand > /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
    
  2. Управление вентилятором. Существует очень хорошая утилита под названием « Простое управление вентилятором ThinkPad », которая позволяет вам точно настроить температуру запуска, которая изменяет скорость вращения вентилятора. Также посмотрите информацию здесь .

Тердон
источник
Спасибо, это очень полезно. Я наткнулся на эту вики и раньше, но никогда не замечал, что именно.
1311407
Отметим, что все мои процессоры работаютpowersave
numbers1311407
1

Я думаю, что есть проблема в том, что вы считаете «горячим». Для Thinkpad t420 ( по данным форумов ) он составляет около 80-85 C и давайте забудем о плате nVidia, которая может также вызвать повышение температуры (на самом деле конфигурация Optimus может не работать должным образом, заставляя ваш процессор выполнять работу графического процессора). Это , скажем, максимальная CPU переносится температура 100С (если он получает там система выключится), в то время как атмосфера составляет около 10,0 ° C до 35,0 ° C . Тем не менее, если ваш ноутбук находится в пределах диапазона, все в порядке (за исключением вашего аккумулятора и срока службы ноутбука).

Теперь вы хотели указать на возможных подозреваемых. В этом аспекте я бы сказал, что плохая реализация nVidia с Linux может привести к тому, что ваш процессор не сможет работать в htop (или где-либо еще) из-за своей печально известной системы Optimus по требованию, которая, кажется, соответствует вашему текущему состоянию ( пока работает нормально, просто начинает нагреваться без контроля). Вы должны обновить вашу установку, пока у вас не будет полностью настроен Bumblebee. Вы можете использовать bbswitchдля отключения карты nVidia по желанию и посмотреть, как она идет.

Для установки Bumblebee for Arch вы можете найти пакет в репозитории. Если вы все еще не установили его.

Braiam
источник
Я не выбрал карту nVidia на этой машине. Извините, должно было быть более ясным по этому вопросу. И хотя 80-85 не слишком жарко , оно все же горячее, чем середина 40-х годов, и это то, на чем обычно работает мой компьютер при обычной небольшой нагрузке. Моя проблема состоит в том, чтобы определить, какое фантомное состояние «возникает» и приводит к тому, что мои постоянные 45 равны 80-85.
1311407
1

датчики показывают, что мой вентилятор гудит со скоростью ~ 3900 об / мин

Даже при температуре около 75-90 ° C?

так как ручное включение вентилятора временно охладит машину

Итак, одна проблема в том, что скорость вентилятора не работает автоматически?

Забудьте об авто, вы можете правильно прочитать температуру, и вы можете контролировать скорость вентилятора вручную, верно? Если это так, все, что вам нужно сделать, это найти работающий скрипт управления вентилятором или развернуть свой собственный (опрашивайте температуру и устанавливайте скорость в соответствии с таблицей temp[i]=speed[i], когда вы устанавливаете более высокую скорость, сохраняйте ее некоторое время, даже если температура снижается , когда вам нужно замедлить скорость, делайте это медленно и шаг за шагом).

Что касается опроса, лучше всего было бы иметь демон контроля температуры, который запускает события теплового изменения, и сценарий управления вентилятором, который прослушивает / ждет эти события, хотя я (возможно, и ошибочно) когда-то был, acpidно в настоящее время я не знаю.

В обоих случаях (ваш собственный / существующий сценарий), хотя вы не уверены в решении, всегда следите за температурой и оборотами, вентилятор не должен останавливаться.

autoСначала решите эту проблему, и если перегрев сохранится, вы можете сосредоточиться на причине.

редактировать

Возможно, вы захотите попробовать такой инструмент, как lttngсбор статистики всей системы за определенное время, но он может быть непростым в настройке и может быть дорогим с точки зрения хранения, если вам нужно собирать данные в течение длительного времени.

Alex
источник
Вы правы, что мой фанконтроль работает плохо, если вообще. Я постараюсь заставить его реагировать правильно, но исправление не решит основную причину. Я мог бы позволить вещи выпадать на максимальных 6400 и.с. в течение всего дня и немного остыть, но это причина, которую я пытаюсь устранить.
1311407
1

Поскольку ручное наращивание вентилятора решает проблему, это было бы отличным местом для начала устранения неполадок, так как это, кажется, предполагает, что автоматическое управление вентилятором не работает.

Теперь вы запускаете arch linux, отличный дистрибутив (да, я тоже его запускаю) с потрясающей вики. Итак, я должен спросить, вы RTFM? ;п

https://wiki.archlinux.org/index.php/Lenovo_ThinkPad_T420#Fans

Насколько я вижу, вам нужно:

  1. включить модуль ядра thinkpad_acpi
  2. установить и настроить приложение thinkfan из AUR
  3. включить системный сервис thinkfan

Это все было сделано?

ОБНОВЛЕНИЕ Я рад слышать, что ваш поклонник теперь работает правильно, а не просто крутится в счастливой среде. (Я так понимаю, это решило проблему вашей машины, работающей при температуре выше 80 градусов?)

Что касается ответа на вопрос, что является основной причиной 30-градусного изменения температуры, то у меня возникает соблазн спросить: не может ли это быть из-за того, что ваш вентилятор работает неправильно?

Давайте постулируем, что

  • процессор не работает тяжелее, чем обычно
  • колебания температуры теперь заменены колебаниями скорости вентилятора

Разве не было бы безопасно предположить, что проблема может вообще не быть, и проблема была просто в том, что ваш поклонник работал на уровне, на котором он едва справлялся? И небольшие изменения в температуре окружающей среды и т. Д., Поставить его за пределы своих возможностей?

Например, у меня был ноутбук Acer, а в теплые дни вентилятор «постоянно» вращался вверх и вниз. Бьюсь об заклад, если бы мой вентилятор не смог на самом деле настроить его самостоятельно, я бы также увидел довольно большие колебания температуры :)

JustDanyul
источник
Я только что установил ThinkFan. Спасибо за внимание к этому. Да, подробная арка вики - отличная привилегия дистрибутива. Я был там тысячу раз, но я никогда не спотыкался и не думал искать страницу, посвященную моей точной модели, и никогда не видел упоминаний Thinkfan. Хороший маленький сценарий. При этом, это не решает мою актуальную проблему: как мне диагностировать причину моей необычно высокой температуры? Даже если бы я отключил управление вентилятором и отключил его на максимальных оборотах, это только навлекало на себя реальную проблему таинственной жары.
1311407
Нет, проблема все еще существует без изменений. Я сижу здесь сейчас на 42 градусах. Когда наступит мой тепловой режим, я буду запускать те же процессы, окружение будет эквивалентным, ничего якобы не изменится, но моя температура повысится с непротиворечивого 42 до непротиворечивого 75+. Я могу охладить его: поставить его на кулер для ноутбука, отключить вентилятор, позволяющий вращаться со скоростью 6500 об / мин и т. Д. Но если я остановлюсь, он снова нагреется до 75+. Вентилятор на максимальной скорости работает лишь немного быстрее, чем в любом случае. Исправить это было хорошо, но не решение основной проблемы.
1311407