Аппаратные ошибки процессора в Ubuntu 17.04

12

Может кто-нибудь объяснить мне, что эти сообщения об ошибках я получил, когда я посмотрел в dmesg? Я новичок в Ubuntu и в мире Linux.

[ 7.802351] CPU4: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802352] CPU0: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802353] CPU5: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU0: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU4: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] CPU1: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] mce: [Hardware Error]: Machine check events logged
[ 7.802362] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802363] mce: [Hardware Error]: TSC 99561677c
[ 7.802385] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.802387] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802387] mce: [Hardware Error]: TSC 995616be4
[ 7.802388] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.802389] CPU2: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802390] CPU6: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802391] CPU3: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802392] CPU7: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.826359] CPU4: Core temperature/speed normal
[ 7.826359] CPU0: Core temperature/speed normal
[ 7.826360] CPU2: Package temperature/speed normal
[ 7.826361] CPU6: Package temperature/speed normal
[ 7.826361] CPU0: Package temperature/speed normal
[ 7.826362] CPU4: Package temperature/speed normal
[ 7.826363] mce: [Hardware Error]: Machine check events logged
[ 7.826367] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826368] mce: [Hardware Error]: TSC 99916f004
[ 7.826369] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.826369] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826370] mce: [Hardware Error]: TSC 99916f2ca
[ 7.826370] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.826400] CPU1: Package temperature/speed normal
[ 7.826401] CPU5: Package temperature/speed normal
[ 7.826402] CPU3: Package temperature/speed normal
[ 7.826402] CPU7: Package temperature/speed normal
[ 467.922330] CPU4: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922331] CPU0: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922332] CPU7: Package temperature above threshold, cpu clock throttled (total events = 86)
[ 467.922333] CPU3: Package temperature above threshold, cpu clock throttled 

Я использую Ubuntu 17.04 с общим ядром 4.10.0-29

M.Voyles
источник
или это программная ошибка у меня такая же в моем журнале новой Lenovo T480S, см. bugs.launchpad.net/ubuntu/+source/linux/+bug/1781924
Рольф Шумахер,

Ответы:

8

Процессор перегревается и переходит в MCE (события проверки машины) ... т.е. происходит сбой. Если вы не видите других событий, связанных с температурой, в системном журнале, возможно, это связано с тем, что ваш кулер / вентилятор / тепловая труба / термопаста процессора не выполняет эту работу.

  • Проверьте системный журнал с этой terminalкомандой ...

    grep -i -e temp -e therm /var/log/syslog*
    
  • Если машина очень грязная / пыльная, это может сыграть главную роль в перегреве машины. Вычисти это.

  • Если на вашей машине установлены процессоры Intel, убедитесь, что они intel-microcodeустановлены.

    sudo apt-get update
    sudo apt-get install intel-microcode
    reboot
    
  • Установите, thermaldчтобы попытаться контролировать температуру.

    sudo apt-get update
    sudo apt-get install thermald
    reboot
    
  • Проверьте версию вашего BIOS. Введите ваш BIOS при включении и обратите внимание на версию #. Зайдите на сайт производителя с маркой / моделью вашего компьютера. Перейдите в раздел поддержки / загрузки и посмотрите, есть ли более новый BIOS.

  • Наконец, и весьма вероятно, что если это старая машина, то термопаста, которая находится между процессорами и их тепловыми трубками / вентилятором, должна быть повторно нанесена. Это требует некоторого технического опыта.

heynnema
источник
1
Какое влияние это intel-micorocodeоказывает на температуру?
gene_wood
@gene_wood, как я уже упоминал, это, вероятно, проблема с пылью, вентилятором или термопастой, и проверка микрокода - это еще один шаг в удаленной диагностике проблемы. Процессор, на котором работает старый микрокод, может вызвать различные проблемы. Секунды, чтобы проверить это.
Хейннема