Как диагностировать зависания и зависания компьютера?

29

Я построил настольный компьютер пару лет назад со следующими характеристиками:

  • Процессор: Intel Core 2 Quad Q9300 Yorkfield 2,5 ГГц 6 МБ L2-кэш-памяти LGA 775 95 Вт Четырехъядерный процессор BX80580Q9300
  • Материнская плата: EVGA 122-CK-NF68-T1 LGA 775 NVIDIA nForce 680i SLI ATX Материнская плата Intel
  • Видеокарта: две EVGA 256-P2-N758-TR GeForce 8600GT SCC 256 МБ 128-битная GDDR3 PCI Express x16 SLI Поддерживаемая видеокарта
  • Блок питания: SeaSonic S12 Energy Plus SS-550HT 550 Вт ATX12V V2.3 / EPS12V V2.91 Сертифицированный SLI CrossFire Ready 80 PLUS Сертифицированный активный источник питания PFC
  • Память: два G.SKILL 4 ГБ (2 x 2 ГБ) 240-контактный двухканальный комплект DDR2 SDRAM DDR2 800 (PC2 6400) Настольная модель памяти F2-6400CL5D-4GBPQ

С момента своего появления машина периодически блокировалась, с годами она менялась от одного раза в день до одного раза в месяц. Как правило, блокировки происходят один раз в несколько дней.

Под «блокировкой» я имею в виду, что мой компьютер просто зависает. Экран зависает, я не могу двигать мышью. Нажатие клавиш на моей клавиатуре, которые обычно включают или выключают светодиоды на клавиатуре (например, Caps Lock), больше не включает и не выключает светодиоды. Если во время блокировки звучала музыка, из динамиков продолжают выходить шумы, но только текущая частота / нота воспроизводится бесконечно. Там нет BSOD.

Когда происходит такая блокировка, я должен выполнить полную перезагрузку, либо выключив компьютер, либо нажав кнопку сброса.

У меня есть самая последняя версия аппаратных драйверов NVIDIA, и я обновляю их регулярно, но это, похоже, не помогло. Я в настоящее время использую Windows 7 x64, но ранее использовал Windows Server 2003 x64 и имел те же проблемы блокировки.

Я предполагаю , что это как-то связано с видеодрайвером или материнской платой, но я не знаю, как диагностировать эту проблему, чтобы определить, кто из них является виновником.


Дополнительная информация: охлаждение Что касается охлаждения ... Я не установил никаких систем охлаждения сторонних производителей, кроме двух обычных вентиляторов, которые я очистил от старого компьютера. Вентилятор на процессоре - тот, который поставляется с ним. Один из двух очищенных вентиляторов, который я добавил, расположен в нижней башне угла, чтобы создать поток воздуха спереди назад. Второй вентилятор направлен прямо на две видеокарты.


Установка и показания SpeedFan По предложению studiohack я установил SpeedFan , который обеспечивал следующие показания температуры:

  • GPU: 63C
  • GPU: 65C
  • Система: 76C
  • Процессор: 64C
  • AUX: 36C
  • Core 0: 78C
  • Core 1: 76C
  • Core 2: 79C
  • Core 3: 79C

Обновление № 3: Еще одна блокировка :-( Ну, вчера вечером у меня была другая блокировка. :-( SpeedFan сообщил о температуре процессора при 38 ° C, когда это произошло, и не было резкого скачка температуры, ведущей к зависанию.

Одна вещь, которую я замечаю, это то, что замораживание кажется более вероятным, если я смотрю видео. Фактически, из последних 5 зависаний за последний месяц 4 из них наблюдали за просмотром видео на Flickr. Не обязательно то же видео, но, тем не менее, видео. Я не знаю, просто ли это совпадение или это что-то значит. (Кроме того, каждую ночь перед сном моя 2-летняя дочь сидит у меня на коленях и смотрит домашнее видео на Flickr и в прошлом месяце выучила фразу: «О, компьютер сломался».)


Обновление № 4: Результаты тестов MemTest86 и 3DMark06 :

В соответствии с предложениями в комментариях, я запустил MemTest86 на ночь, и он циклически перебирал 8 ГБ памяти 5 раз без ошибок. Я также запустил тест 3DMark06 без проблем (см. Мои результаты на http://3dmark.com/3dm06/15163549 ).

И что теперь? :-)

Любые дальнейшие предложения о том, что проверить? Есть ли какой-нибудь способ получить трассировку стека или что-то подобное, когда компьютер блокируется таким образом?

разрешение

Я никогда не выяснял конкретные проблемы, но, основываясь на предложениях здесь и в других местах, я предполагаю, что это была проблема с материнской платой. В любом случае, я недавно обновил свою систему, купив новую материнскую плату, блок питания, процессор и оперативную память, и эта новая установка прекрасно работала последние несколько недель. Я использую те же графические карты, что и в старой настройке, так что я думаю, можно с уверенностью утверждать, что они не были причиной проблемы.

Скотт Митчелл
источник
первое слово, которое приходит на ум, - это тепло ... как вы сохраняете систему прохладной?
Джеймс Мерц
@KronoS: я отредактировал свой вопрос, чтобы включить ситуацию охлаждения. Обратите внимание, что я не использую программное обеспечение для мониторинга температуры процессора.
Скотт Митчелл
2
Вы должны установить SpeedFan и сообщить нам временные данные ...
studiohack
@studiohack: Спасибо за предложение - я скачал и установил SpeedFan и отредактировал мой вопрос, чтобы включить эти новые показания. Являются ли эти показания температуры нормальными?
Скотт Митчелл
2
@Scott Загрузите 3dMark '06 & FurMark и дайте ему поработать пару часов. Сообщайте о любых сбоях. Если произойдет сбой, используйте только 1 видеокарту за раз
Сатьяджит Бхат

Ответы:

11

Судя по тому, что вы разместили в темпе и охлаждения, ваш компьютер перегревается, и это первое, что нужно исправить. 64 C на холостом ходу недопустимо и не является предпочтительным при полной нагрузке. Я немного параноик и нервничаю всякий раз, когда мой процессор переваливает за 35, но на самом деле 50 должен быть вашим максимумом при нагрузке.

Инвестируйте в хорошее решение для охлаждения вашей системы. Довольно приличная система обойдется вам всего в 20-30 долларов. Если вам нужна помощь в поиске того, что нужно искать, взгляните на этот обзор Tom's Hardware, предлагающий решения для охлаждения стоимостью менее 40 долларов.

Также вы можете захотеть включить свой «Синий экран смерти» (как бы ужасно это не звучало), чтобы вы могли отлаживать проблемные блокировки. Это сделано:

-> правой кнопкой мыши на «Компьютер» в меню «Пуск»

-> Выберите «Свойства»

-> Выберите «Расширенные настройки системы»

-> Выберите вкладку «Дополнительно»

-> Выбрать «Запуск и восстановление»

-> Убедитесь, что «Запись события в системный журнал» включена.

Иногда существуют очистители, которые автоматически останавливают запись BSOD ( Advanced System Care ), и вы можете попытаться предотвратить это. После того, как вы проверили эту проблему, я предлагаю использовать BlueScreenView от NirSoft для просмотра проблем с отладкой и устранения неполадок .

Наконец, я бы проверил и перепроверил ваш компьютер и ВСЕ ваши соединения. У меня действительно была похожая ситуация, и я обнаружил, что один из USB-кабелей внутренней материнской платы был неправильно подключен, что вызвало проблемы.

Обновить

Я собрал несколько вопросов для общего устранения неисправностей и диагностики аварий или зависаний. Пожалуйста, обратитесь к ним, поскольку они также могут помочь вам в поиске проблемы.

Джеймс Мертц
источник
@KronoS: У вас есть какие-либо рекомендуемые системы охлаждения, которыми вы хотите поделиться?
Скотт Митчелл
@ScottMitchell ... обновленный ответ. Я настоятельно рекомендую вам провести исследование, поскольку ситуация у каждого Суперпользователя разная.
Джеймс Мерц
3
@ScottMitchell Я бы порекомендовал вам сначала изменить материал термоинтерфейса (TIM, также известный как термопаста) перед добавлением внешнего охлаждения. Кроме того, проверьте наличие пыли на вентиляторах / решетках / вентиляционных отверстиях и удалите их с помощью баллончика со сжатым воздухом.
Сатьяджит Бхат
@ Сатья: Спасибо за предложение. Я взломал корпус на прошлой неделе, и компьютер работал в течение дня с открытым корпусом, и температура упала до 40-х годов. Этим утром я осмотрел существующую систему охлаждения процессора и заметил много пыли, покрывающей решетки под вентилятором, поэтому я вычистил их. Я вернул дело, и мы посмотрим, останутся ли временные температуры низкими и поможет ли это предотвратить будущие заморозки. (Если так, я отмечу это как ответ ...)
Скотт Митчелл
@ Скотт Ах рад слышать, держать нас в курсе.
Сатьяджит Бхат
5

Жесткие зависания системы (когда вы не можете использовать горячие клавиши, такие как CTRL + ALT + DEL), вызваны зависанием драйверов,
поэтому вам придется либо заменить устройство, либо обновить драйвер. Устранение неполадок может быть сделано:

  1. Загрузите установку из средств анализа производительности Windows для вашей версии Windows.
  2. Установите программное обеспечение в вашей системе.
  3. Откройте командную строку от имени администратора и скопируйте и вставьте следующую команду:

    xperf -start perf!GeneralProfiles.InBuffer && timeout -1 && xperf -stop perf!GeneralProfiles.InBuffer myTrace.etl
    
  4. Нажмите ENTER один раз, чтобы запустить команду, теперь вам придется ждать, пока ваша система зависнет.
    Вы можете делать все, что хотите. Пожалуйста, никакой тяжелой деятельности, как игры или личные вещи ...

  5. Сразу после того, как ваша система перестает зависать, вы идете к консоли и нажимаете ENTER.
  6. Через некоторое время будет создан файл журнала myTrace.etl, сожмите его в zip-файл.
  7. Поместите эту сжатую версию файла где-нибудь онлайн (возможно, 2shared).
  8. Поделитесь ссылкой здесь, я сделаю попытку найти и показать вам причину вашей проблемы.
Тамара Вийсман
источник
11
Вопрос повторно: шаг 5 - что мне делать, если система не перестает зависать, пока я не перезагружаю машину?
Скотт Митчелл
@ScottMitchell: вместо этого попробуйте создать ручной аварийный дамп .
Тамара Вийсман
4

Если с момента создания компьютера прошло пару лет, то тщательная очистка была бы хорошим вариантом действий. Удалите всю пыль с вентиляторов, радиаторов, плат и углов. Наиболее важными частями являются радиаторы процессора и вентиляторы. Сжатый воздух хорош для этой цели, но пылесос может быть полезнее в долгосрочной перспективе. Выполнение этого тщательно уменьшит вентиляцию и уменьшит тепло.

Нагревание не должно быть проблемой для нового компьютера, если только он не хранится в очень теплой и плохо проветриваемой комнате (или кабинете). Производители CPU ожидают, что их продукты будут использоваться в различных условиях, и даже стандартный радиатор и вентилятор сделаны для того, чтобы продукт работал в большинстве случаев.

Поскольку у вас были проблемы с момента его создания, я склонен склоняться к сбою в одном из компонентов. Исходя из описанных проблем, я склоняюсь к неисправной материнской плате, основываясь только на своем собственном опыте.

Xantec
источник
1
Как я отметил в своем вопросе, эта проблема зависания возникала с некоторой регулярностью, так как я построил компьютер. К сожалению, это не недавнее явление.
Скотт Митчелл
правильный. именно поэтому я склоняюсь к неисправному элементу оборудования, а не к теплу, так как нагрев не должен был быть проблемой при первом его создании (если только вы не держите компьютер очень теплым для начала)
Xantec
Тепло могло быть проблемой, когда система была построена. Однажды мы получили двухпроцессорную рабочую станцию ​​от крупного производителя с вентиляторами процессора, подключенными к контактам вентиляторов материнской платы другого процессора. ... Но вряд ли проблема в этом случае.
Майк Чесс
1

Я прошел этот процесс в прошлом году.

Прежде всего, нужно определить, аппаратное или программное обеспечение. Это означает запуск двух разных ОС на нем. В моем случае моей основной установкой был linux, и он зависал наугад - похоже на то, что вы описываете. Иногда каждые 5 минут, иногда - несколько дней.

В конце концов я установил Windows, которая испытывала те же проблемы. Когда я перезагрузился и завис во время поста, я вернул МБ и с тех пор проблем не было.

В процессе отладки я также пробовал разные видеодрайверы - обычные неускоренные драйверы не зависали так часто. Я также установил темп. Мониторинг утилит и просмотр журналов, чтобы увидеть, было ли что-то общее до остановки. Поскольку это было аппаратное обеспечение и, по-видимому, случайное, я так и не нашел способа надежно вызвать проблему, но это должно быть вашей целью.

Крис
источник
Я не совсем уверен, что вы предлагаете здесь?
Джеймс Мерц
Если это проблема с оборудованием, проблема будет присутствовать независимо от ОС. Если он отображается только с одной ОС, а не с другой, то, скорее всего, это программное обеспечение.
Крис
1
@ Крис: проблема была вокруг, так как я построил компьютер. Первоначально я использовал Windows Server 2003, позже я обновился до Windows 7. В обеих ОС я испытывал такие зависания / блокировки.
Скотт Митчелл
@ Scott - Вы также отслеживаете температуру GPU? Если несколько ОС сталкиваются с одной и той же проблемой, я бы склонялся к аппаратному обеспечению, хотя предположил, что обе используют один и тот же видеодрайвер. Вы пытались удалить одну из видеокарт и посмотреть, сможете ли вы сузить ее до определенной карты?
Крис
1
Ну, если вы предполагаете, что это не видеокарты, то это оставляет память, материнскую плату или программное обеспечение. Если вы исключаете программное обеспечение из-за проблем с Win7 и Win2003 (чего я бы не сделал), это оставляет память или МБ. Можете ли вы поменять оперативку?
Крис
1

Я бы заподозрил сначала блок питания. Попробуйте заменить его на более мощный блок питания и посмотрите, станет ли все более стабильным. Возможно, рельсы напряжения немного падают под нагрузкой, что объясняет, почему они чаще появляются при воспроизведении видео.

Чтобы проверить эту теорию, вам понадобится точный вольтметр и некоторые базовые электрические навыки, но, учитывая, насколько полезен запасной источник питания, я хотел бы просто поменять его и посмотреть.

Оптимальный циник
источник
1

Основываясь на вашем обновлении № 3 и блокировке при 38 ° C, высокая температура mobo / cpu не является основной причиной. Предполагая, что у вас есть только добавленные видеокарты и никаких других дополнительных карт (у меня когда-то был такой хороший ник!), Я делаю эти рекомендации в порядке, который, по моему мнению, является наиболее вероятной причиной:

  • Замените видеокарты на другую заведомо исправную карту для устранения неполадок. Купите один, одолжите один - что угодно. Если это не помогло, переходите к следующему пункту.

  • Вы упомянули обновление драйвера видеокарты, но больше ничего. Убедитесь, что все возможные драйверы действительно актуальны. У меня была хорошая карта сделать это один раз, и все, что я должен был сделать, чтобы исправить это обновить драйвер.

  • Если у вас действительно нет каких-либо других надстроек (если они есть, удалите их сейчас), отключите все дополнительное оборудование в BIOS. Под этим я подразумеваю ваш встроенный звук, доступ к локальной сети и извлечение любых USB-предметов. Затем посмотрите, исчезнет ли это.

Я выйду на конечность и скажу, что на 90% уверен, что это будет исправлено, выполнив пулю № 1.

Flotsam N. Jetsam
источник
1

Вероятно, проблема с видеокартой, заменил много 8600GT (G84). Это был большой провал на стороне NVIDIA, особенно. в ноутбуке (8x00M) серии.

Температура графического процессора 65 ° C кажется слишком высокой, если она простаивает.

Запустите пятиминутный тест прожига с Furmark; если он зависает - виновна видеокарта.

Проблемы https://en.wikipedia.org/wiki/GeForce_8_Series#Problems

Furmark http://www.ozone3d.net/benchmarks/fur/

nomen_n
источник
0

Похоже, здесь проблема с оборудованием или драйверами. Хотя я бы использовал аппаратное обеспечение, так как у вас было две разные ОС на компьютере.

Работая над этим предположением, начнем с самого простого. Я видел, что вы запустили Memtest, и, хотя это замечательно, это не обязательно исключает возможность подозрения. Поэтому попробуйте следующее: выньте все, кроме одной флешки, и посмотрите, не заблокирован ли он. Если он какое-то время работает нормально, вставьте еще один и так далее, пока проблема не возникнет снова. Если он все еще зависает, попробуйте другую флешку в другом слоте. Если он все еще заблокирован, перейдите к другим аппаратным компонентам.

Некоторые люди упоминали, что пытались поменять вашу видеокарту, и я согласен. Купите дешевый или одолжите у друга и попробуйте это. Сделайте то же самое с источником питания. Ваш блок питания выглядит как приличный, но они идут плохо, и стоит поменяться и посмотреть, решит ли это вашу проблему.

Если все это не помогает, я бы сказал, заменить материнскую плату. Тем более, что вы сказали, что у вас есть проблема с тех пор, как вы впервые получили компьютер.

И последнее, что нужно проверить, просто чтобы быть в безопасности. Сделайте тест chkdsk / SMART на ваших жестких дисках. Они, вероятно, в порядке, но все равно стоит проверить.

Нори
источник
0

Из вашего описания похоже, что проблема в материнской плате. Возможно, проблема в вашем северном мосту ( схема материнской платы ). То, что я также проверю, это конфигурация BIOS для тактового генератора и скорости процессора. (Я не знаю вашу материнскую плату, но, возможно, у нее есть некоторые функции разгона.) Может быть, проблема всегда возникает, когда есть высокая нагрузка и процессор пытается работать быстрее.

Раффаэль
источник
0

Здесь я расскажу о крыле и предполагаю, что виновником является перегоревший конденсатор, который не может подавать электрический заряд для сглаживания ошибок колебаний тока. Я предполагаю, что достаточно значительные колебания приведут к зависанию системы, но останутся включенными.

Основываясь на прошлом опыте, я возложил бы вину на перегоревший конденсатор в вашем блоке питания (PSU), но я бы посоветовал проверить все конденсаторы в вашем компьютере, внутри и вокруг материнской платы, особенно вокруг северного моста. Если вы разгонялись, материнская плата, скорее всего, была зажарена. Хотя маловероятно, что конденсаторы перегреют под радиаторами, это также возможно.

Если вы не найдете ничего взорванного на материнской плате, я бы гарантировал ваш блок питания, так как некоторые имеют длительную гарантию - мою 7 лет - поэтому не открывайте ее для проверки, если вы не знаете, что у вас нет гарантии. Достойный источник питания может быть исправлен с помощью правильных инструментов, если это просто конденсатор.

Джонатан
источник
-1

Я справлялся со многими подобными ситуациями, и наиболее распространенной проблемой, которую я обнаружил при зависаниях или замораживании, была паста радиатора. Ваш вентилятор может делать все, что хочет, но если воздушный зазор между радиатором и процессором разрешен, радиатор не будет охлаждать воздух между ними. Если эта паста слишком высохла или в местах, где ее не должно быть, или ее недостаточно, или не разрешать проводящее тепловое соединение между процессором и приемником, она заблокируется, потому что она включает схему защиты процессора в самом процессоре , Делайте это пять или шесть раз, пока эта проблема не исчезнет. Это в конечном итоге будет, или мы выбросим ваш процессор и отправим вам новый, даже не сказав вам. Мы не хотим заменять ваш процессор. Мы делаем это 10 раз, прежде чем мы это сделаем.

Соответствующий, но не могу сказать вам
источник
1
Я могу поверить, что вы знаете, о чем говорите, но я не понимаю, о чем вы говорите. Пожалуйста, отредактируйте свой ответ, чтобы уточнить - я дал вам старт. Например: «Сделай это пять или шесть раз…» - что? «Мы делаем это 10 раз…» - что делать, и кто такие «мы»? Также, пожалуйста, уточните, что вы говорите, что Сатья ♦ еще не сказал в своем комментарии 10 декабря 2010 года в 21:36 .
Скотт
-1

Это может быть проблема с драйвером - всякий раз, когда он собирается обработать ваше видео, он, скорее всего, вылетит (он также может издавать странный шум), потому что ваш экран зависает - процессор все еще может работать - на самом деле все может работать - вы можете просто не сможете увидеть результаты ваших манипуляций с мышью / клавиатурой, потому что после сбоя драйвера нет ничего, что могло бы обрабатывать визуальные представления входов.

Возможное решение: обновите драйвер, если он начался при обновлении драйвера, вернитесь к предыдущему драйверу, если ваша видеокарта старая, попробуйте купить новую - иногда, когда старые карты исправляются новыми драйверами, они могут содержать ошибки.

Перегрев действительно является проблемой, только если ваша карта работает на 110% от производимой мощности, это может вызвать сбой, но опять же, ЕСЛИ только вы сильно ее увеличили.

Enariel
источник
Это предположение, хотя и приличное. Но это также может быть питание, сбой отдельного компонента, нагревание где-то помимо процессора (графического процессора, жесткого диска). Это может быть просто плохой установкой.
Остин Т Френч
-2

Я согласен с Нори о проведении теста SMART. Используйте (бесплатную версию) HDTune для копирования в атрибуты SMART. Также сделайте сканирование ошибок. Один поврежденный сектор может вызвать проблемы, которые вы описываете. Перегрев обычно вызывает BSOD и принудительную перезагрузку или выключение. Поскольку он «зависает», он звучит для меня скорее как проблема с жестким диском (даже если плохие жесткие диски могут вызвать BSOD).

Проверьте состояние SMART и запишите данные «Количество часов при включении». Если счетчик не увеличивается через несколько часов, атрибуты SMART, вероятно, замораживаются и дают вам поддельное состояние «ОК».

Также проверьте журналы событий системы и приложений Windows на наличие ошибок.

(панель управления -> Администрирование -> Управление компьютером -> Просмотр событий)

Обязательно сделайте резервную копию всех ваших важных данных.

Джеймс Т
источник
Проблемы с диском почти всегда ухудшаются с течением времени, что не соответствует описанию.
Flotsam N. Jetsam
@Flotsam Хороший вопрос. Сломанный жесткий диск, вероятно, умрет через несколько лет. Возможно, ненадежный RAID-контроллер. Журналы событий все еще могут дать некоторые полезные советы.
Джеймс Т
Не страшный совет, но не на месте для этой конфигурации и описанных симптомов.
Ярослав Рахматуллин