Тестирование ОЗУ противоречиво - кто является наиболее вероятным виновником? (т.е. на что мне тратить деньги на замену)

20
  • Материнская плата: GA-B85M-DS3H-A
  • Процессор: Core i5 4430
  • Оперативная память: PNY XLR8 DDR3 32 ГБ (4x8 ГБ) 1600 МГц (MD32768K4D3-1600-X9)
  • Блок питания: EVGA 500 W1 80+

Проблема

С установленными 32 ГБ ОЗУ система последовательно отказывает MemTest86 + 6.2. Ошибка всегда происходит во время первого прохода, и ошибки быстро увеличиваются до миллионов ошибок. Попытка запустить Windows приводит к случайным перезагрузкам и остановке ошибок (как и следовало ожидать с ошибками ОЗУ).

Что я пробовал

  • Проверьте один модуль PNY 8 ГБ в разъеме DIMM1. Успешно завершает 4 прохода MemTest.
  • Проверьте один модуль PNY 8 ГБ в разъеме DIMM2. Успешно завершает 4 прохода MemTest.
  • Проверьте один модуль PNY 8 ГБ в разъеме DIMM3. Успешно завершает 4 прохода MemTest.
  • Проверьте один модуль PNY 8 ГБ в разъеме DIMM4. Успешно завершает 4 прохода MemTest.
  • Проверьте все четыре 8GB PNY DIMM отдельно, по отдельности, в разъеме DIMM1. Все модули успешно завершают 4 прохода MemTest.
  • Проверьте два модуля PNY 8 ГБ в разъемах DIMM1 и DIMM2. Успешно завершает 4 прохода MemTest.
  • Проверьте два модуля PNY 8 ГБ в разъемах DIMM3 и DIMM4. Успешно завершает 4 прохода MemTest.
  • Протестируйте материнскую плату с четырьмя известными исправными модулями DIMM по 2 ГБ во всех разъемах. Успешно завершает 4 прохода MemTest.
  • Поменяйте местами порядок модулей PNY DIMM в разъемах. Без изменений - ошибки MemTest по-прежнему возникают.
  • Увеличьте напряжение оперативной памяти материнской платы с 1,5 до 1,65 В. Без изменений - ошибки MemTest по-прежнему возникают.
  • Поиграйте с различными комбинациями ручных настроек ОЗУ в утилите настройки - включение / отключение профиля XMP, настройка предустановки «повышенной стабильности» и т. Д. Без изменений, ошибки MemTest по-прежнему возникают.

Я думаю, что могу смело исключить плохую оперативную память и плохие гнезда оперативной памяти Только раз MEMTEST тесты не является , если все четыре модуля 8GB установлены одновременно.

Я измерил напряжение, исходящее от блока питания, и все там выглядит стабильно даже при всех четырех установленных джойстиках.

Когда я писал это, я попробовал последний вариант ручного снижения скорости ОЗУ до 1066 МГц в BIOS. На данный момент MemTest завершила один проход и находится на втором без ошибок. (Все вышеперечисленные тесты были выполнены на собственной частоте ОЗУ 1600 МГц.) Это может позволить мне использовать систему, хотя и с немного более медленными скоростями ОЗУ, но это не кажется постоянным исправлением.

Когда бы ни возникали ошибки MemTest, они всегда возникают в одной и той же точной позиции на 64-битной адресной шине:

Bit Error Mask: 00000000FF000000

Кроме того, ошибки НИКОГДА не возникают ниже барьера 4 ГБ. Другими словами, все ошибки происходят в адресном пространстве между 4 ГБ и 32 ГБ.

Я полагаю, что это какая-то странная проблема взаимодействия или синхронизации с процессором, оперативной памятью и материнской платой, поскольку ошибки очень непротиворечивы, возникают только в одной конкретной конфигурации, кажется, что они уменьшаются за счет замедления работы ОЗУ, и встречаются только выше 4 ГБ барьера. Мой вопрос: более вероятно, что мой процессор или моя материнская плата является виновником?

Я собирался обновить эту машину до Core i7-4790K, так что, если вероятным виновником является процессор (я знаю, что контроллер памяти находится на процессоре в этих новых моделях), то это работает хорошо, потому что я планирую обновить это все равно, но мне интересно, есть ли шанс, что сама материнская плата также может быть частью проблемы. то есть я не хотел бы тратить деньги на процессор i7 только для того, чтобы испытать точно такую ​​же проблему и выяснить, что я также должен заменить материнскую плату ...

Совет?


РЕДАКТИРОВАТЬ: медленная скорость ОЗУ по-прежнему выдает ошибки, но только после того, как тест достиг третьего прохода. Я перезапустил тест только с одним активным процессором, чтобы проверить взаимодействие с самим процессором.

fdmillion
источник
Единственный способ проверить, является ли это память, mobo или cpu, - это протестировать оперативную память в другой совместимой системе.
Моав
2
Если при перемещении микросхем ОЗУ проблема не исчезнет, ​​материнская плата окажется проблематичной.
Джошуа
1
Когда вы используете эту память в двойном режиме или если у вас есть 4 (8g) модуля, вы, возможно, можете снять ее с SPD (авто) и немного настроить время и заставить его работать. скажем, это 10,11,10,24, настройте его на 11,12,11,32 и протестируйте, как это. (да, это предположение) Если это работает на 100% без остановок, то это менее вероятно, будет проблема тепла или материнской платы. Люди с модулями 4x8gig сталкивались с проблемами, которые вы описали ранее, если есть поддержка регулирования напряжения, а процессор не имеет согнутых контактов, это может быть способом заставить работать вещи, отсутствующие в списке совместимости. так что проверь это и вернись к нам.
Psycogeek
2
«Медленная скорость ОЗУ по-прежнему приводила к ошибкам, но только после того, как тест достиг третьего прохода». Во время какого-либо из этих действий вы предпринимаете дополнительные шаги для проверки охлаждения оперативной памяти? Даже временно добавленный вентилятор или внешний вентилятор, перемещающий воздух через плунжер и его регуляторы напряжения, могут проверить, является ли нагрев одной из проблем.
Psycogeek
@Psycogeek +1 за предложение изменения времени. Некоторые модули ОЗУ не играют хорошо с другими в плане времени (даже того же бренда или типа модуля). У меня была проблема, похожая на OP, и я решил ее вручную.
Амцираро

Ответы:

18

Не похоже, что какой-либо компонент неисправен, скорее, вы используете несовместимую комбинацию.

Наличие нескольких сокетов на одной и той же шине памяти увеличивает емкость в каждой линии данных и замедляет время нарастания, что может привести к задержке переходов и неправильному определению. Это явление известно инженерам-электрикам как "раздувание".

Это еще более усложняется из-за разветвления внутри модуля памяти. Число и топология устройств DRAM в модуле, называемое «rank», будет влиять на количество модулей, которые вы можете успешно подключить параллельно.

Материнские платы сервера, поддерживающие много сокетов памяти, фактически требуют буферизованной памяти, которая использует каскадную сеть буферов, чтобы ограничить разветвление (и, следовательно, емкость), видимое каждым. Есть задержка, вызванная самими буферами, но она увеличивается только логарифмически с количеством нагрузок, тогда как для небуферизованной памяти емкость увеличивается линейно.

Википедия обсуждает это: https://en.wikipedia.org/wiki/Memory_rank

Некоторые руководства по материнской плате на самом деле вызывают подобные вещи. Для других вы можете вывести информацию из списков совместимости ОЗУ. Например, материнская плата ASUS Z170-A показывает, что двойной ранг (в руководстве называемый DS = двухсторонний) можно использовать только в двух слотах на этой плате, в отличие от возможности использовать четыре DIMM одного ранга одновременно. ,

введите описание изображения здесь

Бен Фойгт
источник
Предполагая, что это является причиной проблемы, может ли это помочь отключить SPD и настроить параметры синхронизации немного медленнее, чтобы компенсировать более медленное время нарастания / спада?
brhans
1
Я не уверен, действительно ли это правильно. Потребительские процессоры Haswell обычно поддерживают четыре ранга памяти на канал, что достаточно для размещения четырех двухсторонних модулей в двух каналах памяти. Почему это будет проблемой? Это также не объясняет тот факт, что проблемы возникают только выше барьера 4 ГБ. Кроме того, в руководстве по материнской плате говорится, что базовый чипсет B85 поддерживает 32 ГБ памяти и не упоминает никаких ограничений относительно количества рангов памяти.
bwDraco
2
@bwDraco: Несмотря на то, что контроллер памяти находится на процессоре, материнская плата также имеет значение. Расположение PCB может повлиять на это, субоптимальное согласование длины уменьшит запас по фазе на сигналах (именно поэтому ошибки соотносятся с определенными байтами или позициями битов). То, что в руководстве по материнской плате не говорится о рангах, не означает, что все комбинации поддерживаются, это просто означает, что это руководство по дерьму, не вдаваясь в детали.
Бен Фойгт
1
@brhans: важны не параметры синхронизации, а тактовая частота памяти, потому что проблема заключается в передаче между процессором и модулями DIMM, а не внутри DRAM. SPD обычно имеет несколько профилей, соответствующих разным тактовым частотам, поэтому лучше выбрать другой из них, чем полностью ручной.
Бен Фойгт
1
Определенно похоже на проблему целостности сигнала материнской платы. Модули большего размера могут иметь более высокую емкость на вывод, чем модули меньшего размера, особенно если сами модули имеют два ранга. Это может вызвать именно эту проблему, когда вы полностью заполняете ряды. Модуль может иметь более одного ранга. Таким образом, четыре ранга на канал могут легко быть двумя модулями высокой плотности двойного ранга. Это может быть усугублено электрическими характеристиками и маршрутизацией следов на материнской плате. Мое предложение: попробуйте другую материнскую плату.
alex.forencich
9

Это звучит как проблема в встроенном контроллере памяти процессора .

В современных системах материнские платы на самом деле не играют роли в управлении памятью, а просто обеспечивают путь между модулями памяти и процессором. Память напрямую связана с процессором для минимизации задержки; « Северный мост », который соединяет память с процессором в старых системах, теперь является частью самого процессора. (Микропрограмма или PCH могут управлять тем, как процессор работает с ОЗУ, но не имеет смысла вызывать битовые ошибки того типа, который вы описываете, так как это в конечном счете является обязанностью процессора.) Следовательно, самое первое, что я делаю ». Я подозреваю, что в подобной ситуации неисправен IMC.

На самом деле, я был бы очень удивлен, если бы материнская плата или системная прошивка были виноваты в проблемах, с которыми вы сталкиваетесь.

bwDraco
источник
Как насчет изогнутого штифта?
Майкл Хэмптон
6
@Michael: изогнутый контакт может привести к сбоям при тестировании отдельных модулей.
Бен Фойгт
4

Я вижу некоторые плохие отзывы о BIOS на этой материнской плате. Я бы начал с проверки обновления BIOS. Никогда не экономьте на материнской плате.

Atoadaso
источник
BIOS актуален. По общему признанию, RAM не находится в «квалифицированном» списке, но у нее есть те же временные характеристики, что и у множества других модулей, перечисленных там.
fdmillion
Я бы посмотрел на замену материнской платы тогда. Это не должно быть вершиной, просто начните с ценового диапазона, который вы можете себе позволить, и найдите те, у которых больше всего отзывов (прочитайте их тоже). Те, у кого самая большая пользовательская база, с большей вероятностью будут иметь долгосрочную поддержку обновлений BIOS и чипсетов.
Atoadaso
Вы проверили, способна ли эта материнская плата обрабатывать 32 ГБ памяти одновременно? Кроме того, на материнской плате можно найти микросхему диспетчера памяти и посмотреть, сколько памяти она сможет правильно обработать.
миль
1

Возможно, что ОЗУ также может быть неисправно, даже если это не так. У меня была недавняя проблема с моим домашним сервером, связанная с фатальным несчастным случаем с небольшим количеством чая со льдом ...

Я прошел весь процесс замены каждой части по отдельности (2 ЦП, mobo, powersupply и 2 банка ОЗУ 16 ГБ (2x8 ГБ)), и все прошло нормально, когда я использовал только один банк ОЗУ с одним ЦП (за исключением 1 процессор, который был тост).

Неважно, какую конфигурацию я использовал, она всегда работала, когда у меня был один ЦП и банк ОЗУ (будь то 16 ГБ или 32 ГБ ОЗУ), но когда я вставлял 2-й ЦП и разделял ОЗУ до 16 ГБ на банк не удалось загрузить сервер.

Только когда я полностью заменил один банк оперативной памяти, он наконец загрузился и работал правильно, и с тех пор.

tl; dr : Как сказал @moab в своем комментарии, вы никогда не сможете сказать наверняка, пока не протестируете каждый компонент в совместимой системе.

Taegost
источник