Неисправность памяти может привести к незарегистрированным ошибкам

2

Я иногда вижу эти ошибки памяти: «Неисправимая ошибка памяти была ранее обнаружена в RISER DIMM X».

Это произошло только дважды за последние полгода. Когда это происходит, система падает, и сообщение появляется при следующей загрузке. Ошибка затем исчезает - она ​​не кажется повторяемой.

Нет сомнений, что что-то не так. Поиск в сети показывает, что виновата либо моя память, либо материнская плата. Но учитывая непостоянную природу проблемы, очень трудно понять, что это такое, и повлияет ли это на мое использование.

Вопрос: Если система не дает сбоя, возможно ли, что мои программы могут давать неправильные результаты? Например, если я запускаю базу данных или вычислительную программу, возможно ли, что иногда программы могут выдавать ошибочные результаты без сбоев системы, и я никогда не узнаю об этом?

Если это так, то, что проблема носит прерывистый характер, вызывает особую тревогу, поскольку я не знаю, когда программа дает правильные результаты, а когда - нет.

вздор
источник
Вы запустили несколько прогонов memtestx86?
Ramhound
Нет, я сделаю это и посмотрю, что получится. Спасибо за предложение.
Тош

Ответы:

2

Да, это очень возможно, хотя вряд ли система будет регулярно аварийно завершать работу с постоянной ошибкой памяти. Хотя управление памятью носит детерминистический характер, использование вашего компьютера - нет. ;) Таким образом, программы (и их рабочий набор) будут появляться в разных местах памяти почти каждый раз, когда вы их запускаете.

Неисправная память может (и будет) также приводить к повреждению диска, когда данные, помеченные для передачи DMA на диск, повреждены в памяти. Это, на мой взгляд, намного опаснее, потому что вы можете не замечать эти ошибки годами, пока вам не понадобятся данные и вы обнаружите, что они повреждены.

Даниэль Б
источник
Оказывается, у меня есть ECC-память. Является ли этот тип памяти менее подверженным ошибкам вывода программ и повреждению диска?
Тош
1
Да, конечно. Обычная память ECC может обнаруживать до двух ошибок на 64-битное слово и исправлять одну ошибку на 64-битное слово. Это может означать, что большинство ошибок исправляются для вас автоматически. Я не знаю, где вы найдете информацию об этом, потому что у меня никогда не было системы, оборудованной ECC.
Даниэль Б