Почему 5 разных iMac разработали поврежденные разделы OS X, когда физические диски в порядке?

9

Я работаю в местном школьном округе, и у нас возникли проблемы с нашей мультимедийной лабораторией iMac. За последние девять месяцев 5 из 22 компьютеров iMac пострадали от повреждения файловой системы. Единственным выходом для этих машин было полное уничтожение раздела OS X и запуск заново (с соответствующим восстановлением из Time Machine).

Вот список, почему я знаю, что это повреждение файловой системы:

  • IMac не будет загружать OS X. Я видел его остановку на «пульсирующем», индикаторе выполнения или просто логотипе Apple.

  • Монтирование диска iMac в режиме Target Disk Mode (очень нравится эта функция) выполняется успешно, но только для раздела Bootcamp. Раздел OS X не удается смонтировать.

  • Проверка диска показывает, что раздел OS X необходимо исправить (я видел недопустимые записи одного брата, детей-сирот и т. Д.). Попытка восстановить диск не удалась. Эта последняя попытка (только вчера) сказала, что деревья B каталога не могли быть восстановлены. Я должен был сделать более полные записи о том, что было сказано каждый раз, но каждый раз до последнего я предполагал, что это было странное событие типа «один на миллион». Случайность

  • Попытка отремонтировать или восстановить диски с помощью Drive Genius 3 также не удалась. До сих пор 98% файлов пользователя можно было восстановить с помощью Data Rescue 3 Физический жесткий диск, похоже, не дает сбоя (при извлечении файлов с диска не происходит зависание или «пляжный мяч»). ", диск не появляется и не исчезает в Дисковой утилите, Finder остается отзывчивым и т. д.)

  • Обычно я записываю это в серию плохих дисков. Так случилось, что это несчастный парень, который приобрел iMacs, не так ли? Здесь вещи начинают становиться интересными. Представляю вам список странностей:

  • Приводы проверяются как хорошие через SMART

  • ОЗУ проверяется
  • После удаления и повторного создания раздела (и переустановки OS X) все проблемы исчезают.
  • Коррупция не случилась с одним и тем же Mac дважды
  • Bootcamp устанавливается на тот же диск и функционирует до, после и во время повреждения на стороне Mac.
  • В разделе Bootcamp такой проблемы не было ни на одном из компьютеров iMac.

Также, чтобы исключить очевидное:

  • Там не было отключений или приливов

  • Мы серьезно сомневаемся в вирусе, поскольку неисправности появляются где-то от одновременного (две машины вышли из строя одновременно около месяца назад) до нескольких месяцев друг от друга. Кроме того, документы пользователя восстанавливаются после переформатирования, поэтому можно предположить, что если бы это была вредоносная программа, Mac продолжал бы отказывать снова и снова.

  • Машины были в зоне с контролируемым климатом

  • Это не был тот же пользователь пострадал

  • Иногда проблема возникает после неизбежного жесткого отключения (что происходит нечасто. Эти машины не слишком неправильно отключаются. Только то, что вы ожидаете от Mac Lab, работающей с мультимедиа пять дней в неделю), в других случаях она полностью выходит из строя. -Синий

Часто используемое программное обеспечение включает в себя:

  • Iphoto
  • IDVD
  • IMOVIE
  • Сафари

Машины также загружены Parallels 5, которая загружает раздел Bootcamp в виртуальную машину. Parallels настраивался с помощью стандартного мастера, без каких-либо нестандартных настроек или взломов.

И последнее, но не менее важное:

  • iMac 10,1 (21,5 дюйма)
  • Стоковые диски
  • OS X Snow Leopard (последние обновления)
  • Фондовая память
  • Присоединен к нашей инфраструктуре Active Directory
  • Файловая система HFS + (без учета регистра, по умолчанию для OS X Snow Leopard)
  • Нет необычного обслуживания диска. программы. Drive Genius был загружен вчера днем ​​(ПОСЛЕ восстановления после последней ошибки) для запуска проверки на всех iMac, но не был установлен ранее. Все Маки, как те, которые потерпели неудачу в прошлом, так и те, которые никогда не подводили, прошли с летающими цветами.

TL; DR: раздел OS X поврежден на пяти разных iMac, но с физическими дисками все в порядке. ПОЧЕМУ!?!?!

EightQuarterBit
источник
Off Topic: 8¼b: Вы можете использовать Shift + Enter, чтобы вводить разрывы строк в полях комментариев. Я также слышал, что существуют плагины для браузера (usercripts?), Которые меняют роль ввода и сдвига-ввода, поэтому ввод вставит разрыв строки, а сдвиг-ввод предоставит комментарий.
Джейсон Салаз
+1 хорошо задокументированный вопрос. Задумывались ли вы, что это может быть актом студентов?
Как iMac 10,1 сопоставляется с iMac {early | mid | late} 20YX для облегчения анализа аппаратной части? Если вы замените #desktopcomputers одним из серийных номеров, support.apple.com/manuals/#desktopcomputers получит описательное имя для ваших iMac.
bmike

Ответы:

6

HFS Plus (HFS +) - это хрупкая и немного устаревшая файловая система. Если вы заглянете в Google, вы найдете много сообщений о повреждении файловой системы.

Перезагрузка без размонтирования файловой системы - лучший способ ее повредить. Это происходит, когда Mac зависает по какой-то причине (в моем случае это видеокарта nvidia) или происходит сбой питания.

Вот несколько советов, которые IMHO должны снизить вероятность повреждения файловой системы:

  1. Когда система зависнет, попробуйте перезагрузиться из ssh. Когда графическая подсистема моего Mac зависает, она все еще доступна через SSH - попробуйте открыть ssh-соединение из вашей сети и перезагрузить его. Вы можете использовать Apple Remote Desktop (€ 62) для этой задачи. Вы должны сначала включить ssh доступ.

  2. Делать diskutil verifyVolume /периодически. Да, даже если HFS + является журнализированной файловой системой, возможно повреждение. Вы можете использовать Apple Remote Desktop, чтобы запустить его на всех компьютерах класса одновременно.

  3. Используйте несколько томов. Использование нескольких томов должно снизить вероятность коррупции. Разделение /от /Users/должно облегчить восстановление (или пользователи будут повреждены). Обратите внимание, что это, вероятно, может осложнить ситуацию с Bootcamp.

  4. Смонтируйте раздел (ы) с опциями, которые уменьшают запись. Монтирование разделов с noatimeопцией должно уменьшить запись на нем. По умолчанию каждый раз, когда к файлу обращаются, его метка времени доступа "затрагивается".

  5. Убедитесь, что нет попыток смонтировать раздел HFS + из других ОС. Возможно ли, что кто-то запускает дистрибутив linux с usb / dvd и монтирует его /в режиме rw или играет с настройками журнала?

Надеюсь, мой ответ полезен.

PS: коррупция обычно постепенная, а не внезапная. Существует вероятность того, что что-то конкретное вызывает это, программное обеспечение или рабочий процесс. Я думаю о Parallels 5, но он должен повредить том загрузочного лагеря, а не MacOS. Поиск по их КБ не выявил ничего полезного.

PPS: он хрупок, потому что у него нет реальной системы для исправления повреждения в файле. Журнал записей переносит и пытается повторно скопировать данные, чтобы вернуть файловую систему в согласованное состояние, но если потерянный файл жизненно важен (например, фактические данные о структуре файловой системы), то регресса нет. Фактически, поскольку файл каталога (который содержит всю информацию о логических данных) хранится в виде файла, если он поврежден в определенных местах, вся ваша файловая система становится бесполезным мусором или частично очищается от мусора в случае его повреждения и происходит воспроизведение журнала, что приводит к реструктуризации файловой системы способом, который не согласуется с данными (например, файлы a и b имеют размер 1 МБ и 2 МБ соответственно, но при воспроизведении они изменяются на 2 МБ и 1 МБ, что приводит к половине содержимого Б внутри А).

mspasov
источник
2
Любая файловая система будет иметь проблемы с учетом обстоятельств. Но "Хрупкий" и "Немного устаревший"? В самом деле? Немного устаревшее в моем сознании не ведение журнала. И это не относится к HFS +.
Джейсон Салаз
Если бы файловая система была хрупкой, разве не у всех маков были бы проблемы? Установки с сотнями компьютеров Mac, которые проверяют наличие внезапных отключений питания и непрерывный график безопасных загрузок, исправлений файловой системы устранят подобные вещи в зародыше.
bmike
+1 для HFS Plus (HFS +) - хрупкая файловая система. Я испытал этот точный сценарий с двумя жесткими дисками. Windows не затронута, hfs + не может быть восстановлена. Воссоздание раздела и переустановка OS X работает нормально
Клинт Хорошо
2

Вещи, которые могли бы сделать это с моей головы ...

Вы сказали, что у вас не было скачков напряжения или отключений. Как вы это подтверждаете? У нас была классная комната, где блоки питания ПК, казалось, работали беспорядочно. Нам нужно было, чтобы обслуживающий персонал подключил контрольный измеритель к цепи и обнаружил, что розетка имеет огромные скачки напряжения.

Память не установлена ​​должным образом и портит данные.

Кабели привода ослаблены.

маргинальные жесткие диски, которые имеют плохой набор секторов, но не настолько плохой, чтобы вызывать оповещения или сканировать плохие сектора.

Что-то на стороне Windows с помощью bootcamp модифицирует диск так, как ему не нравится. Защита от копирования? Драйв утилиты?

Вы сказали, что в лаборатории. Что бегут студенты? Вы контролируете или блокируете то, что может быть выполнено, что могло бы делать это?

Вы сказали, что это кажется случайным, нет двух машин, имеющих это подряд. Это привело бы меня к подозрению, что причиной является либо ученик, либо группа учеников, или в лаборатории возникает случайная проблема с питанием. Есть ли способ отследить, кто в последний раз пользовался машинами, чтобы выяснить, действительно ли эта проблема волшебным образом повторяет одного из ваших пользователей?

Барт Сильверстрим
источник
Мы не использовали никакого оборудования для контроля мощности, нет. Просто отошли от учителей в старшей школе. редактировать GAH! Примечание для себя: клавиша ввода не создает новую строку в режиме комментариев.
EightQuarterBit
Могу попробовать это. Также не было никаких признаков такой проблемы в классе, но ИТ-директор был специалистом по электротехнике в колледже и попросил их проверить это. Он сделал математику и обнаружил, что у них были периодические всплески тысяч вольт ...
Барт Сильверстрим
Мы провели тест RAM на каждой машине, у которой была эта проблема, они все прошли. Можно подумать, что если бы кабели привода были ослаблены, проблема могла бы проявиться на одной и той же машине несколько раз на одном и том же iMac, а не на нескольких iMac. Кроме того, если это был свободный кабель привода, странно, что этого не произошло с разделами Bootcamp.
EightQuarterBit
Возможно, что диски действительно маргинальные, но мне трудно купить этот. Я проверил, перепроверил и трижды проверил эти диски. Я использовал Дисковую утилиту Apple и Drive Genius 3 для сканирования соплей на дисках. Кроме того, я никогда не видел маргинального диска, не имея хотя бы нескольких индикаторов в SMART. Я видел «плохие» жесткие диски, которые прошли SMART, но они все еще имели большое количество перемещенных секторов и все такое при использовании утилиты SMART. Эти диски? Нада.
EightQuarterBit
Я думал о винде с разделом Mac, и я до сих пор не исключил. Однако тот факт, что драйвер bootcamp от Apple будет монтировать разделы HFS + только для чтения, похоже, исключает это. Мы не используем дисковые инструменты или утилиты типа «глубокого замораживания» на стороне Windows.
EightQuarterBit
1

Рассматривали ли вы периодическую проверку машин? Вы можете легко планировать еженедельные проверки fsck (пока не выясните, почему происходит коррупция), а затем ежемесячно следить за событиями.

При использовании журнализированной файловой системы macs требует некоторого повторного плохого обращения, чтобы ухудшиться до такой степени, что он не загружается. Даже плохое программное обеспечение не пишет на системную сторону загрузки, поэтому я подозреваю, что что-то явно не так. На маках, которые корректно завершают работу и привлекают внимание всякий раз, когда исправляются незначительные ошибки файловой системы (всякий раз, когда mac перезапускается и fsck не работает в режиме preen, это признак проблемы на горизонте).

При развертывании 25 компьютеров вы легко можете потратить некоторое время на проактивную проверку файловой системы и обнаружение неполадок с отключением, настроив сервер системного журнала или другую централизованную систему аудита.

bmike
источник
0

Я бы рассмотрел студенческую деятельность. Если вы используете bootcamp и OS X, то держу пари, что студенты рушат сторону Mac для запуска boot camp, потому что они не терпеливы. Это также может быть в случае, если присутствует блокировка экрана.

Я предлагаю:

  1. Снимите учебный лагерь. Вместо этого запустите виртуальную машину под Parallels или Virtual Box. (Я обнаружил, что Windows XP в VirtualBox работает довольно хорошо.) Настройте его так, чтобы виртуальная машина была неизменной и хранилась локально в старом разделе bootcamp. Это предотвратит шумиху детей с установкой Windows. Перенаправьте их домашний каталог, чтобы прочитать их домашний каталог Mac на вашем сервере. (Это PITA, чтобы настроить в первый раз, так как он включает в себя около миллиона регидитов)

  2. Установите некоторую форму мониторинга входа в систему, чтобы вы знали, какие студенты использовали какие машины. Это имеет то преимущество, что вы можете заметить, что один и тот же ребенок входит в систему на нескольких машинах, обычно делая это в качестве одолжения для кого-то, кто забанен. Я установил, что когда один и тот же логин был на двух машинах, обе машины были перезагружены.

Sherwood
источник