Плохие диски на древнем сервере

12

У меня есть сервер Netware 3.12 эпохи 1998 года, который управляет всем в нашем кампусе: главная книга, закупки, начисление заработной платы, информация об учениках, оценки, вы называете это. Сервер имеет RAID-контроллер Adaptec с двумя томами:

  1. RAID 1, 2 17 ГБ scsi диска, Seagate ST318417W
  2. RAID 5, 3 4 ГБ scsi диска, 2 Seagate ST34573W и 1 ST34572W.

В настоящее время мы находимся на ранней стадии проекта по замене этой системы, но вы не просто переходите на новую систему, подобную этой, и поэтому мне нужно, чтобы этот сервер работал как минимум до ноября 2011 года.

На этой неделе у нас вышел не один, а два жестких диска. К счастью, они из разных томов, и мы можем продолжать работать на данный момент, но, учитывая близкий характер этих сбоев, у меня есть серьезные сомнения, что мне удастся избежать катастрофического сбоя этого сервера через ноябрьскую цель, как и без восстановление избыточности RAID - это повлечет за собой только еще один сбой диска, и я полностью облажался.

Нам достаточно повезло, что на обоих дисках лежат «запасные части» с точным соответствием, но запчасти находятся в неизвестном состоянии. Я попытался поменять их, но RAID-контроллер не достаточно умен, чтобы справиться с этим, и система перестала загружаться.

Что касается самого контроллера RAID, есть утилита, в которую я могу войти во время POST с помощью сочетания клавиш Ctrl-A, но я не могу сделать много полезного оттуда. Чтобы фактически управлять томами, я должен сначала загрузиться в Netware, после чего я могу использовать его CI/O Array Management Software Version 2.0для просмотра информации о томах. Я подозреваю, что нормальным способом управления вещами является загрузка с специальной дискеты с программным обеспечением контроллера, но эта дискета давно исчезла.

Рассматривая параметры в программном обеспечении RAID, я думаю, что единственный поддерживаемый способ замены диска в существующем томе RAID - это физическое добавление диска, загрузка и настройка его в качестве «запасного» для тома, принудительное использование тома. запасной для замены существующего загрузочного диска (и на данный момент я только догадываюсь) так, чтобы резервный диск стал резервным, восстановите том, удалите резервный из тома, а затем выключите и извлеките диск. Затем начните все сначала для другого неисправного диска. Все это приводит к большим простоям, если предположить, что я могу даже заставить это работать, и что мои запчасти хороши.

Что касается поиска надежных запчастей, я не имею ни малейшего понятия, с чего бы начать искать новый 4-гигабайтный SCSI-накопитель или даже какую именно SCSI-систему я ищу, так как она прошла через несколько разных итераций с течением времени.

Другой вариант - перенести это на виртуальную машину (hyper-v), но все предыдущие попытки, которые мы предприняли в этой области, не дали большого результата. Когда эта машина была установлена, я только что закончил среднюю школу, и поэтому она требует более низкого уровня знаний о Netware и DOS, чем я когда-либо разрабатывал, или если я с тех пор забыл (я тоже не совсем неофит).

Частично моя проблема в том, что это сервер с высокой нагрузкой, и его отключение на несколько дней, чтобы понять, что не будет хорошо работать.

Что касается вопроса, я ищу что-нибудь, что могло бы быть полезным в этой ситуации: рекомендация о том, где найти хорошие запчасти этой эпохи, личный опыт восстановления томов RAID с использованием аналогичного контроллера или создания Hyper-V VM из старый сервер Netware, линия на дискете с лучшим программным обеспечением для RAID-контроллера, рекомендация хорошего консультанта Novell в Небраске, который сможет все исправить, еще один вариант, который я еще не рассматривал, и т. д.

Обновление:
для резервных копий у нас есть хорошие (недавно проверенные с помощью восстановления) только резервные копии данных - ничего для программного обеспечения, которое действительно работает.

Обновление 2:
просто отчет о проделанной работе, на котором у меня в настоящий момент установлена ​​работающая Netware 3.12 в VMWare Virtual Server 2.0, во многом благодаря руководству, которое я нашел здесь:
http://cerbulescubogdan.blogspot.com/2010/11/novell-netware-312 -он-vmware.html

Следующие шаги - это подготовка пустых томов NetWare для сопоставления с дополнительными томами на моем существующем сервере, создание дампа всего на томе C: \ и томах Netware на моем существующем сервере, и выяснение из этой информации, какие модули нужно добавить в Netware, установка моих лицензий (у нас все еще есть этот диск, если он годится) и перенос данных.

У меня есть разрешение отключить сервер на неделю после первого года (к сожалению, не раньше), поэтому, кроме создания пустых томов, остальная часть работы должна будет ждать до тех пор.

Последнее обновление (5 января 2011 г.):
я смог заставить запасные части работать в обоих рейдовых массивах без потери данных на этой неделе. Оба теперь перечислены контроллером как «НЕИСПРАВНОСТЬ» (да!). Я также смог использовать результаты моего последнего обновления, и теперь у меня есть функциональный «запасной» сервер в VMWare Server 2.0. Запасной может работать и использовать наше программное обеспечение erp, но я не могу запустить его в производство, потому что я не могу (пока) печатать из этой коробки (и я понятия не имею, почему). Тем не менее, эта виртуальная машина будет работать в крайнем случае, если у меня нет другого выбора, и между ней и отремонтированными RAID-массивами мне комфортно жить в такой ситуации, пока я не смогу испортить машину в ноябре.

Эпилог (16 января 2012 г.):
проект по замене этого сервера на новую систему заработал, как и планировалось. Ура больше нет netware! Всем привет SQL Server! Король мертв. Да здравствует король!

Мы по-прежнему планируем поддерживать работу старого сервера еще некоторое время, пока в августе не завершится аудит после финансового года. Но если между тем и сейчас произойдет сбой, никто не будет жаловаться слишком сильно.

Джоэл Коэль
источник
1
Какой вопрос?
andyhky
Смотрите последний абзац
Джоэл Коэль
2
Как и другие, я потерял интерес задолго до того, как достиг вопроса. Возможно, вы захотите либо переформатировать все это, чтобы поставить вопрос раньше, либо сократить его.
Джон Гарденье
2
Я хочу представить это в перспективе (что вы, возможно, уже знаете): ваша ВСЯ операция основана на одной 12-летней машине, которую вы не можете заменить в течение целого года. У тебя проблема.
Джефф Ферланд
2
Спасибо за обновление вашего проекта. Я рад слышать, что ваша миграция прошла успешно.
Морская звезда

Ответы:

12

Получайте (и продолжайте получать, ежедневно или чаще) хорошие резервные копии общих файловых данных сейчас . Если вы потеряете машину, вы, вероятно, не сможете найти необходимые дискеты (да), чтобы восстановить ее. Получить копию раздела DOS, с которого загружается Netware, если это возможно, тоже.

Это похоже на карту RAID Adaptec AAA-131 (или что-то из той эпохи). Если я прав, вы не найдете более совершенное программное обеспечение для управления, потому что оно не существует (см. Http://www.adaptec.com/en-us/downloads/novell_netware/novell_netware/productid=aaa-131&dn=aaa-131 .html для последних доступных версий). Я использовал много этих карт «назад в день», и они работали хорошо.

Если это AAA-131, будьте предельно осторожны при игре с его конфигурацией . Невозможно настроить RAID-массив без очистки дисков на этих картах. Это означает, например, что если вы снимите коробку и подключите несколько тестовых дисков и, скажем, очистите конфигурацию и создадите на них RAID-массив, то при повторном подключении «производственных» дисков использовать их будет невозможно. без карты, форматирующей их сначала. Да. Это так плохо.

Novell Netware будет работать в гипервизорах VMware. Я бы рекомендовал заключить контракт с кем-то, кто имеет приличный опыт работы с Novell Netware (здесь есть люди - я смотрю на вас, Sysadmin1138 - у которых он есть), чтобы помочь вам перенести содержимое сервера в виртуальную среду, где По крайней мере, вы можете продолжать в том же духе.

Если ваши клиентские компьютеры современные и на них установлен сетевой клиент Microsoft, вы можете обнаружить, что миграция на компьютер под управлением Windows Server на самом деле будет быстрой и простой. Создайте на компьютере Windows Server то же имя, что и на сервере Netware, откройте структуру общих каталогов с тем же соглашением об именах UNC, что и на компьютере Netware, скопируйте все файлы и продублируйте разрешения на конечном компьютере (вручную). Это может быть не так уж сложно сделать, и вы могли бы заранее «подготовить» миграцию в тестовой лаборатории и протестировать с ней некоторых клиентов, чтобы решить, что нужно изменить с точки зрения сценария / пользовательской среды.

Вы, вероятно, можете получить некоторое запасное оборудование от eBay. Однако все, что вы купите в этом винтаже, тоже будет иметь проблемы с надежностью.

Если бы я был на вашем месте, я бы нашел кого-то хорошего в работе с Windows Server, чтобы СЕЙЧАС помочь вам перейти от этого окна . Вероятно, руководство может потратить некоторое время на то, чтобы потерять все содержимое ящика Netware практически в любое время. Коробка для замены не потребует огромных мощностей (учитывая то, что вы заменяете), поэтому лицензирование программного обеспечения и резервное копирование станут вашими самыми большими затратами. Связанные с клиентом проблемы миграции могут быть сведены к минимуму с помощью консультанта, который хорошо разбирается в сценариях и может спланировать детали изменения настроек, связанных с клиентом, посредством сценариев входа и запуска.

Эван Андерсон
источник
Программное обеспечение для управления кампусом, которое мы запускаем на этом компьютере, требует установки каталога Novell для настройки безопасности, в противном случае я бы использовал только AD в одно мгновение. Я буду помнить, что не слишком много играю с RAID-контроллером.
Джоэл Коэль
4
@ Джоэл Коэль: Это отстой. Тогда виртуализируйте его как можно быстрее. Этот старый RAID-контроллер обеспечит BIOS Int 13, который позволит инструментам для создания образов дисков DOS (например, GHOST for DOS) работать должным образом. Я бы получил образ сектора для всех секторов Netware, а затем попросил кого-нибудь помочь вам перенести их на виртуальные диски для гипервизора по вашему выбору.
Эван Андерсон
Работаю над ответом сейчас.
sysadmin1138
10

Я знаю, потому что я сделал это (Привет Эван), что у VMWare есть приличная поддержка NetWare. Даже для действительно старых вещей (что вы используете). NetWare этого старинного NOOP загружает ЦП в режиме ожидания вместо того, чтобы ОСТАНОВИТЬ его, поэтому любой ЦП, указанный в ВМ, будет привязан. Это то, для чего предназначены инструменты VMWare, они заставляют его этого не делать. VMWare существует с 90-х годов (и даже несколько лет имел стенд на BrainShare), и ему приходилось это делать, поэтому у них есть поддержка. Виртуализация Microsoft настолько нова, что им никогда не приходилось виртуализировать NetWare, поэтому она там не работает.

Если этот сервер столь же критичен, как вы говорите, переход на некоторые лицензии VMWare должен быть легкой продажей. Как минимум, весна для лицензии на рабочую станцию ​​VMWare, которая, по крайней мере, приведет этот сервер в виртуальную среду. VMWare Server является бесплатным (я считаю), если вам действительно нужно. После того, как эта работа выполнена, вы можете рассмотреть возможность ее переноса на что-то вроде ESXi, пока она не будет заменена более формально.

Существуют и другие варианты, в зависимости от ваших навыков работы с Linux. Novell потратила довольно много времени на то, чтобы заставить Xen (не KVM, Xen, хотя оба используют qemu) поддерживать NetWare. Вероятно, он будет работать с NW3.12, хотя вам необходимо убедиться, что вы используете режим полной виртуализации , а не паравиртуализации.

Этот сервер достаточно новый, на нем должен быть привод CD-ROM, что, вероятно, будет вашим спасением. Как только вы сделаете резервную копию, загрузите ее на ISO-Linux, если хотите. Он не сможет получить данные, но должен увидеть жесткий диск. На этом этапе сделайте полную ddкопию обоих томов в другом месте вашей сети. Эти образы дисков могут использоваться qemu непосредственно в качестве виртуальных дисков.

Есть способы конвертировать сгенерированные dd образы в VMware VMDK, но я сам ими не пользовался. Google их, они там.

sysadmin1138
источник
Некоторые старые RAID-карты Adaptec не поддерживаются Linux. OP может зависнуть с помощью утилиты обработки изображений DOS (чтобы воспользоваться преимуществами BIOS Int13 карты). Хорошая утилита dd-to-vmdk, которую я использовал: sourceforge.net/projects/raw2vmdk
Эван Андерсон,
У него есть CD-привод, но оказывается, что он не функционировал :(
Джоэл Коэль
5

Это не очень полезно с точки зрения вашего вопроса (честно говоря, у вас уже есть запасные части, и единственное полезное предложение, которое у меня есть для поиска винтажных дисков, это « Передать номера моделей накопителей в Google Shopping »), но прежде чем вы коснетесь чего-либо еще. вы должны действительно MAKE чертовски уверен у вас есть хороший BACKUP И МОЖЕТ уСПЕШНО ВОССТАНОВЛЕНИЕ ЕГО НОВАЯ МАШИНА В работоспособном состоянии .

Если эта машина настолько критична, насколько это звучит из вашего описания, это должно быть вашим нулевым приоритетом прямо сейчас. Если вы не выполнили успешное тестирование восстановления резервных копий в течение некоторого времени, вы должны предположить, что они бесполезны, и вам нужно убедиться, что вы действительно можете восстановить, если эта машина испортит свой последний ресурс и умрет от вас.
Если на вас падает другой диск, и у вас нет резервных копий, которые можно использовать, это в значительной степени игра в мяч. Вы немедленно перейдете на новую систему, независимо от того, готовы вы или нет.

Просто мои $ 3,50.

voretaq7
источник
Согласовано. Проверьте свои способности восстановления. # 1 Первое. Без способа восстановления вы можете не иметь резервных копий. (Был там, сделал это. Это отстой. Не делай этого.)
minamhere
2

Другие уже обращались к резервным копиям и т. Д., Поэтому я не буду повторять это. Есть несколько вещей, которые вы можете сделать, чтобы улучшить ваши шансы на продолжение функционирования системы.

Начните с инвестиций в действительно качественный линейный фильтр и разместите его между ИБП и сервером. Эти старые накопители теперь будут довольно обидчивы из-за скачков напряжения, пиков и даже довольно небольших колебаний поставок.

Из вашего обновления я вижу, что вы уже установили запасные диски, но я бы порекомендовал: прежде чем пытаться использовать запасные диски на сервере, установите их на другую машину и избавьтесь от них с помощью программного обеспечения для записи или, если Вы не можете получить это, непрерывные циклы тестирования, используя обычное программное обеспечение для тестирования дисков. Сохраняйте это как минимум несколько дней, прежде чем объявлять диски надежными. Старые накопители, которые были в хранилище, общеизвестно ненадежны и могут выйти из строя одним махом.

Джон Гарденье
источник
1

Отличные предложения выше. Попробуйте также - на запасном современном оборудовании попробуйте восстановить всю систему из последней полной резервной копии. Убедитесь, что запасной компьютер отсутствует в сети.

Боюсь, ты это сказал? У вас нет резервных копий и / или процедуры восстановления? Ну, теперь ты знаешь, над чем работаешь на следующую неделю?

mfinni
источник
1

Отвечая только дважды / трижды / четыре раза, рекомендуем делать резервные копии каждый день, пока вы не найдете решение. Если вы не можете легко заменить неисправные диски, ваше единственное решение - перейти на новые диски. Независимо от того, означает ли это создание нового сервера или медленную миграцию существующего сервера для использования новых дисков на существующем сервере, это единственный вариант.

У нас было 2 из 3 жестких дисков за одну ночь в 7-летнем массиве RAID 5. Наши резервные копии были сильно устарели. Спустя 8 дней и 17 000 долларов США фирма по восстановлению данных смогла восстановить весь наш сервер Exchange, но никто не обрадовался. (Кроме меня, потому что я должен был делать резервные копии каждый день. На оборудование, которое я просил, но никто не покупал для меня, но этот факт был потерян для всех остальных ...)

Из этого следует, что клиент немедленно одобрил мой 6-месячный запрос на покупку оборудования для замены. Но, черт возьми, это были чрезвычайно напряженные 8 дней. Сделайте себе одолжение, сделайте резервную копию сейчас и начните работать на случай непредвиденных обстоятельств, «приступайте к работе на любом оборудовании, которое вы можете найти в своем офисе» сейчас.

minamhere
источник