На днях мы замечаем ужасный жгучий запах, выходящий из серверной комнаты. Короче говоря, он оказался одним из аккумуляторных модулей, которые горели в ИБП, но потребовалось несколько часов, прежде чем мы смогли это выяснить. Основная причина, по которой нам удалось это выяснить, заключается в том, что дисплей ИБП наконец-то показал, что модуль необходимо заменить.
Здесь была проблема: вся комната была наполнена запахом. Тест на нюх был очень трудным, потому что запах проникал во все (не говоря уже о том, что он сделал нас легкомысленными). Мы почти по ошибке сняли наш производственный сервер базы данных, потому что там был самый сильный запах. Жизненно важные показатели были в порядке (температура процессора показала 60 градусов Цельсия, а скорость вращения вентилятора в порядке), но мы не были уверены. Так уж вышло, что сгоревший модуль батареи был примерно такой же высоты, как сервер в стойке, и всего в 3 футах от него. Если бы это была настоящая чрезвычайная ситуация, мы бы с треском провалились.
В действительности шансы на то, что фактическое серверное оборудование перегорает, встречаются довольно редко, и большую часть времени мы будем рассматривать виновника ИБП. Но с несколькими стойками с несколькими единицами оборудования, это может быстро стать игрой в догадки. Как быстро и точно определить, какое оборудование на самом деле горит? Я понимаю, что этот вопрос сильно зависит от переменных среды, таких как размер помещения, вентиляция, местоположение и т. Д., Но любой вклад будет приветствоваться.
Ответы:
Общее мнение, как представляется, заключается в том, что ответ на ваш вопрос состоит из двух частей:
Как мы можем найти источник смешного горящего запаха?
У вас есть «Как», довольно хорошо прибитый:
Вы можете повысить свои шансы на быстрое обнаружение проблемы несколькими способами - улучшение мониторинга часто является самым простым. Некоторые вопросы, чтобы задать:
Когда мы должны устранять неполадки, а не нажимать на большой красный выключатель?
Это более интересный вопрос.
Нажав на большой красный выключатель, вы можете потратить на спешку огромные деньги вашей компании: чистые выпуски агента могут составлять десятки тысяч долларов, а затраты на отключение / восстановление после аварийного отключения питания (EPO, «бросая комнату») ) может быть разрушительным.
Вы не хотите бросать центр обработки данных, потому что конденсатор в источнике питания лопнул и заставил комнату пахнуть.
И наоборот, пожар в серверной комнате может стоить вашей компании данных / оборудования и, что более важно, жизни ваших сотрудников.
Устранение неполадок, связанных с «странным жгучим запахом», никогда не должно иметь приоритет над безопасностью , поэтому важно иметь некоторые четкие правила для устранения неполадок в условиях «предпускового подогрева».
Следующие рекомендации являются моими личными ограничениями, которые я применяю в отсутствие (или в дополнение к) любых других четко определенных процедур / правил - они хорошо мне помогли и могут помочь вам, но они могут так же легко убить меня или уволен завтра, так что применяйте их на свой страх и риск.
Если вы видите дым или огонь, бросьте комнату.
Это должно быть само собой разумеющимся, но давайте все равно скажем: если есть активный огонь (или дым, указывающий на то, что это скоро произойдет), вы покидаете комнату, отключаете питание и разряжаете огонь. система подавления.
Исключения могут существовать (проявлять здравый смысл), но это почти всегда правильное действие.
Если вы продолжаете устранять неполадки, всегда привлекайте хотя бы еще одного человека.
Это по двум причинам. Во-первых, вы не хотите бродить в центре обработки данных, и вдруг у вас поднимется стойка в ряду, по которому вы идете, и никто не знает, что вы там. Во-вторых, другой человек - это ваша проверка в здравом уме при устранении неполадок, а не увольнение из комнаты, и если вы позвоните в «Большой красный выключатель», у вас будет преимущество, если второй человек согласится с решением (помогает избежать аспектов, ограничивающих карьеру) о таком решении, если кто-то подвергает сомнению это позже).
При устранении неполадок соблюдайте меры предосторожности.
Убедитесь, что у вас всегда есть запасной выход (открытый конец ряда и свободный путь к выходу).
Держите кого-то, размещенного в EPO / выпуске подавления огня.
Возьмите с собой огнетушитель (галон или другое чистящее средство, пожалуйста).
Помните правило № 1 выше.
Если сомневаетесь, покиньте комнату . Позаботьтесь о своем дыхании: используйте респиратор или кислородную маску. Это может спасти ваше здоровье в случае химического пожара.
Установите предел и придерживайтесь его.
Точнее, установите два ограничения:
Установленные вами лимиты также можно использовать, чтобы позволить вашей команде начать упорядоченное отключение затронутой области, поэтому, когда вы ДЕЛАЕТЕ питание, вы не разбиваете кучу активных машин, и ваше время восстановления будет намного короче, но помните, что если корректное отключение занимает слишком много времени, возможно, вам придется разрешить сбой нескольким системам во имя безопасности.
Доверяйте своей интуиции
Если вы в любое время беспокоитесь о безопасности, отключите поиск неисправностей и очистите комнату.
Вы можете или не можете бросить комнату, основываясь на чувстве кишки, но разумно перегруппироваться за пределами комнаты в (относительной) безопасности.
Если нет непосредственной опасности, вы можете взять с собой в местное отделение пожарной охраны, прежде чем предпринимать какие-либо радикальные действия, такие как выброс EPO или чистящего средства. (Они могут попросить вас сделать это в любом случае: их задача - защищать людей, а затем имущество, но они, очевидно, являются экспертами в борьбе с пожарами, поэтому вы должны делать то, что они говорят!)
источник
Тепловизионная камера может сделать работу, и позволит вам определить, где перегрев. Подобное устройство позволит вам также определить причину возникновения пожара или возгорания в комнате, заполненной дымом.
источник
Вы не делаете ничего из того, что было сказано. Вы покидаете опасную среду, потому что то, что прокачивается через всю комнату, опасно для вашего здоровья и может действительно испортить ваши легкие. Если в комнате есть резкий запах чего-то горящего, которого вы не можете найти, позвоните по номеру (911 | 112 | 999 | по любому номеру службы экстренной помощи, который соответствует вашей юрисдикции), и пусть пожар (компания | отдел | бригада) разберется, пока они Находится на баллоне с воздухом
Компьютерные комплектующие содержат всевозможные интересные химические вещества, в том числе ртуть , кадмий , свинец и много пластмасс в оболочках. Обратите внимание, что все ссылки, которые я сделал, объясняют, как воздействие низкого уровня может вызвать длительный ущерб или даже быструю смерть. Это среда, которая может быть сразу опасна для жизни и здоровья .
... так что на самом деле, если что-то горит, не тратьте часы вдыхая запахи. Если вы не можете идентифицировать это и немедленно действовать, чтобы сдержать это, уходите.
источник
Если у вас был надлежащий контроль на ИБП (обычно через SNMP), сам аппарат должен был позвонить в вашу систему мониторинга. Если это не так, поговорите с вашим поставщиком об этом. Он либо неисправен, либо ваша система мониторинга не настроена должным образом.
Если что-то активное на самом деле горит, оно должно каким-то образом жаловаться на это или просто быть вне сети, что также должно вызывать тревогу.
Если это что-то вроде реальной шины питания, сгорающей через изоляцию, а не на интеллектуальном PDU, тогда мы вернемся к вашему первоначальному вопросу, а именно: «Как мне найти горящую вещь?» И я думаю, что правильный ответ: «Вступи в EPO и выясни это. Твои рабочие серверы, вероятно, недостаточно важны, чтобы рисковать жизнями».
источник
Это одна из тех ситуаций, когда
не относится, вы должны позвонить профессионалу
Все остальное просто глупо.
источник
Как человек, чья прежняя карьера была электронным, у меня есть опыт работы с «жгучими запахами», которые не были пожарами. Это не редкость.
Я бы не закрыл центр обработки данных для запаха. Дым - другое дело, что-то действительно горит (обычно, но танталовый конденсатор размером с горошину может также заполнить комнату дымом). Удивительно, как сильно может пахнуть жареный компонент в блоке питания.
Термометр TIC или ИК (полезный инструмент и намного дешевле, чем TIC) не обязательно показывает это, так как компонент вообще не выделяет много тепла и находится внутри корпуса. Но проверьте, не работают ли устройства, используйте инструменты мониторинга. При таком запахе в 95% случаев это будет источник питания, влияющий на производительность всего устройства.
источник
Мне нравятся ответы по ИК-изображениям или термометрам, но, возможно, также поможет настоящий «детектор запаха». После всего, что вызвало твою осторожность, был запах. Дым, тепло, ИК и т. Д. - все это суррогаты.
Что - то вроде этого: . Я лично никогда не использовал их и даже не видел, чтобы они использовались в центре обработки данных. Но по крайней мере теоретически это должен быть аккуратный инструмент. Если у вас есть деньги, чтобы потратить на эту штуковину, то есть.
http://www.sca-shinyei.com/odormeter или http://www.intopsys.com/products/cyranose.html?gclid=CNXXzOrLs7YCFUws6wodViYApQ
Это дает вам силу запаха, а также классификацию. Так что возвращение к запаху должно быть возможным. Дьявол в деталях, конечно. Насколько он чувствителен, маскирует ложный фоновый запах и т. Д.
Одно преимущество по сравнению с измерениями, основанными исключительно на температуре, состоит в том, что часто запах возникает в гораздо более ранней точке или пороге. Или, если перегретый компонент скрыт корпусом / скрытой проводкой и т. Д., Легче обнаружить выходящие молекулы, чем горячую точку прямой видимости.
Другая ситуация - запах, не связанный с жарой. У нас была утечка в контуре охлаждения, и запахи охлаждающей жидкости тоже были своеобразными. Я даже не буду вдаваться в древний случай смерти грызуна в протоках. :)
Я был удивлен, насколько чувствительны эти датчики. По-видимому, H2S / меркаптаны и т. Д. (Обычные преступники) обнаруживаются при уровнях ниже ppm.
источник