Ключевые вещи для поиска в центре обработки данных

34

Я пытаюсь составить простой контрольный список, чтобы определить качество центра обработки данных ... где и что мне следует искать и как я могу определить, что говорят владельцы (например, «наш ИБП поддерживает работу центра обработки данных в течение 100 дней без власть ") это правда или нет? Каковы типичные признаки или хорошие или плохие центры обработки данных?

AX1
источник

Ответы:

43

Вот список вопросов, которые я задал для себя в прошлый раз, когда я ходил по магазинам в центре обработки данных:

  • Объясните, что потребуется для спринклеров на нашем оборудовании.
  • Что будут делать удаленные руки? Например, установить жесткие диски, вращать ленты ...
  • Доступны ли ваши дистанционные руки 24/7/365, среднее время ожидания, чтобы они могли добраться до клетки после подачи билета (как вводятся билеты?)?
  • Вы на нескольких сетках?
  • У вас есть охлаждение фальшпола?
  • Сколько центров обработки данных вы работаете, кроме этого?
  • Как долго центр обработки данных может работать от резервного источника питания?
  • Можно ли доставить оборудование напрямую в центр обработки данных?
  • Есть ли док для доставки и бесплатная, закрытая и доступная парковка?
  • Если в центр обработки данных приходит поставщик, нужно ли нам его сопровождать?
  • Какая температура окружающей среды и влажность поддерживается?
  • Сколько существует вариантов ISP?
  • Кто-нибудь из ваших клиентов когда-либо терял власть в течение какого-то времени в истории центра обработки данных?
  • Как долго этот центр обработки данных работает?
  • Какие средства контроля доступа имеются как для пола, так и для оборудования?

Если вы посетите несколько из них и зададите эти вопросы между ценой, впечатлениями от посещения и их ответами, вероятно, будет ясно, какой вы хотите. Убедитесь, что вы всегда посещаете их и посещаете большое их количество.

Кайл Брандт
источник
2
Отлично сработано. +1 тебе.
gWaldo
3
Я также хотел бы спросить о контроле доступа к полу и вашему оборудованию.
Скотт Пак
Отличный список !! Я бы добавил: "У вас есть здание?" Кроме того, если у них есть разбрызгиватели, уходите!
Джейк Робинсон
@JakeRobinson Спринклеры необходимы по пожарному коду , даже во многих центрах обработки данных. Когда вы видите спринклеры, спросите, являются ли они спринклерами для сухих труб .
sysadmin1138
3
@JakeRobinson Новый DC, в который я переехал в 2003 году, имел и FM200, и разбрызгиватели. Маршалы огня были очень тверды, что там должны были быть разбрызгиватели там. Если FM200 может погасить огонь, отлично. Но если этого не произойдет (выброс ИБП нарушит воздушную дамбу FM200, чтобы O2 мог попасть после свалки), много воды спасет здание. Правильная система сухих труб означает, что, если спринклерная головка натолкнется, постоянный ток не затопит.
sysadmin1138
6

Кайл довольно хорошо это понял, но вот пара моментов:

Физическая безопасность огромна. Чтобы попасть внутрь, нужно принять почти акт Конгресса (Парламент, вставьте здесь медленный бюрократический институт).

Он должен иметь подавление огня галонами, а не разбрызгиватели; Серверы не должны быть влажными. (Местные правила пожаротушения могут иметь приоритет ...)

Узнайте, каковы их предпочтительные поставщики серверов. Если это не по очень конкретной причине (например, запуск центра обработки данных, подобного Google), это должны быть серверы известных брендов. (Dell, HP, IBM, Sun, Apple и т. Д.) Если они говорят «белый ящик» или бренд, который вы не узнаете, бегите. Обратите внимание, что есть некоторые авторитетные поставщики серверов более низкого уровня, которые заслуживают уважения (например, System76), но «пользовательский» означает, что они собирают вещи сами. Отлично подходит для вашего дома, но плохо для вашего центра обработки данных. (Это не включает покупку HP Proliant DL580 и установку таких вещей, как наборы опций памяти или отсеки для дисков.)

Какие варианты владения доступны? Купить через них? Купить прямой и прямой груз там? Лизинг? Виртуальные машины?

gWaldo
источник
4
Согласитесь с тушением пожара, хотя для «Галона» читайте «галон / FM200 / Аргонит / Инерген / другой огнетушащий газ здесь»
MadHatter поддерживает Монику
11
Спринклеры фактически требуются пожарным кодом во многих местах. Я узнал об этом в 2003 году во время сборки DC, с которой мне помогали. Он должен срабатывать только в том случае, если FM200 не гасит источник тепла. Это должна быть спринклерная система с сухими трубами, поддерживающая инертный газ.
sysadmin1138
2

Отлично, как всегда, Кайл, пара вещей, которые я узнал из опыта:

  • Спросите, есть ли генераторы для резервного копирования ИБП, если да, то как часто генераторы тестировались?

  • Какие физические замки и проверки они имеют для предотвращения отключения электричества электриками?

  • Какую ответственность / страховое покрытие они имеют?

  • Как они справляются с ситуациями, когда они не соответствуют своему SLA?

  • Как часто они не встречали SLA?

  • Сколько энергии они обеспечивают каждой стойке / клетке / и т. Д.? (Будете ли вы ограничены в мощности и вам понадобится еще одна стойка / клетка только для дополнительной мощности?)

  • Спросите рекомендации, в вашей отрасли было бы хорошо.

Смешные истории, которые не были смешными в то время:

  1. Был пожар в Ванкувере в подземном электрическом отсеке, в 4 кварталах от моего постоянного тока, огонь забрал электричество на радиус 10 блоков. ИБП не выключал свет до тех пор, пока генераторный агрегат не подключился к сети. Генеральная установка оставалась в сети около часа до перегрева. ИБП смогли включить свет еще на 30 минут после того, как генераторный агрегат отключился. Генерал принадлежал к зданию, IIRC DC смог обвинить их и мыть руки.

  2. Электрик отключил электропитание пары рядов стоек на постоянном токе, потому что панель как-то упала и выбила все выключатели. Я также слышал об электрике в другом DC, который будет работать на ИБП, не переводить его в режим байпаса и отключать весь DC.

Clint
источник
Желательно ли иметь в этих случаях стоечный ИБП или это не имеет значения, так как в любом случае соединение обычно прерывается?
AX1
Это было бы хорошо ... Наш округ Колумбия сказал, что нам не разрешено иметь ИБП в наших стойках, они дали нам причину, но я не помню, что это было.
Клинт
Может быть, тепло? У меня нет большого опыта работы со стоечными ИБП, но потребительские ИБП всегда нагреваются.
AX1
4
@ AX1: ИБП в цепочке путаются друг с другом. Они ожидают определенных характеристик в токе, и другие ИБП могут отфильтровать их. Сеть, вероятно, выйдет из строя, как только DC потеряет питание, поэтому, даже если ваши серверы работают, сеть не будет.
quinnr
Возможно, это был пожарный кодекс, если бы пострадало ЕПВ, пожарные ожидают, что живой силы не будет.
Шон Рейфшнейдер
1
  • Я бы сказал, что, вероятно, треть центра обработки данных - это технические позиции (у вас есть {VESDA, контракты на заправку, охладители, покрытые ИБП, несколько энергосистем, разнообразные входы оптоволокна).

  • Еще одна треть - как они справляются с этим, когда дела идут плохо. Глотают ли они свою гордость, изучают неудачу и выясняют, что делать, чтобы убедиться, что это больше не повторится? Или они просто продолжают делать то, что раньше не работало?

  • А другая треть - это персонал. Они умны, с ними легко работать и они не переворачиваются каждый месяц?

Но что еще более важно: у них есть место, которое вам нужно? Одно место, куда мы почти вошли, через 2 года мы использовали больше места, чем им было доступно.

Шон Рейфшнайдер
источник
1

Я работаю в небольшом дата-центре в Силиконовой долине. Я системный администратор на стороне управляемого сервера.

Плохие признаки:

  • Отсутствие избыточного мониторинга и оповещения о мощности, температуре, влажности
  • Отсутствие мониторинга сетевых устройств, colos, серверов и другого оборудования
  • Беспорядок и отсутствие использования кабельных стяжек или других кабелей для поддержания чистоты, организованных стоек

Хорошие признаки: - Дизельный генератор на месте с автоматическим переключением при отказе - Резервные чиллеры и кондиционеры с автоматическим переключением при отказе - Большая пропускная способность на магистральных магистральных каналах (AT & T, XO Comm) - Резервные сетевые провайдеры - Резервные маршрутизаторы, межсетевые экраны, балансировщики нагрузки и коммутаторы - Работает проверка памяти и диагностика оборудования перед развертыванием серверов

С именными серверами все в порядке, но если они старые и уже много раз были в блоке, вам лучше убедиться, что они проходят диагностику оборудования, прежде чем их использовать.

Хороший центр обработки данных должен предоставлять своим клиентам веб-сайт, на котором они могут отслеживать потребление трафика и время безотказной работы. Они также должны ответить на любые вопросы. Спросите их марку и модель их ИБП. Попросите их посмотреть текущую нагрузку на ИБП. С помощью этой информации вы можете проверить, как долго он может работать без питания.

Но, честно говоря, ИБП не должен быть вашей заботой. ИБП обеспечивает только короткое время работы (около 30 минут). Гораздо лучше беспокоиться о том, имеет ли DC резервный генератор. Также стоит спросить, на какой сетке включен DC. С точки зрения отключений и отключений, различные приоритеты назначаются различным сеткам. Угадай, что? Больницы и пожарные станции имеют высокий приоритет (питание никогда не отключается). Если ЦОД находится на той же сети, его гарантированная надежная мощность.

Спросите их, сколько энергии доступно на стойку. Там, где я работаю, мы обеспечиваем каждую стойку 3х25-амперными цепями. Типичный сервер 1u потребляет 1-3 ампер.

80skeys
источник
Тот, к которому я испытываю желание пойти, имеет 40 ампер на стойку. Это слишком низко? Это почти половина того, что вы говорите (75 ампер).
AX1
1
@ AX1, 40A при 110 В - 4400 Вт; при 230 В это 9200 Вт. Если это не высокая плотность (Twin / Twin ^ 2 / Blade) или HPC / GPU, это МНОГО.
Мирча Chirea