Amazon EC2 Compute Cluster стоит около $ 800- $ 1000 ( в зависимости от рабочего цикла) на физическое ядро процессора в течение 3 -х лет. В нашем последнем раунде приобретения оборудования моя лаборатория взяла на вооружение оборудование на 48 ядер, очень похожее на кластеры Amazon, по цене около $ 300 за ядро.
Я что-то здесь упускаю? Существуют ли ситуации, в которых экономически целесообразно создавать кластер в облаке для задач с высокой загрузкой ЦП, таких как моделирование молекулярной динамики? Или мне всегда лучше просто строить и присматривать за машиной?
(Я должен отметить, что моя лаборатория не оплачивает электричество в нашей серверной комнате (по крайней мере, не напрямую), но даже с этим преимуществом Amazon все еще кажется чрезвычайно дорогим).
источник
Ответы:
Основное преимущество, на мой взгляд, использования облачных ресурсов - это гибкость, т. Е. Если у вас колеблющаяся рабочая нагрузка, вы платите только за то, что вам нужно.
Если это не так в вашем приложении, то есть вы знаете, что у вас будет измеримая и постоянная рабочая нагрузка, тогда вам, вероятно, лучше построить свой собственный кластер. В облаке вы платите за гибкость, а если вам не нужна гибкость, вы платите за то, что вам не нужно.
Если ваша рабочая нагрузка является гибкой, но несколько интенсивной и зависит от определенных аппаратных функций (см. Ответ aeismail), вы можете попробовать поделиться кластером с другими людьми в вашем университете, чтобы амортизировать циклы простоя. Мой старый университет использует такой общий кластер с «моделью акционеров», в которой каждой группе гарантируется доля вычислительной мощности, пропорциональная их инвестициям в аппаратные средства, и циклы простоя могут быть использованы любым. Единственная сложность - централизация администрирования кластера.
источник
Есть некоторые вещи, о которых нужно беспокоиться, когда вы выполняете облачные вычисления с симуляциями MD. Например, вам нужно беспокоиться о физической компоновке процессоров в ферме серверов, где будут выполняться эти задания. Причина в том, что в зависимости от размера ваших симуляций и типов вычислений, которые вы выполняете (например, системы с электростатикой), вы можете сильно зависеть от БПФ - и толкать электроны к разным процессорам в гигантском кластере. может стать очень трудоемкой частью общего времени вычислений.
Кроме того, для такого большого объема данных, как MD, вам нужно убедиться, что у вас есть быстрая загрузка и загрузка подключений к серверам, а также разумные ограничения на хранение данных. В противном случае большая часть экономии может быть потеряна из-за потери производительности и расходов на хранение.
Что бы это ни стоило, наш институт только что купил около 240 ядер для нашего локального кластера по цене менее 500 евро за ядро. Эта стоимость включает в себя хостинг и администрирование, а также обслуживание в нашем кампусе в течение четырех лет. В годовом исчислении это кажется смехотворно дешевым. Я думаю, что это, вероятно, лучшее из обоих миров - локальный доступ, но профессионально поддерживаемый, без нашей собственной ИТ-команды.
источник
У меня нет непосредственного опыта работы с облачными сервисами, такими как Amazon EC2, но фактическая стоимость на ядро, вероятно, намного выше, чем вы указываете: это стоимость первоначальной покупки, электричества, охлаждения, пространства в здании, замены оборудования. Плюс затраты на администрирование: настройку ОС и служб кластера, поддержание операционной системы в актуальном состоянии, устранение неполадок в очереди и т. Д. Я бы совсем не удивился, если бы сумма всего этого вдвое превышала стоимость первоначальной покупки. Конечно, вы получаете гибкость.
Для меня модель сводится к масштабу: если у вас действительно большой кластер (1000 ядер или более), то вы можете амортизировать рабочее время, ремонт, системное администрирование, потому что этого достаточно, чтобы заняться профессионалом. Если у вас есть небольшой кластер, в котором не стоит заниматься специальным человеком, то вполне вероятно, что вы заставите кого-то сделать это, чья первая работа должна заключаться в том, чтобы заниматься наукой, и в этом случае время этого человека плохо расходуется на такие административные работы. Это где службы по запросу, такие как облачные серверы сияют.
источник
В дополнение к некоторым из уже превосходных ответов, есть еще один фактор, который следует учитывать:
Я столкнулся с нетривиальным количеством грантов, которые которые ни при каких обстоятельствах не будут оплачивать расходы на аппаратное обеспечение, но будут оплачивать вычислительное время на чем-то вроде EC2. Таким образом, при определенных обстоятельствах финансирования, в то время как вы можете финансировать небольшой «испытательный» кластер за счет неструктурированных средств или пакета запуска лаборатории, для крупномасштабных проектов это может быть единственным способом финансирования ваших вычислительных затрат.
Рассмотрим NIH:
Хотя кластерные машины можно поставить под заголовок «Оборудование стоимостью более 5000 долларов США», и вы можете привести веские аргументы в пользу этого, я нашел как рецензентов, которые скептически относятся к этому, так и университеты, которые сомневаются в постоянных затратах на поддержание такого уровня. система.
Некоторые гранты еще более строгие. Один грант у меня в настоящее время гласит следующее:
Зачастую проще просто получить кластер, оплачиваемый прямыми затратами, если он базируется на EC2 или одном из его многочисленных аналогов, чем фактически покупать оборудование, особенно если ваша организация скупа на косвенные расходы. Это может быть не так для вас, но это касается некоторых.
источник
Уже есть много ответов Бога. Я просто хочу добавить две маленькие точки.
1.) Я знаю, что IBM предлагает нечто подобное. Поэтому, в зависимости от вашего приложения, возможно, стоит сравнить различные предложения. Не только в отношении стоимости, но и оборудования.
2.) Конечно, большинство лабораторий слишком малы, чтобы иметь возможность инвестировать в собственный кластер. Таким образом, вопрос заключается в том, нельзя ли собрать несколько лабораторий вместе и инвестировать в кластер, который совместно используется различными лабораториями. Это имеет помимо очевидного эффекта разделения затрат и преимущество более равномерного распределения нагрузки.
источник