В моей программе PhD по вычислительной технике мы работаем почти исключительно на C ++ и Fortran. Кажется, некоторые профессора предпочитают одного другому. Мне интересно, какой из них «лучше» или один лучше другого в определенных...
В высокопроизводительных вычислениях обычно используются большие массивы компьютеров, соединенных в кластеры или сети.
В моей программе PhD по вычислительной технике мы работаем почти исключительно на C ++ и Fortran. Кажется, некоторые профессора предпочитают одного другому. Мне интересно, какой из них «лучше» или один лучше другого в определенных...
Является ли хорошей идеей использовать vector<vector<double>>(используя std) для формирования матричного класса для высокопроизводительного научного вычислительного кода? Если ответ нет. Зачем?...
Из обзора топ-500 довольно ясно видно, что отрасль имеет тенденцию к экспоненциальному увеличению числа процессорных ядер . Все крупнейшие суперкомпьютеры используют MPI для связи между узлами, хотя не наблюдается явной тенденции к параллелизму на узле, при этом самый простой (но не обязательно...
Как CUDA и OpenCL сравниваются друг с другом в конце 2013 года с точки зрения программиста? Моя группа думает о том, чтобы попытаться использовать вычисления на GPU. Будем ли мы значительно ограничивать себя, выбирая оборудование, которое поддерживает только OpenCL, но не CUDA? Чтобы быть более...
Amazon EC2 Compute Cluster стоит около $ 800- $ 1000 ( в зависимости от рабочего цикла) на физическое ядро процессора в течение 3 -х лет. В нашем последнем раунде приобретения оборудования моя лаборатория взяла на вооружение оборудование на 48 ядер, очень похожее на кластеры Amazon, по цене около $...
Парадигма программирования OpenCL обещает быть открытым стандартом для разнородных вычислений. Должны ли мы инвестировать наше время в разработку программного обеспечения на основе OpenCL? За и...
Я начну с моего личного опыта в нашей лаборатории. В 9 и 10 днях раньше мы были довольно агрессивны с оптимизацией, компилируя с -O3 и специфичными для процессора флагами (например, -xW -xSSE4.2). Но начиная с ifort 11, мы начали замечать: 1. некоторые несоответствия в результатах (поскольку...
Я хочу разработать параллельное программное обеспечение для научных вычислений с нуля. Я хочу несколько мыслей, на каком языке начать. Программа включает в себя чтение / запись данных в текстовые файлы и параллельное выполнение тяжелых вычислений со многими факторизациями LU и использованием...
Возвращаясь к заре OS X, казалось, было много шума, по крайней мере, в мире Mac (я в то время не был близок к научным вычислениям) о Mac OS как платформе для научных вычислений и приложений HPC. XGrid вышла из коробки, у Virginia Tech был свой модный компьютерный кластер на базе Mac, Стэнфорд делал...
Наша рабочая группа выпускает настольное приложение, которое имитирует энергоэффективность здания. Это приложение .NET, и когда пользователь запускает много симуляций, они могут занимать довольно много времени. Моделирование полностью распараллеливаемо, и у нас есть несколько очень значительных...
Большая часть моей собственной работы вращается вокруг того, чтобы алгоритмы масштабировались лучше, и один из предпочтительных способов показать параллельное масштабирование и / или параллельную эффективность - это построить производительность алгоритма / кода по количеству ядер, например где ось...
Я запускал код молекулярной динамики (MD) GROMACS на кластере Ubuntu Linux, состоящем из узлов, содержащих 24 процессора Intel Xeon. Моя конкретная достопримечательность оказывается несколько чувствительной к арифметической точности с плавающей запятой, поэтому мне пришлось запускать GROMACS с...
Я нахожусь в области, которая не обязательно выполняет большую часть работы с высокопроизводительными вычислениями, и когда она сталкивается с ней, это часто является результатом того, что исследователи из других областей исследуют новые приложения для своих методов и тому подобного. В первую...
Я использую Valgrind + Callgrind для профилирования написанного мной решателя. Как говорится в руководстве пользователя Valgrind, я скомпилировал свой код с опциями отладки для компилятора: «Без отладочной информации лучшее, что смогут сделать инструменты Valgrind, - это угадать, к какой функции...
Больше всего в MPI мне не нравится иметь дело с типами данных (то есть картами данных / масками), потому что они не очень хорошо подходят для объектно-ориентированного C ++. boost::mpiоднако поддерживает только MPI 1.1 со своего веб-сайта: boost :: mpi - это дружественный к C ++ интерфейс...
Поскольку этот вопрос связан с вычислениями, я решил опубликовать здесь. Надеюсь, это будет рассматриваться как уместно. Я только начал работать с атмосферными и океаническими моделями и понял, что мне нужно больше ядер, памяти и дискового пространства, чем у моего нынешнего рабочего стола. В моем...
Для приложений, требующих значительных вычислительных ресурсов, высокая производительность может быть критическим фактором, когда речь идет о предоставлении научных результатов или достижении «прорывов» в разумные сроки. Сколько времени и усилий должны потратить разработчики программного...
Параллельные вычисления часто моделируются с использованием детерминированной локальной скорости вычислений, времени ожидания и пропускной способности сети. На самом деле, они пространственно переменные и недетерминированные. Такие исследования, как Skinner и Kramer (2005), наблюдают...
Я ищу заслуживающие доверия ссылки на то, сколько ресурсов суперкомпьютеры тратят на координацию, а не на выполнение реальной работы, связанной с задачами. Ресурсы могут иметь доступную вычислительную мощность, но даже ватты кажутся действительными единицами. Я полагаю, что один из моих профессоров...
В последние годы появилось несколько библиотечно-программных проектов, которые предлагают ту или иную форму параллелизма общей памяти на основе данных общего назначения. Основная идея состоит в том, что вместо написания явно поточного кода программисты реализуют свои алгоритмы как взаимозависимые...