Варианты хостинга общедоступных данных

12

Итак, вы решили поддержать идею воспроизводимых исследований и хотите, чтобы ваши данные были доступны в Интернете для просмотра и использования людьми. Вопрос в том, где вы его размещаете?

Моим первым стремлением, конечно, является частное веб-пространство, которое у меня есть на университетском сервере, но на самом деле эти вещи не так уж постоянны - если я уйду, каталог останется открытым в течение очень короткого периода времени, прежде чем он исчезнет. Вряд ли это правильная настройка для хранения данных, доступных людям для использования и работы в будущем.

Вы используете что-то вроде GitHub или SourceForge? Или другой сервис?

Данные данные являются результатом некоторых симуляций, представляющих очень узкий интерес, поэтому я не обязательно думаю, что где-то, например, InfoChimps или другое хранилище общедоступных данных, является подходящим домом для этого. Это меньше "Вы можете узнать вещи с помощью этого кода!" и еще «Вы можете повторить рисунок 3 в этой статье».

фомиты
источник
1
Соответствующий, возможно, дубликат: stats.stackexchange.com/questions/10045/…
Мэтт Паркер,
1
Абсолютно актуально - добавление некоторых деталей, которые указывают на то, почему я не думаю, что это дубликат.
Fomite
@EpiGrad: Какую дату ты имеешь в виду? Если это исходный код, связанный с вашим исследовательским проектом, вы можете прикрепить его к препринту arXiv .
Петр Мигдаль
@PiotrMigdal В идеале, я бы хотел, чтобы данные могли зависать в течение нескольких лет, достаточно долго, чтобы обычное распространение цитирования и т. Д. Работало. Я бы прикрепил его к препринту arXiv, если бы только мое поле использовало его;)
Fomite
@EpiGrad Тогда, возможно, хорошим местом для поиска являются открытые данные как аспект открытой науки - michaelnielsen.org/blog/open-science .
Петр Мигдаль

Ответы:

4

Одним из простых вариантов является github .

Я использую это немного, чтобы поделиться данными и кодом анализа данных. Несколько хороших примеров того, как другие делятся кодом и данными на сайте, перечислены по этому вопросу .

Преимущества GitHub

  • Легко загрузить, когда вы познакомитесь с git, и почему бы не использовать git для своих нужд контроля версий.
  • Вы можете использовать гистограммы для простых отдельных файлов
  • Другие могут легко загрузить один или несколько файлов в виде архива.
  • Имеет много свободного места
  • исходный код можно просмотреть в интернете
  • и более...

Конечно, GitHub не идеально подходит для данных. Я вижу преимущества использования более постоянного институционального хранилища или какого-то другого специального инструмента для более серьезного архивирования.

Джером англим
источник
1
На самом деле это решение, которое я выбрал. Частично проблема с институциональным репозиторием заключается в том, что то, в каком я учреждении, находится в движении, а данные недостаточно важны для одного из хранилищ больших данных.
Fomite
4

Другой вариант, по-видимому, - Dataverse , который доступен в виде сервиса и программного обеспечения с открытым исходным кодом. Я не пробовал, хотя.

Карстен В.
источник
2

Одной из возможностей для тех, кто учится в академических кругах, является использование цифрового репозитория в кампусе, который часто размещается в библиотеках кампуса (для меня логическое место для наборов данных, сопровождающих публикации).

Популярным (бесплатным) цифровым репозиторием является DSpace, который, на мой взгляд, может содержать наборы данных. Но это услуга, которую должен принять кто-то в вашем учреждении.

MannyG
источник