Поскольку наука должна быть воспроизводимой, по определению растет признание того, что данные и код являются важным компонентом воспроизводимости, как обсуждалось на круглом столе в Йельском университете для совместного использования данных и кода .
При рассмотрении рукописи для журнала, который не требует совместного использования данных и кода, могу ли я попросить, чтобы данные и код были доступны
- для меня во время обзора
- публично на момент публикации (журнал поддерживает приложения)
Кроме того, как я могу сформулировать такой запрос?
обновление : хотя меня интересует общий случай, этот частный случай состоит из мета-анализа со всеми ранее опубликованными данными, а код представляет собой простые линейные модели в SAS
примечание стороны: возможность сделать вывод о перекрестном исследовании (как и цель метаанализа) была бы значительно улучшена, если бы больше исследований предоставили необработанные данные
обновление 2 :
Я запросил данные и код у редактора для целей обзора, редактор счел запрос обоснованным, и я получил запрошенный материал (достаточный, но с загадочными именами переменных, без метаданных и несколькими встроенными комментариями) в течение дня.
источник
Ответы:
Что касается получения данных в качестве рецензента, вы имеете право на это, если вам это необходимо для правильного завершения рецензирования. Больше рецензентов должны запрашивать данные и оценивать их. У многих журналов есть политики, которые могут требовать данных и кода анализа для проверки.
Доступность на момент публикации мне не ясна. Кажется, вы говорите, что хотите заставить проблему сделать данные общедоступными в качестве условия публикации. Это плохая идея, если это уже не политика журнала. Вы делаете публикацию несправедливой движущейся целью. Они подали, ожидая, что это не будет требованием, и вы, ни редактор, не должны менять игру.
Без ведома многих исследователей, финансируемых государством, они обязаны сделать свои данные общедоступными. Например, большинство грантов NIH имеют пункты, в которых исследователь должен предоставить свои данные. У большинства государственных учреждений, предоставляющих гранты, есть положения об обмене данными, которые вынуждают исследователя делиться тем, что они находят (возможно, сила немного сильна, учитывая, что очень трудно потерять грант из-за этого ... возможно, потерять обновление). Общественность заплатила за данные, поэтому общественность имеет право на них - в случае исследований на людях, имеющих право на их анонимность.
Некоторые из наиболее дорогих и конфиденциальных данных для сбора, данные FMRI человека, также являются одними из наиболее общедоступных. Не только PLoS, но и крупные полевые журналы требуют представления данных и поддерживают общедоступный банк данных. Я думаю, что это говорит о многом людям, которые возражают по причинам стоимости (это очень дорого) и конфиденциальности (это человеческие данные из небольших исследований, а иногда и уникальные клинические группы, которые могут быть очень чувствительными). Это причины, которые делают эти данные более ценными для общественности. Исследователи, которые скрывают такие данные, оказывают плохую услугу людям, которые их купили (всем), и нуждаются в уроке о том, что их обязанности находятся за пределами их маленькой лаборатории и конкурса публикаций.
Если исследование было профинансировано из частных источников, действительно из частных источников, тогда удачи.
источник
Рассматривая две ситуации отдельно:
Как рецензент: Да, я думаю, у вас есть основания попросить посмотреть данные или код. Но на вашем месте я бы приготовился увидеть такие вещи, как урезанный код или фрагмент данных. Люди внедряют будущие исследования, о которых не говорится в этом документе в своем коде все время, и вы не имеете права на этот код. Поскольку я в основном занимаюсь биомедицинскими исследованиями, я также был бы готов иметь дело с некоторыми довольно ограничительными соглашениями об использовании данных.
В самом журнале: Нет. Если исследователь хочет воспроизвести мои результаты, они могут сами обратиться ко мне, чтобы попросить код - вот почему у нас есть соответствующие авторы. Для данных, абсолютно нет, ни при каких обстоятельствах. Мои данные регулируются IRB и соглашениями о конфиденциальности - они не будут обнародованы. Если я хочунабор общедоступных данных, я мог бы смоделировать набор данных с похожими свойствами (т. е. сетевые данные «Faux-Mesa», доступные в одном из сетевых пакетов для R), но, как рецензент, у вас нет вызова, чтобы заставить это , Если это требование для всего журнала, то авторы знали, что их данные / код будут общедоступными при отправке, но если нет, то нет. Ваша роль состоит в том, чтобы оценить качество самой статьи (следовательно, я согласен с ней для целей обзора), а не использовать вашу способность внести свой вклад в принятие / отклонение статьи, чтобы выдвинуть то, что по сути является философско-политической точкой выходит за рамки журнала.
В лучшем случае я бы добавил в ваши комментарии фразу «я бы настоятельно призвал авторов сделать их код и данные доступными, где это возможно», но я бы не стал формулировать это сильнее, и я бы не стал официальный список «Вещи, которые, я думаю, нужно исправить, прежде чем это увидит свет».
источник
Как говорит Джон, доступность данных для рецензентов должна быть легкой; Тщательный анализ должен включать повторение анализа и, как таковой, требует доступа к данным.
Что касается общедоступности данных после публикации, я бы сказал, что битва должна вестись в основном с журналом, а не с конкретной публикацией.
В более общем плане, финансирующие агентства и IRB все больше осознают, что обмен данными является как научно, так и этически необходимым компонентом исследований. Увеличивая доступность для повторного анализа, который может дать новые результаты правильных ошибочных отчетов, обмен данными увеличивает потенциальную выгоду для исследования, тем самым изменяя соотношение затрат и выгод в пользу участников исследования. Безусловно, необходимо информировать участников о возможности совместного использования их данных, а также необходимо установить меры предосторожности для предотвращения повышенного риска идентификации участников, но это может быть достигнуто в большинстве случаев. В своем собственном исследовании я заверяю участников (и мой IRB), что (1) данные будут храниться в строго зашифрованном формате (обновляется по мере развития технологии дешифрования),
источник
У меня нет никакого опыта с этим, но мне кажется, что вы могли бы настаивать на # 1 как часть вашей собственной должной осмотрительности при рассмотрении их результатов. Я не понимаю, как вы можете настаивать на # 2, хотя.
источник