Популярен ли ArXiv в статистическом сообществе?

25

Я знаю, что физические и математические сообщества очень любят ArXiv, но как насчет статистики? Это принято размещать там до представления?

Stask
источник
Я никогда не публиковал там и не могу вспомнить, что искал там бумаги.
Кристоф Ханк
@ DeepNorth да, это было бы интересно. Я спрашиваю как из любопытства, так и потому, что недавно я опубликовал черновик «как представлено» на ArXiv.
1
Да; некоторые из нас смотрят на arXiv хотя бы часть времени. Я делаю, когда могу, или когда кто-то указывает на меня, и я часто связываю людей с бумагами там.
Glen_b
3
Определите «статистику». В области, где я работаю, методология опроса, мои, возможно, наивные искатели «сложного опроса» и «конечной популяции» подняли 2 и 42 результата на arXiv, соответственно. Каждый год Секция методов исследования опросов Американской статистической ассоциации проводит около 40 сессий на совместных статистических совещаниях, от 1 до 3 в каждом временном интервале в течение 4 дней конференции, и, соответственно, выпускает не менее ста трудов. Насколько я могу судить, ничего из этого не получается в arXiv.
StasK

Ответы:

19

Да, Arxiv популярен в статистике и сообществе специалистов по данным.

Поскольку мир статистики и науки данных развивается каждый день, для статистиков и ученых, работающих с данными, важно быть в курсе последних событий, методов и алгоритмов.

Это может быть не так популярно, как в физическом сообществе, но оно имеет свою долю важности в мире данных.

Возможно, вас заинтересует Gitxiv , который объединяет современные исследования с соответствующим открытым исходным кодом / библиотеками.

Dawny33
источник
3
+1 за ссылку на Gitxiv ... плохо посмотрю. Регулярно ли вы проверяете ArXiv или подписываетесь на один из его списков рассылки?
2
С удовольствием. Gitxiv приблизили мир исследований к миру статистики и информатики. Слава этим парням. Нет, я не подписываюсь на списки рассылки, но, как там написано большинство статей по машинному обучению и аналитике, я проверяю их каждую неделю.
Dawny33
3
Было бы лучше, если бы вы включили некоторые подтверждающие доказательства. Теперь это всего лишь одно слово «Да», а остальное не информативно (но Gitxiv интересен, спасибо за упоминание).
Ричард Харди
19

Я дам окончательный, основанный на доказательствах ответ. Ответ ДА.

Посмотрите на показатели Google Scholar для вероятности и статистики, 10 лучших источников по h5-index:

    Publication                               h5-index  h5-median
1.  Journal of Econometrics                         62  93
2.  The Annals of Statistics                        58  81
3.  arXiv Statistics Theory (math.ST)               57  80
4.  Journal of Statistical Software                 53 113
5.  arXiv Probability (math.PR)                     53  65
6.  arXiv Methodology (stat.ME)                     48  69
7.  Journal of the American Statistical Association 48  66
8.  Statistics in Medicine                          42  62
9.  Computational Statistics & Data Analysis        40  51
10. Journal of Business & Economic Statistics       39  67

Обратите внимание, что этот список не основан на количестве публикаций, он основан на индексе цитирования .

Индекс цитирования Google становится таким же популярным, как Scopus и Reuters (хорошо, у меня нет подтверждения этому утверждению), поэтому мой ответ настолько объективен, насколько это возможно.

Сравните это со списком Scimagojr.com по статистике и вероятности:

    Title   Type    SJR H index Total Docs. (2014)  Total Docs. (3years)    Total Refs. Total Cites (3years)    Citable Docs. (3years)  Cites / Doc. (2years)   Ref. / Doc. Country
1   Annals of Mathematics   j   Q1  8,551   72  46  209 1.572   647 207 3,05    34,17   US
2   Vital and health statistics. Series 10, Data from the National Health Survey    k   Q1  7,801   30  4   7   55  125 7   16,33   13,75   US
3   Journal of the Royal Statistical Society. Series B: Statistical Methodology j   Q1  6,148   90  45  99  1.507   547 94  3,09    33,49   GB
4   Annals of Statistics    j   Q1  5,602   103 64  296 2.099   809 287 2,25    32,80   US
5   Journal of Statistical Software j   Q1  5,003   64  67  220 2.540   1.364   220 3,91    37,91   US
6   Journal of the American Statistical Association j   Q1  4,162   123 106 408 3.501   907 373 1,85    33,03   US
7   Probability Surveys j   Q1  3,645   22  1   20  84  46  19  2,73    84,00   US
8   Bioinformatics  j   Q1  3,576   248 809 2.145   18.801  11.329  2.089   4,69    23,24   GB
9   Journal of Business and Economic Statistics j   Q1  3,496   66  58  146 1.464   384 139 2,21    25,24   US
10  Biometrika  j   Q1  3,342   83  58  233 1.485   369 229 1,28    25,60   GB

Как вы можете видеть, список лучших 10 Google Scholar хорошо совпадает. Последний список также основан на h-index, но это не цитата Google. Это только подтверждает предыдущую таблицу и выводы из нее: arXiv популярен среди статистиков в академических кругах.

SSRN - другое место, чтобы сбрасывать препринты. Это популярно среди эконометристов.

Аксакал
источник
+1 - Отличная работа с использованием метрик Google! Индекс h определенно помещает это там.
@ Осталось знать одну вещь: движение с открытым доступом. arXiv - это место, где люди сбрасывают свои препринты, именно так все и началось в физике. Итак, вы увидите ту же статью в arXiv, а затем в Phys Rev, например. Таким образом, arXiv изначально был создан как средство для более быстрого распространения исследований. Хорошие статьи обычно не появляются только на arXiv.
Аксакал
Ага. Я обычно цитирую статью, которую нахожу на ArXiv, только если я могу найти ее в рецензируемом журнале. Моя статья находится там, пока она проходит рецензирование и я буду обновлять принятый препринт после периода эмбарго (при условии, что он не отклонен).
@Bey, пока мы там, есть два других места, где вы можете сбросить свои препринты: RePec и SSRN. Эконометристы могут использовать их чаще, чем arXiv
Аксакал,
14

Это не вопрос личного мнения, поэтому давайте посмотрим на некоторые цифры по терминам, появляющимся на страницах arXiv (некоторые случайные запросы Google с несколькими терминами, относящимися к домену):

сайт перекрестной проверки: arxiv.org возвращает

Около 17 800 результатов

Монте-Карло сайт: arxiv.org возвращается

Около 187 000 результатов

сайт выборки: arxiv.org возвращает

Около 141 000 результатов

Сайт прогнозирования: arxiv.org возвращается

Около 11 300 результатов

сайт регрессии: arxiv.org возвращается

Около 51 100 результатов

РЕДАКТИРОВАТЬ

Как заметил @Scortchi , arXiv публикует собственную статистику. Категория статистики появляется в отчетах за последние три года, как показано ниже:

year submissions % submissions
2014 2025        2.2% 
2013 1602        1.7%
2012 1284        1.5%

Это, однако, может не полностью отражать содержание опубликованных работ, поскольку некоторые из них могут быть тесно связаны со статистикой, но могут быть помечены как разные области (например, как математика или CS ).

Кроме того, блог Сианя может представлять собой тематическое исследование. Он много пишет о байесовской статистике и часто упоминает статьи arXived (имеющие собственную метку ).

Также кажется, что мы упомянули «arXiv» на CrossValidated в 689 постах и ​​комментариях до сих пор (в том числе здесь).

Это делает его популярным или нет? Пока трудно сказать, но наверняка тысячи статей, связанных со статистикой, были размещены на arXiv, и его популярность растет.

Тим
источник
3
Или, по крайней мере, тысячи статей, использующих / упоминающих статистическую методологию
Glen_b -Reinstate Monica
@Glen_b да, это вопрос ключевых слов, чтобы проверить, но я не вижу лучшего способа проверить, является ли он "популярным".
Тим
4
«Статистика» является предметной областью на arXiv - с 7 711 представлений к концу 2014 года, 0,9% от общего числа. arxiv.org/help/stats/2014_by_area/index
Scortchi - Восстановить Монику
@ Scortchi Я никогда не копался так глубоко на этом сайте, спасибо!
Тим
+1 :) Я не представлял этот вопрос как упражнение на анализ ... но вы нашли способ его решить ... это очень круто :) Не ожидал бы ничего меньшего от людей на этом сайте! Я бы сказал, на основе @Aksakal и вашего анализа, ArXiv достаточно хорошо подписан на статистику :-)
8

Все журналы, публикуемые Институтом математической статистики (IMS), в том числе «Анналы статистики» (один из самых популярных журналов статистики), «Анналы прикладной статистики» и т. Д., Прямо рекомендуют авторам делать препринты на arXiv и Кроме того, позаботьтесь о том, чтобы на arXiv также помещались постпринты. На самом деле я не знаю ни одного журнала по математике или физике, который бы загружал статьи в arXiv, если авторы сами этого не делали!

IMS рекомендует всем членам размещать свои статьи на arXiv.

( http://www.imstat.org/publications/arxiv.html )

Все статьи IMS 2004 года и более поздние свободно доступны в формате postprint на arXiv, а также статьи, опубликованные авторами.

ArXiv - это полностью автоматизированный сервер архивирования и распространения открытого доступа для исследовательских статей, в настоящее время принадлежащий и управляемый Корнельским университетом и частично финансируемый NSF. Основными областями, которые он охватывает, являются физика, математика, нелинейные науки, информатика и количественная биология. Недавно arXiv сотрудничал с IMS и Обществом Бернулли, чтобы открыть новую статистическую категорию в области математики. Мы ожидаем, что эта категория в конечном итоге превратится в архив верхнего уровня, сопоставимый, например, с математикой и физикой.

( http://www.imstat.org/publications/eaccess.htm )

амеба говорит восстановить монику
источник