Вопросы с тегом «history»

Вопросы по истории статистики.

80
Что касается значений р, почему 1% и 5%? Почему не 6% или 10%?

Что касается p-значения s, мне интересно, почему % и % кажутся золотым стандартом для . Почему не другие значения, такие как % или %?111555"statistical significance"666101010 Есть ли фундаментальная математическая причина для этого или это просто широко распространенное...

77
Каковы «большие проблемы» в статистике?

Математика имеет свои знаменитые проблемы тысячелетия (и, исторически, 23 Гильберта ), вопросы, которые помогли сформировать направление поля. Я, однако, мало представляю себе, какими будут гипотезы Римана и P против NP статистики. Итак, каковы общие открытые вопросы в статистике? Отредактировано,...

71
Почему регрессия хребта называется «хребет», зачем она нужна и что происходит, когда уходит в бесконечность?

Оценка коэффициента регрессии хребта - это значения, которые минимизируютβ^Rβ^R\hat{\beta}^R RSS+λ∑j=1pβ2j.RSS+λ∑j=1pβj2. \text{RSS} + \lambda \sum_{j=1}^p\beta_j^2. Мои вопросы: Если , то мы видим, что приведенное выше выражение сводится к обычному RSS. Что делать, если ? Я не понимаю из учебника...

67
Как именно статистики согласились использовать (n-1) в качестве несмещенной оценки для дисперсии населения без моделирования?

Формула для вычисления дисперсии имеет в знаменателе:(n−1)(n−1)(n-1) s2=∑Ni=1(xi−x¯)2n−1s2=∑i=1N(xi−x¯)2n−1s^2 = \frac{\sum_{i=1}^N (x_i - \bar{x})^2}{n-1} Я всегда задавался вопросом, почему. Тем не менее, чтение и просмотр нескольких хороших видеофильмов о том, «почему», кажется, является хорошей...

61
Кто создал первую стандартную нормальную таблицу?

Я собираюсь представить стандартную нормальную таблицу в своем классе вводной статистики, и это заставило меня задуматься: кто создал первую стандартную нормальную таблицу? Как они это делали до появления компьютеров? Мне страшно подумать, что кто-то перебор вычисляет тысячу римановых сумм...

59
Куда делись частые-байесовские дебаты?

Мир статистики был разделен между частыми лицами и байесовцами. В наши дни кажется, что все делают немного и того, и другого. Как это может быть? Если разные подходы подходят для разных задач, почему отцы-основатели статистики не видели этого? В качестве альтернативы, дебаты были выиграны частыми...

56
Каковы прорывы в статистике за последние 15 лет?

Я до сих пор помню документ «Анналы статистики» Фридмана-Хасти-Тибширани об усилении, а также комментарии других авторов (включая Фрейнда и Шапира) по тем же вопросам. В то время очевидно, что Boosting рассматривался как прорыв во многих отношениях: выполнимый в вычислительном отношении метод...

56
Является ли «гибрид» между подходами Фишера и Неймана-Пирсона к статистическому тестированию действительно «бессвязной путаницей»?

Существует определенная школа мысли, согласно которой наиболее распространенный подход к статистическому тестированию представляет собой «гибрид» между двумя подходами: подход Фишера и Неймана-Пирсона; эти два подхода, как утверждается в заявлении, являются «несовместимыми», и, следовательно,...

40
Эмпирические отношения между средним, медианой и модой

Для унимодального распределения, которое умеренно искажено, мы имеем следующие эмпирические отношения между средним, медианой и модой: Как были эти отношения получен?(Mean - Mode)∼3(Mean - Median)(Mean - Mode)∼3(Mean - Median) \text{(Mean - Mode)}\sim 3\,\text{(Mean - Median)} Карл Пирсон нарисовал...

36
Как ученые выяснили форму функции плотности вероятности нормального распределения?

Это, вероятно, любительский вопрос, но меня интересует, как ученые пришли к форме функции плотности вероятности нормального распределения? В основном меня беспокоит то, что для кого-то, возможно, было бы более интуитивно понятно, что функция вероятности нормально распределенных данных имеет форму...

36
Кто изобрел стохастический градиентный спуск?

Я пытаюсь понять историю градиентного спуска и стохастического градиентного спуска . Градиентный спуск был изобретен в Коши в 1847 году. Общий метод решения проблем симуляций . С. 536–538. Подробнее об этом см. здесь . С тех пор методы градиентного спуска продолжали развиваться, и я не знаком с их...

36
Почему проблемы регрессии называют проблемами «регрессии»?

Мне просто интересно, почему проблемы регрессии называют проблемами «регрессии». Какая история стоит за именем? Одно определение регрессии: «Рецидив в менее совершенное или развитое состояние»....

33
Происхождение порога «5 » для принятия доказательств в физике элементарных частиц?

В новостях говорится, что CERN объявит завтра, что бозон Хиггса был экспериментально обнаружен с 5 свидетельствами. Согласно этой статье:σσ\sigma 5 соответствует вероятности 99,9994% того, что данные, которые видят детекторы CMS и ATLAS, представляют собой не просто случайный шум, а вероятность...

30
Почему ожидаемое значение названо так?

Я понимаю, как мы получаем 3,5 в качестве ожидаемого значения для бросания честного 6-стороннего кубика. Но интуитивно я могу ожидать, что каждое лицо с равным шансом 1/6. Так не должно ли ожидаемое значение броска кубика быть числом от 1 до 6 с равной вероятностью? Другими словами, когда задают...

30
Кто первым использовал / изобрел p-значения?

Я пытаюсь написать серию постов в блоге о p-значениях, и я подумал, что было бы интересно вернуться к тому, с чего все началось, - похоже, это статья Пирсона 1900 года. Если вы знакомы с этим документом, вы помните, что он охватывает тестирование на пригодность. Пирсон немного болтает со своим...

27
Происхождение термина «регуляризация»

Когда я знакомлю студентов с концепциями, мне часто бывает весело рассказывать им о происхождении терминологии (например, «регрессия» - это термин с интересным происхождением). Я не смог открыть историю / историю термина «регуляризация» в статистическом / машинном обучении. Итак, каково...

25
Статистические таблицы в старых книгах целенаправленно неверны?

Я помню, как читал некоторое время назад, что в старых (до компьютерных дней) книгах последние цифры теоретических квантилей, показанных в приложениях, были неточными, чтобы препятствовать плагиату (идея состояла в том, что если в другой книге есть таблица в Приложение, где последние цифры...

24
Кто изобрел дерево решений?

Я пытаюсь отследить, кто изобрел структуру данных и алгоритм дерева решений. В статье в Википедии об изучении дерева решений есть утверждение, что «ID3 и CART были изобретены независимо примерно в одно и то же время (между 1970 и 1980 годами)». ID3 был представлен позже в: Quinlan, JR 1986....