Я имею в виду практики, которые все еще сохраняют свое присутствие, хотя проблемы (обычно вычислительные), с которыми они были разработаны, в основном были решены.
Например, коррекция непрерывности Йетса не была изобретена , чтобы аппроксимировать точный критерий Фишера с тестом, но это уже не практично , так как программное обеспечение может теперь обрабатывать тест Фишера даже большие выборки (я знаю , что это не может быть хорошим примером «поддержаний его присутствия ", так как учебники, такие как категориальный анализ данных Агрести , часто признают, что исправление Йейтса" больше не требуется ").
Каковы некоторые другие примеры такой практики?
references
philosophical
Фрэнсис
источник
источник
Ответы:
Настоятельно можно утверждать, что использование пороговых уровней значимости, таких как или P = 0,01, является историческим пережитком периода, когда большинство исследователей зависело от ранее рассчитанных таблиц критических значений. Теперь хорошее программное обеспечение будет давать P-значения напрямую. Действительно, хорошее программное обеспечение позволяет настраивать анализ и не зависеть от тестов из учебников.P=0.05 P=0.01 P
Это спорно , если только потому , что некоторые проблемы тестирования значимости требуют решений, как и в контроле качества , где принятие или отклонение партии является решение , необходимым, с последующим действием либо образом. Но даже там пороги, которые будут использоваться, должны вырасти из анализа риска, а не зависеть от традиции. И часто в науках анализ количественных показателей более уместен, чем решения: мышление количественно подразумевает внимание к размерам значений, а не только к грубой дихотомии, значимой или не значимой.P
Я отмечу, что здесь я затрагиваю запутанную и противоречивую проблему, которая находится в центре внимания целых книг и, возможно, тысяч статей, но, похоже, это хороший пример для этой темы.
источник
Один метод, с которым я думаю, что многие посетители этого сайта согласятся со мной, - это ступенчатая регрессия. Это все еще делается все время, но вам не нужно долго искать экспертов на этом сайте, которые осуждают его использование. Такой метод, как LASSO, является наиболее предпочтительным.
источник
Я считаю, что, по крайней мере, в (прикладной) эконометрике все больше и больше становится нормой использовать надежную или эмпирическую ковариационную матрицу, а не «анахроническую практику» полагаться (асимптотически) на правильную спецификацию ковариационной матрицы. Это, конечно, не без противоречий: посмотрите на некоторые ответы, которые я связал здесь, в CrossValidated, но это, безусловно, четкая тенденция.
Другие примеры включают данные панели, например , Imbens и Wooldridge пишут на своих слайдах лекций аргументы против использования ковариационной матрицы дисперсии случайных эффектов (неявно предполагая некоторую ошибочную спецификацию в компоненте дисперсии по умолчанию):
Используя обобщенные линейные модели (для распределений, которые принадлежат экспоненциальному семейству), часто рекомендуется всегда использовать так называемую оценку сэндвича, а не полагаться на правильные предположения о распределении (здесь анахроническая практика): см., Например, этот ответ или Кэмерон, ссылающийся на подсчитывать данные, потому что псевдомаксимальная оценка правдоподобия может быть достаточно гибкой в случае неправильной спецификации (например, с использованием Пуассона, если отрицательный биномиал будет правильным).
Грин пишет в своем учебнике в главе 14 (доступно на его веб-сайте), например, с критической заметкой и более подробно рассказывает о преимуществах и недостатках этой практики:
источник
источник
Большинство анахронических практик, вероятно, связано с тем, как преподается статистика, а также с тем фактом, что анализ проводится огромным количеством людей, которые взяли только пару базовых классов. Мы часто преподаем набор стандартных статистических идей и процедур, потому что они образуют логическую последовательность повышения концептуальной сложности, которая имеет смысл с педагогической точки зрения (ср., Как мы можем когда-либо знать дисперсию населения? ). Я сам виноват в этом: иногда я преподаю статистику 101 и 102 и постоянно говорю: «Есть лучший способ сделать это, но он выходит за рамки этого класса». Для тех студентов, которые не выходят за рамки вводной последовательности (почти все), им оставляют базовые, но замененные стратегии.
Для примера со статистикой 101, вероятно, наиболее распространенной анахроничной практикой является проверка некоторого предположения, а затем выполнение традиционного статистического анализа, поскольку тест не был значимым. Более современный / продвинутый / оправданный подход заключается в том, чтобы с самого начала использовать метод, устойчивый к этому предположению. Некоторые ссылки для получения дополнительной информации:
Для примеров статистики 102 любое количество методов моделирования было устаревшим:
Смысл во всех этих случаях заключается в том, что люди делают то, чему сначала учили в начальном классе, потому что они просто не знают более продвинутых и подходящих методов.
источник
Очень интересным примером являются тесты единичного корня в эконометрике. Несмотря на то, что существует множество вариантов для тестирования с использованием или для единичного корня в полиноме запаздывания временного ряда (например, (расширенный) тест Дики-Фуллера или тест KPSS), проблему можно полностью обойти, если использовать байесовский анализ. , Симс указал на это в своей провокационной газете под названием « Понимание юнитов Rooters: тур на вертолете» с 1991 года.
Тесты единичного корня остаются действительными и используются в эконометрике. Хотя я лично приписываю это главным образом тем, что люди не хотят приспосабливаться к байесовским методам, многие консервативные эконометрики защищают практику тестов единичного корня, говоря, что байесовский взгляд на мир противоречит предпосылке эконометрических исследований. (То есть экономисты думают о мире как о месте с фиксированными параметрами, а не случайными параметрами, которые определяются каким-то гиперпараметром.)
источник
Оплата лицензионных сборов за высококачественные статистические программные системы. #Р
источник
Обучение / проведение двусторонних тестов на различия без одновременного тестирования на эквивалентность в частой сфере тестирования гипотез - это глубокая приверженность к уклону от подтверждения .
Есть некоторый нюанс в том, что соответствующий анализ мощности с вдумчивым определением величины эффекта может защититься от этого и дать более или менее те же самые выводы, но (a) анализ мощности так часто игнорируется при представлении результатов, и (b) I никогда и не видели анализ мощности для, например, каждый коэффициент оценивается для каждой переменной в множественной регрессии, но это просто сделать это для комбинированных испытаний на разницу и тестов для эквивалентности (т.е. актуальность тестов).
источник
Использование отрицательной биномиальной модели, а не (надежной) модели Пуассона для идентификации интересующего параметра в переменной счетчика, только потому, что существует чрезмерная дисперсия?
Смотрите в качестве ссылки: https://blog.stata.com/2011/08/22/use-poisson-rather-than-regress-tell-a-friend/
Доказательство того, что Пуассон является более надежным в случае с фиксированными эффектами, является довольно недавним, поскольку в нем уже упоминались: Вулдридж Дж. М., «Оценка без распределения некоторых нелинейных панельных моделей данных», Journal of Econometrics 90 (1999), 77-97.
источник
Вот несколько анахронизмов:
Неоплатоническое предположение о том, что в теоретическом эфире существует единственная, «истинная» популяция, которая является вечной, неизменной и неподвижной, по которой могут быть оценены наши несовершенные образцы, мало что способствует продвижению обучения и знаний.
Редукционизм, присущий мандатам, таким как бритва Оккама, не согласуется со временем. ИЛИ можно обобщить следующим образом: «Среди конкурирующих гипотез следует выбирать ту, которая имеет наименьшее количество предположений». Альтернативы включают в себя принцип множественных объяснений Эпикура , который примерно гласит: «Если данные соответствуют нескольким теориям, сохраните их все».
Вся система рецензирования остро нуждается в капитальном ремонте.
* Редактировать *
С массивными данными, содержащими десятки миллионов функций, больше нет необходимости в фазе выбора переменной.
Кроме того, логическая статистика бессмысленна.
источник