Существует ли концептуальная или процедурная разница между подгонкой модели к данным и подгонкой данных к модели? Пример первой формулировки можно увидеть в https://courses.washington.edu/matlab1/ModelFitting.html , а второй - в https://reference.wolfram.com/applications/eda/FittingDataToLinearModelsByLeast-SquaresTechniques.html. ,
terminology
enjayes
источник
источник
Ответы:
Практически каждый источник или человек, с которым я когда-либо общался, кроме источника Wolfram, с которым вы связались, относится к процессу как к подгонке модели к данным . Это имеет смысл, поскольку модель является динамическим объектом, а данные являются статическими (то есть фиксированными и постоянными).
Чтобы подчеркнуть это, мне нравится подход Ларри Вассермана к этому. По его словам, статистическая модель представляет собой совокупность распределений. Например, коллекция всех нормальных дистрибутивов:
или множество всех распределений Пуассона:
Подгонка распределения к данным - это любой алгоритм, который объединяет статистическую модель с набором данных (данные являются фиксированными) и выбирает ровно одно из распределений из модели, которое «наилучшее» отражает данные.
Модель - это то, что меняется (вроде): мы объединяем ее из целого набора возможностей в один лучший выбор. Данные - это просто данные; с ним ничего не происходит.
источник
В области моделирования Rasch обычно подгоняют данные к модели. Предполагается, что модель верна, и аналитик должен найти данные, которые ей соответствуют. Статья Википедии на Раше содержит более подробную информацию о как и почему.
Но я согласен с другими, что в целом в статистике мы подгоняем модель к данным, потому что мы можем изменить модель, но считается, что выбор или модификация данных - плохая форма.
источник
Как правило, наблюдаемые данные являются фиксированными, в то время как модель является изменчивой (например, из-за того, что параметры оцениваются), поэтому именно модель предназначена для того, чтобы соответствовать данным, а не наоборот . (Обычно люди имеют в виду этот случай, когда они говорят любое выражение.)
Когда люди говорят, что они подгоняют данные к модели, я пытаюсь понять, какого черта они сделали с данными? ,
[Теперь, если вы преобразуете данные , это, вероятно, будет «подгонкой данных к модели», но люди почти никогда не говорят этого в этом случае.]
источник
Обычно мы предполагаем, что наши данные соответствуют «реальному миру», а внесение любых изменений означает, что мы отходим от моделирования «реального мира». Например, нужно позаботиться об удалении выбросов, поскольку даже если это делает вычисления более приятными, выбросы все еще были частью наших данных.
При тестировании модели или оценке свойств оценщика с использованием начальной загрузки или других методов повторной выборки мы можем моделировать новые данные с использованием оценочной модели и наших исходных данных. Это делает предположение, что модель верна, и мы не изменяем наши исходные данные.
источник