Предположим, что у нас есть две точки (на следующем рисунке: черные кружки), и мы хотим найти значение для третьей точки между ними (крестик). Действительно, мы собираемся оценить это на основе наших экспериментальных результатов, черные точки. Простейший случай - нарисовать линию, а затем найти значение (т. Е. Линейную интерполяцию). Если у нас были опорные точки, например, коричневые точки с обеих сторон, мы бы предпочли получить от них выгоду и построить нелинейную кривую (зеленая кривая).
Вопрос в том, что является статистическим обоснованием для обозначения красного креста в качестве решения? Почему другие кресты (например, желтые) не являются ответами, где они могут быть? Какой вывод или (?) Подталкивает нас к принятию красного?
Я разработаю свой оригинальный вопрос на основе ответов, полученных на этот очень простой вопрос.
источник
Ответы:
Любая форма подбора функций, даже непараметрических (которые обычно делают предположения о гладкости соответствующей кривой), включает в себя предположения и, следовательно, скачок веры.
Древнее решение линейной интерполяции - это то, что «просто работает», когда ваши данные достаточно мелко «достаточно» (если вы посмотрите на круг достаточно близко, он тоже выглядит плоским - просто спросите Колумба), и даже выполнимо до компьютерного века (что не так для многих современных сплайн-решений). Имеет смысл предположить, что функция будет «продолжаться в одной и той же (т.е. линейной) материи» между двумя точками, но есть нет априорных оснований для этого ( за исключением знания о понятиях , под руку).
Быстро становится ясно, когда у вас есть три (или более) неколинейных точки (например, когда вы добавляете коричневые точки выше), что линейная интерполяция между каждой из них вскоре будет включать острые углы в каждой из них, что обычно нежелательно. Вот где другие варианты вступают в силу.
Однако без дальнейшего знания предметной области невозможно с уверенностью утверждать, что одно решение лучше другого (для этого вам нужно будет знать, каково значение других точек, что не соответствует цели подгонки функции в первое место).
С другой стороны, и, возможно, более уместно для вашего вопроса, в «условиях регулярности» (читай: предположения : если мы знаем, что функция, например, гладкая), как линейная интерполяция, так и другие популярные решения могут быть доказаны как «разумные» приближения. Тем не менее: это требует допущений, и для этого у нас, как правило, нет статистики.
источник
Вы можете составить линейное уравнение для линии наилучшего соответствия (например, y = 0,4554x + 0,7525), однако это будет работать только при наличии помеченной оси. Однако это не даст вам точного ответа только наилучшим образом по отношению к другим пунктам.
источник