Как рассчитать неопределенность наклона линейной регрессии на основе неопределенности данных (возможно, в Excel / Mathematica)?
Пример: у нас есть точки данных (0,0), (1,2), (2,4), (3,6), (4,8), ... (8, 16), но каждое значение y имеет неопределенность 4. Большинство функций, которые я обнаружил, вычислили бы неопределенность как 0, так как точки полностью соответствуют функции y = 2x. Но, как показано на рисунке, y = x / 2 также соответствуют точкам. Это преувеличенный пример, но я надеюсь, что он показывает, что мне нужно.
РЕДАКТИРОВАТЬ: Если я попытаюсь объяснить немного больше, хотя каждый пункт в примере имеет определенное значение у, мы притворяемся, что мы не знаем, правда ли это. Например, первая точка (0,0) может быть (0,6) или (0, -6) или что-то среднее между ними. Я спрашиваю, есть ли алгоритм в любой из популярных проблем, который принимает это во внимание. В этом примере точки (0,6), (1,6,5), (2,7), (3,7,5), (4,8), ... (8, 10) все еще попадают в диапазон неопределенности, таким образом, они могут быть правильными точками, и линия, соединяющая эти точки, имеет уравнение: y = x / 2 + 6, в то время как уравнение, которое мы получаем, не учитывая неопределенности, имеет уравнение: y = 2x + 0. Таким образом, неопределенность k 1,5 и n равно 6.
TL; DR: на рисунке есть линия y = 2x, рассчитанная с использованием метода наименьших квадратов, и она идеально соответствует данным. Я пытаюсь выяснить, насколько k и n в y = kx + n могут измениться, но все еще соответствуют данным, если мы знаем неопределенность в значениях y. В моем примере неопределенность k равна 1,5, а n - 6. На изображении есть «наилучшая» линия подгонки и линия, которая едва соответствует точкам.
источник
Ответы:
источник
Я сделал наивную прямую выборку с этим простым кодом на Python:
и получил это:
Конечно, вы можете найти нужные
P
данные или изменить распределение неопределенности.источник
Я был на той же охоте раньше, и я думаю, что это может быть полезным для начала. Макрофункция Excel дает линейные условия соответствия и их неопределенности на основе табличных точек и неопределенности для каждой точки в обеих ординатах. Возможно, посмотрите документ, на котором он основан, чтобы решить, хотите ли вы внедрить его в другой среде, изменить и т. Д. (Для Mathematica проделана небольшая работа.) Кажется, на поверхности есть хорошая документация, но пока нет. не открыл макрос, чтобы увидеть, насколько хорошо он аннотирован.
источник