Вопросы с тегом «fitting»

15

Какая кривая (или модель) должна соответствовать моим процентным данным?

Я пытаюсь создать фигуру, которая показывает связь между вирусными копиями и освещением генома (GCC). Вот как выглядят мои данные: Сначала я только построил линейную регрессию, но мои руководители сказали мне, что это неправильно, и попробовал сигмоидальную кривую. Поэтому я сделал это с помощью...

14

МЕНЬШЕ, что позволяет разрывы

Существует ли метод моделирования, такой как LOESS, который допускает ноль, один или несколько разрывов, где время разрывов не известно априори? Если метод существует, есть ли существующая реализация в R?...

r regression curve-fitting change-point loess

14

Как определить, когда регрессионная модель перегружена?

Когда вы выполняете эту работу, осознавая, что вы делаете, у вас появляется чувство, когда вы переоцениваете модель. Во-первых, вы можете отследить тренд или ухудшение скорректированного квадрата R модели. Также можно отследить аналогичное ухудшение значений p коэффициентов регрессии основных...

regression multivariate-analysis overfitting

14

Как подогнать распределение Вейбулла к входным данным, содержащим нули?

Я пытаюсь воспроизвести существующий алгоритм прогнозирования, переданный отставным исследователем. Первым шагом является согласование некоторых наблюдаемых данных с распределением Вейбулла, чтобы получить форму и масштаб, которые будут использоваться для прогнозирования будущих значений. Я...

distributions curve-fitting

14

Как минимизировать остаточную сумму квадратов экспоненциальной подгонки?

У меня есть следующие данные, и я хотел бы приспособить к ним модель отрицательного экспоненциального роста: Days <- c( 1,5,12,16,22,27,36,43) Emissions <- c( 936.76, 1458.68, 1787.23, 1840.04, 1928.97, 1963.63, 1965.37, 1985.71) plot(Days, Emissions) fit <- nls(Emissions ~ a*...

r nonlinear-regression fitting nls

14

Можно ли использовать тест Колмогорова-Смирнова и оценить параметры распределения?

Я читал, что критерий Колмогорова-Смирнова не должен использоваться для проверки правильности соответствия распределения, параметры которого были оценены по выборке. Имеет ли смысл разделить мою выборку на две части и использовать первую половину для оценки параметров, а вторую - для теста KS?...

estimation fitting kolmogorov-smirnov

14

Как программно определить сегменты ряда данных, чтобы они соответствовали различным кривым?

Существуют ли какие-либо документированные алгоритмы для разделения разделов данного набора данных на различные кривые наилучшего соответствия? Например, большинство людей, смотрящих на эту таблицу данных, с готовностью разделят ее на 3 части: синусоидальный сегмент, линейный сегмент и обратный...

fitting curve-fitting segmentation

14

Как k-кратная перекрестная проверка подходит в контексте наборов обучения / проверки / тестирования?

Мой главный вопрос касается попыток понять, как k-кратная перекрестная проверка подходит в контексте наличия наборов обучения / проверки / тестирования (если это вообще подходит в таком контексте). Обычно люди говорят о разделении данных на набор для обучения, валидации и тестирования, скажем, с...

cross-validation dataset overfitting

14

Оптимизация: корень зла в статистике?

Я слышал следующее выражение раньше: «Оптимизация - корень зла в статистике». Например, верхний ответ в этой теме делает это утверждение в связи с опасностью слишком агрессивной оптимизации во время выбора модели. Мой первый вопрос заключается в следующем: относится ли эта цитата к какому-либо...

cross-validation optimization overfitting

14

Почему в линейной регрессии используется функция стоимости, основанная на вертикальном расстоянии между гипотезой и точкой входных данных?

Допустим, у нас есть входные (предикторные) и выходные (ответные) точки данных A, B, C, D, E, и мы хотим провести линию через точки. Это простая проблема для иллюстрации вопроса, но она может быть распространена и на более высокие измерения. Постановка задачи Текущее наилучшее соответствие или...

regression linear fitting cost-maximization

14

Train vs Test Error Gap и его связь с переоснащением: согласование противоречивых советов

Там, кажется, есть противоречивый совет о том, как обрабатывать сравнение поезда с ошибкой теста, особенно когда есть разрыв между ними. Кажется, есть две школы мысли, которые кажутся мне противоречивыми. Я ищу, чтобы понять, как совместить два (или понять, что мне здесь не хватает). Мысль № 1:...

cross-validation overfitting

13

Почему среднее арифметическое меньше среднего по логарифмически нормальному распределению?

Итак, у меня есть случайный процесс генерирования лог-нормально распределенных случайных величин . Вот соответствующая функция плотности вероятности:XXX Я хотел оценить распределение нескольких моментов этого исходного распределения, скажем, 1-го момента: среднее арифметическое. Для этого 10000 раз...

estimation bias fitting lognormal moments

13

Аддитивная ошибка или мультипликативная ошибка?

Я относительно новичок в статистике и был бы признателен за помощь в понимании этого вопроса. В моей области есть широко используемая модель вида: пT= Pо( VT)αпTзнак равнопо(ВT)αP_t = P_o(V_t)^\alpha Когда люди подгоняют модель к данным, они обычно линеаризуют ее и соответствуют следующим журнал(...

modeling model error curve-fitting measurement-error

13

AIC / BIC: для скольких параметров нужна перестановка?

Допустим, у меня проблема с выбором модели, и я пытаюсь использовать AIC или BIC для оценки моделей. Это просто для моделей, которые имеют некоторое число вещественных параметров.kkk Однако что, если одна из наших моделей (например, модель Мэллова ) имеет перестановку плюс некоторые...

modeling maximum-likelihood aic fitting bic

13

Почему существуют большие коэффициенты для полинома высшего порядка?

В книге Бишопа по машинному обучению обсуждается проблема подгонки полиномиальной функции к набору точек данных. Пусть M - порядок подогнанного многочлена. Это утверждает, что Мы видим, что с увеличением M величина коэффициентов обычно становится больше. В частности, для полинома M = 9 коэффициенты...

regression least-squares curve-fitting polynomial

13

Приводят ли коррелированные входные данные к переоснащению нейронными сетями?

По моему мнению, коррелированные входные данные должны привести к переоснащению в нейронных сетях, потому что сеть узнает корреляцию, например, шум в данных. Это...

correlation neural-networks overfitting

13

Предотвращение перенастройки LSTM на небольшой набор данных

Я моделирую 15000 твитов для прогнозирования настроений, используя однослойный LSTM со 128 скрытыми единицами, используя word2vec-подобное представление с 80 измерениями. Я получаю точность снижения (38% со случайным = 20%) после 1 эпохи. Большее количество тренировок приводит к тому, что точность...

deep-learning regularization overfitting lstm

13

Расчет вероятности от RMSE

У меня есть модель для прогнозирования траектории (х как функция времени) с несколькими параметрами. В настоящий момент я вычисляю среднеквадратичную ошибку (RMSE) между прогнозируемой траекторией и экспериментально записанной траекторией. В настоящее время я минимизирую эту разницу (RMSE),...

maximum-likelihood curve-fitting

13

ARIMA против ARMA на дифференцированной серии

В R (2.15.2) я однажды установил ARIMA (3,1,3) для временного ряда и один раз ARMA (3,3) для разностных временных рядов. Установленные параметры отличаются, что я приписал методу подбора в ARIMA. Кроме того, подгонка ARIMA (3,0,3) к тем же данным, что и ARMA (3,3), не приведет к идентичным...

r time-series arima fitting arma

12

Можно ли (теоретически) обучить нейронную сеть с меньшим количеством тренировочных выборок, чем весами?

Прежде всего: я знаю, что для обучения нейронной сети нет общего количества выборок. Это зависит от слишком многих факторов, таких как сложность задачи, шум в данных и так далее. И чем больше у меня будет обучающих образцов, тем лучше будет моя сеть. Но мне было интересно: возможно ли теоретически...

neural-networks overfitting underdetermined