Статистика и большие данные

9

Пространство данных, пространство переменных, пространство наблюдения, пространство модели (например, в линейной регрессии)

Предположим, у нас есть матрица данных , которая является n- by- , и вектор метки , который является by-one. Здесь каждая строка матрицы является наблюдением, а каждый столбец соответствует измерению / переменной. (предположим, что )XX\mathbf{X}nnnУ нpppYYYnnnn>pn>pn>p Тогда что data space,...

9

В чем разница между этими двумя тестами Бреуша-язычества?

Используя R на некоторых данных и пытаясь определить , являются ли мои данные гетероскедастичными, я нашел две реализации теста Бреуша -Пагана: bptest (package lmtest) и ncvTest (package car). Однако они дают разные результаты. Какая разница между двумя? Когда вы должны использовать один или...

r regression heteroscedasticity assumptions breusch-pagan

9

Что такое оператор в правиле цепочки, получая градиент однослойной нейронной сети по ее входам?

Проблема в следующем: Получите градиент относительно входного слоя для нейронной сети с одним скрытым слоем, используя сигмоид для ввода -> скрытый, softmax для скрытого -> выход, с перекрестной потерей энтропии. Я могу пройти через большую часть деривации, используя правило цепочки, но я не...

neural-networks gradient

9

Присвоение большего веса более поздним наблюдениям регрессии

Как мне придать больший вес более поздним наблюдениям в R? Я предполагаю, что это часто задаваемый вопрос или желание, но мне трудно понять, как именно это реализовать. Я пытался много искать для этого, но я не могу найти хороший практический пример. В моем примере у меня будет большой набор данных...

r time-series regression random-forest

9

Почему информационный критерий (не скорректированный

В моделях временных рядов, таких как ARMA-GARCH, для выбора подходящего лага или порядка модели используются разные информационные критерии, такие как AIC, BIC, SIC и т. Д. Мой вопрос очень прост, почему мы не используем скорректированный чтобы выбрать подходящую модель? Мы можем выбрать модель,...

regression time-series model-selection aic bic

9

Реальные примеры неэффективного генератора случайных чисел

Все мы знаем, что генераторы случайных чисел в компьютерах не генерируют истинные случайные числа, а вместо этого генерируют псевдослучайные числа. Кроме того, некоторые RNG лучше, чем другие, а некоторые реализованы лучше, чем другие. Каковы некоторые примеры того, когда использовался плохой ГСЧ...

random-generation history

9

Алгебраические классификаторы, больше информации?

Я прочитал алгебраические классификаторы: общий подход к быстрой перекрестной проверке, онлайн-обучению и параллельному обучению, и был поражен эффективностью производных алгоритмов. Тем не менее, кажется, что помимо наивных байесовских (и GBM), не так много алгоритмов, адаптированных к этой...

cross-validation references random-forest computational-statistics naive-bayes

9

Реальные примеры различий между независимостью и корреляцией

Хорошо известно, что независимость случайных величин подразумевает нулевую корреляцию, но нулевая корреляция не обязательно подразумевает независимость. Я наткнулся на множество математических примеров, демонстрирующих зависимость, несмотря на нулевую корреляцию. Есть ли реальные примеры,...

correlation independence intuition

9

1D свертка в нейронных сетях

Я понимаю, как работает свертка, но я не понимаю, как одномерные свертки применяются к двумерным данным. В этом примере вы можете увидеть 2D свертку в 2D данных. Но как было бы, если бы была 1D свертка? Просто 1D ядро скользит таким же образом? А если шага было 2?...

conv-neural-network

9

Прогнозирование доверия нейронной сети

Предположим, я хочу обучить глубокую нейронную сеть выполнять классификацию или регрессию, но я хочу знать, насколько достоверным будет прогноз. Как я мог этого добиться? Моя идея состоит в том, чтобы вычислить кросс-энтропию для каждого тренировочного материала, основываясь на его прогнозирующей...

machine-learning neural-networks

9

Помощь в максимизации ожидания от бумаги: как включить предварительное распространение?

Вопрос основан на статье под названием «Восстановление изображений в диффузной оптической томографии с использованием связанной излучательной транспортно-диффузионной модели». Ссылка на скачивание Авторы применяют EM-алгоритм с разреженности неизвестного вектора \ mu для оценки пикселей...

self-study bayesian maximum-likelihood expectation-maximization moving-average

9

Сколько данных для глубокого изучения?

Я изучаю глубокое обучение (особенно CNN) и то, как обычно требуется очень много данных для предотвращения переобучения. Однако мне также сказали, что чем больше емкость / больше параметров в модели, тем больше данных требуется для предотвращения переобучения. Поэтому мой вопрос: почему вы не...

machine-learning neural-networks deep-learning conv-neural-network

9

Когда можно написать «мы предположили нормальное распределение» эмпирического измерения?

В преподавании прикладных дисциплин, таких как медицина, заложено, что измерения биомедицинских величин в популяции следуют нормальной «кривой колокола». Поиск из Google в строке «мы предполагали , нормальное распределение» возвращает результатов! Они звучат так: «учитывая небольшое количество...

normal-distribution assumptions normality-assumption lognormal

9

Что такое хорошая современная книга / ресурс по продвинутым экспериментам?

Я ищу ресурсы (не обязательно одну книгу), которые бы охватывали некоторые из наиболее сложных случаев экспериментального проектирования и статистического анализа. Некоторые из случаев, которые я хотел бы охватить: 1. Случаи, когда единицы рандомизации отличаются от единиц анализа Пример: у меня...

references experiment-design

9

Сравнение байесовских оценок

Рассмотрим квадратичную потерю , с заранее заданным \ pi (\ theta), где \ pi (\ theta) \ sim U (0,1 / 2) . Пусть f (x | \ theta) = \ theta x ^ {\ theta-1} \ mathbb {I} _ {[0,1]} (x), \ theta> 0 вероятности. Найти оценку Байеса \ delta ^ \ pi...

self-study bayesian estimation hierarchical-bayesian loss-functions

9

Что значит интегрировать по случайной мере?

В настоящее время я смотрю на статью о модели случайных эффектов процесса Дирихле, и спецификация модели выглядит следующим образом: где - параметр масштаба и является базовой мерой. Позже в статье предлагается интегрировать функцию по базовой мере например Базовая мера в процессе Дирихле - это cdf...

bayesian dirichlet-distribution dirichlet-process nonparametric-bayes measure-theory

9

На что указывает клиновидная форма графика PCA?

В своей работе по автоассоциатор для текста классификации Хинтон и Салахутдинов показал сюжет , полученный на 2-мерной LSA (который тесно связан с PCA) . Применяя PCA к совершенно другим слегка многомерным данным, я получил похожий график: (за исключением этого случая, я действительно хотел узнать,...

data-visualization pca

9

Как изменяется косинусное сходство после линейного преобразования?

Есть ли математическая связь между: косинусное сходство двух векторов и , иA Bsim(A,B)sim⁡(A,B)\operatorname{sim}(A, B)AAABBB косинусное сходство для и , неравномерно масштабированное с помощью заданной матрицы ? Здесь - заданная диагональная матрица с неравными элементами на диагонали.A...

linear-algebra cosine-similarity

9

Оценки дерева ВСЕГДА смещены?

Я делаю домашнюю работу по деревьям принятия решений, и один из вопросов, на которые я должен ответить, это «Почему оценки построены из предвзятых деревьев, и как мешки помогают уменьшить их дисперсию?». Теперь я знаю, что переоснащенные модели, как правило, имеют очень низкий уклон, потому что они...

cart bias

9

Сила леди, дегустирующая чайный эксперимент

В известном эксперименте Фишера наблюдаемый является количеством скорректированного отгаданнога чашки имеющим два виду чашки и . Обычно интересно вычислить критическую область, чтобы отвергнуть нулевую гипотезу (дама случайным образом угадывает), учитывая размер теста . Это легко сделать с помощью...

hypothesis-testing power fishers-exact