Вопросы с тегом «computational-statistics»

Относится к интерфейсу статистики и вычислений; использование алгоритмов и программного обеспечения в статистических целях.

161
Есть ли у Юлии надежда остаться в статистическом сообществе?

Я недавно прочитал сообщение от R-Bloggers, которое связывалось с этим сообщением в блоге от Джона Майлса Уайта о новом языке под названием Джулия . Джулия пользуется преимуществом компилятора, работающего точно в срок, который дает ему быстрое время выполнения и ставит его на тот же порядок...

70
Какой алгоритм я должен использовать для обнаружения аномалий на временных рядах?

Фон Я работаю в Центре сетевых операций, мы отслеживаем компьютерные системы и их производительность. Одним из ключевых показателей для мониторинга является количество посетителей \ клиентов, которые в настоящее время подключены к нашим серверам. Чтобы сделать это видимым, мы (команда Ops) собираем...

52
Excel как инструмент для статистики

Похоже, что многие люди (в том числе и я) любят проводить предварительный анализ данных в Excel. Некоторые ограничения, такие как количество строк, разрешенных в электронной таблице, являются проблемой, но в большинстве случаев не делают невозможным использование Excel для работы с данными. Тем не...

28
Статистическая концепция, объясняющая, почему у вас меньше шансов перевернуть то же количество голов, что и у хвостов, так как количество переворотов увеличивается?

Я работаю над изучением вероятности и статистики, прочитав несколько книг и написав некоторый код, и, моделируя броски монет, я заметил нечто, что показалось мне слегка противоречащим наивной интуиции. Если вы подбрасываете чистую монету раз, соотношение голов и хвостов сходится к 1 при увеличении...

27
Инструмент командной строки для расчета базовой статистики для потока значений [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто в прошлом году . Существует ли какой-либо инструмент командной строки, который принимает поток чисел (в формате ascii)...

20
Каковы правильные значения для точности и отзыва в крайних случаях?

Точность определяется как: p = true positives / (true positives + false positives) Является ли это исправить , что, как true positivesи false positivesподход 0, точность приближается к 1? Тот же вопрос для отзыва: r = true positives / (true positives + false negatives) В настоящее время я выполняю...

17
Как подобрать дискретное распределение для подсчета данных?

У меня есть следующая гистограмма данных подсчета. И я хотел бы приспособить к этому дискретное распределение. Я не уверен, как я должен идти об этом. Должен ли я сначала наложить на гистограмму дискретное распределение, скажем, отрицательное биномиальное распределение, чтобы получить параметры...

15
Эффективное обновление линейной регрессии при добавлении наблюдений и / или предикторов в R

Мне было бы интересно найти пути в R для эффективного обновления линейной модели при добавлении наблюдения или предиктора. У biglm есть возможность обновления при добавлении наблюдений, но мои данные достаточно малы, чтобы находиться в памяти (хотя у меня есть большое количество экземпляров для...

15
Чем ABC и MCMC отличаются в своих приложениях?

Насколько я понимаю, приблизительные байесовские вычисления (ABC) и цепь Маркова Монте-Карло (MCMC) имеют очень похожие цели. Ниже я опишу свое понимание этих методов и то, как я воспринимаю различия в их применении к реальным данным. Приближенное байесовское вычисление ABC состоит из выборки...

15
Используют ли некоторые из вас электронную таблицу Документов Google, чтобы вести статистическую работу и делиться ею с другими?

Я знаю, что большинство из вас, вероятно, считают, что Документы Google по-прежнему являются примитивным инструментом. Это не Matlab или R и даже не Excel. Тем не менее, я сбит с толку мощью этого веб-программного обеспечения, которое просто использует возможности браузера (и совместимо со многими...

15
Каковы некоторые важные применения генерации случайных чисел в вычислительной статистике?

Как и почему генераторы случайных чисел (ГСЧ) важны в вычислительной статистике? Я понимаю, что случайность важна при выборе выборок для многих статистических тестов, чтобы избежать смещения в отношении любой гипотезы, но есть ли другие области вычислительной статистики, где важны генераторы...

15
Какие книги предоставляют обзор вычислительной статистики в применении к информатике?

Как инженер-программист, меня интересуют такие темы, как статистические алгоритмы, интеллектуальный анализ данных, машинное обучение, байесовские сети, алгоритмы классификации, нейронные сети, цепочки Маркова, методы Монте-Карло и генерация случайных чисел. Лично мне не доставляло удовольствия...

15
Какой метод множественного сравнения использовать для модели lmer: lsmeans или glht?

Я анализирую набор данных, используя модель смешанных эффектов с одним фиксированным эффектом (условием) и двумя случайными эффектами (участник из-за дизайна объекта и пары). Модель была сгенерирована с lme4пакетом: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Затем я...

15
Как стохастический градиентный спуск может сэкономить время по сравнению со стандартным градиентным спуском?

Стандартный градиентный спуск будет вычислять градиент для всего набора обучающих данных. for i in range(nb_epochs): params_grad = evaluate_gradient(loss_function, data, params) params = params - learning_rate * params_grad Для заранее определенного числа эпох мы сначала вычисляем вектор градиента...

13
Решение замкнутой формы задачи Лассо, когда матрица данных диагональна

\newcommand{\diag}{\operatorname{diag}} У нас проблема: при условии, что: \ sum_ {я = 1} ^ nx_ix_i ^ T = \ диаг (\ sigma_1 ^ 2, ..., \ sigma_d ^ 2).minw∈Rd(1n∑i=1n(⟨w,xi⟩−yi)2+2λ||w||1),minw∈Rd(1n∑i=1n(⟨w,xi⟩−yi)2+2λ||w||1),\min_{w\in\mathbb{R}^{d}}\left( \frac{1}{n}\sum_{i=1}^{n} \left( \langle...

13
Осмысление теории статистики и приложений

Я недавно закончил со степенью магистра по медицинскому и биологическому моделированию, сопровождаемый инженерной математикой в ​​качестве фона. Несмотря на то, что моя образовательная программа включала в себя значительное количество курсов по математической статистике (список приведен ниже),...

12
Как я могу оптимизировать вычислительную эффективность при многократной подгонке сложной модели к большому набору данных?

У меня проблемы с производительностью при использовании MCMCglmmпакета в R для запуска модели смешанных эффектов. Код выглядит так: MC1<-MCMCglmm(bull~1,random=~school,data=dt,family="categorical" , prior=list(R=list(V=1,fix=1), G=list(G1=list(V=1, nu=0))) , slice=T, nitt=iter, ,burnin=burn,...

11
Что это за «максимальный коэффициент корреляции»?

Типичная статистика обработки изображений - это использование текстурных характеристик Харалика , которых 14. Я задаюсь вопросом о 14-й из этих функций: учитывая карту смежности (которую мы можем просто посмотреть на эмпирическое распределение двух целых чисел ), она определяется как: квадратный...

11
Найти сопоставимую контрольную группу для группы лечения?

У меня есть группа лечения размером 30 (30 школ в Калифорнии), которая использовала дополнительное математическое программное обеспечение. В простом анализе я хотел бы сравнить средний рост математики учащихся между нашей группой лечения и сопоставимой контрольной группой. Есть много школ в CA,...