Вопросы с тегом «statistics»

106
Среднее геометрическое: есть ли встроенный?

Я пытался найти встроенную функцию для среднего геометрического, но не смог. (Очевидно, что встроенный модуль не спасет меня в любое время при работе в оболочке, и я не подозреваю, что есть какая-либо разница в точности; для скриптов я стараюсь использовать встроенные модули как можно чаще, где...

102
Статистика браузера по JavaScript отключена [закрыто]

Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Stack Overflow. Закрыт 3 года назад . Уточните этот вопрос Мне сложно собирать общедоступную статистику о...

101
Как использовать функцию «развертки»

Когда я смотрю на исходный код пакетов R, я вижу, что функция sweepиспользуется довольно часто. Иногда он используется, когда было бы достаточно более простой функции (например, apply), в других случаях невозможно точно знать, что он делает, не потратив достаточное количество времени на пошаговое...

98
Как удалить выбросы из набора данных

У меня есть многомерные данные о красоте и возрастах. Возраст варьируется от 20 до 40 с интервалом 2 (20, 22, 24 .... 40), и для каждой записи данных им дается возраст и оценка красоты от 1 до 5. Когда я строю прямоугольные диаграммы этих данных (возраст по оси X, оценки красоты по оси Y), за...

97
Таблица частот для одной переменной

Последний вопрос новичков, панд на день: как мне создать таблицу для одной серии? Например: my_series = pandas.Series([1,2,2,3,3,3]) pandas.magical_frequency_function( my_series ) >> { 1 : 1, 2 : 2, 3 : 3 } Много поисков в Google привело меня к Series.describe () и pandas.crosstabs, но ни...

94
Почему в покере с гибким планированием используется серия Фибоначчи? [закрыто]

Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Stack Overflow. Закрыт 6 лет назад . Уточните этот вопрос При оценке относительного размера...

92
Python быстрее и легче C ++? [закрыто]

В настоящее время этот вопрос не подходит для нашего формата вопросов и ответов. Мы ожидаем, что ответы будут подтверждены фактами, ссылками или опытом, но этот вопрос, скорее всего, потребует дебатов, аргументов, опросов или расширенного обсуждения. Если вы считаете, что этот вопрос можно...

92
Как рассчитать r-квадрат с помощью Python и Numpy?

Я использую Python и Numpy для вычисления наиболее подходящего полинома произвольной степени. Я передаю список значений x, значений y и степени полинома, который мне нужен (линейный, квадратичный и т. Д.). Это много работает, но я также хочу вычислить r (коэффициент корреляции) и r-квадрат...

91
Вычислить среднее и стандартное отклонение от вектора выборок на C ++ с помощью Boost

Есть ли способ вычислить среднее значение и стандартное отклонение для вектора, содержащего образцы, с помощью Boost ? Или надо создать аккумулятор и подать в него вектор?...

91
Какую статистику коммитов Git легко получить

Раньше мне нравилась способность TortoiseSvn генерировать простую статистику фиксации для заданного репозитория SVN. Мне интересно, что доступно в Git, и меня особенно интересуют: Количество коммитов на пользователя Количество строк, измененных на пользователя активность во времени (например,...

91
Что именно делает numpy.exp ()? [закрыто]

Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Stack Overflow. Закрыт 5 лет назад . Уточните этот вопрос Я очень смущен тем, что на самом деле делает...

88
Есть ли для Scala хорошая математическая / статистическая библиотека? [закрыто]

Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Stack Overflow. Закрыт 2 года назад . Уточните этот вопрос Я ищу хорошую библиотеку с открытым исходным...

88
Как построить кривую ROC на Python

Я пытаюсь построить кривую ROC, чтобы оценить точность модели прогнозирования, которую я разработал на Python с использованием пакетов логистической регрессии. Я вычислил как истинно положительный, так и ложный положительный результат; однако я не могу понять, как правильно построить график,...

87
График квантиля-квантиля с использованием SciPy

Как бы вы создали qq-график с помощью Python? Предполагая, что у вас есть большой набор измерений и вы используете какую-то функцию построения графиков, которая принимает значения XY в качестве входных данных. Функция должна строить квантили измерений против соответствующих квантилей некоторого...

87
Как эффективно рассчитать текущее стандартное отклонение?

У меня есть массив списков чисел, например: [0] (0.01, 0.01, 0.02, 0.04, 0.03) [1] (0.00, 0.02, 0.02, 0.03, 0.02) [2] (0.01, 0.02, 0.02, 0.03, 0.02) ... [n] (0.01, 0.00, 0.01, 0.05, 0.03) Я хотел бы эффективно вычислить среднее значение и стандартное отклонение по каждому индексу списка по всем...

86
«Онлайн» (итератор) алгоритмы для оценки статистической медианы, режима, асимметрии, эксцесса?

Есть ли алгоритм для оценки медианы, режима, асимметрии и / или эксцесса набора значений, но он НЕ требует одновременного сохранения всех значений в памяти? Я хочу посчитать основную статистику: среднее: среднее арифметическое дисперсия: среднее квадратов отклонений от среднего стандартное...

9
Как я могу использовать команду `td` из пакета` tempdisagg` для дезагрегации ежемесячных данных по ежедневной частоте?

У меня есть данные о частоте за месяц, которые я пытаюсь разбить на данные о частоте за день. Поэтому я использую tdкоманду из tempdisaggпакета в R, используя код ниже: dat=ts(data[,2]) result=td(dat~1, conversion = "average", to = "day", method = "chow-lin-maxlog") Тогда я получаю следующее...