Вопросы с тегом «statistics»

Подумайте, не лучше ли задать ваш вопрос на https://stats.stackexchange.com. Статистика - это математическое исследование использования вероятности для вывода характеристик населения из ограниченного числа выборок или наблюдений.

546
Космические лучи: какова вероятность того, что они повлияют на программу?

Я снова был в обзоре проекта и столкнулся с утверждением, что вероятность того или иного сценария «меньше, чем риск космических лучей», влияющих на программу, и мне пришло в голову, что я понятия не имею, что это такое вероятность есть. «Поскольку 2 -128 - это 1 из...

458
Как подсчитать общее количество строк, измененных конкретным автором в репозитории Git?

Есть ли команда, которую я могу вызвать, которая будет подсчитывать количество строк, измененных конкретным автором в репозитории Git? Я знаю, что должны быть способы подсчета количества коммитов, как это делает Github для своего графика...

392
Есть ли встроенная функция для нахождения режима?

В R mean()и median()есть стандартные функции, которые делают то, что вы ожидаете. mode()сообщает вам режим внутренней памяти объекта, а не значение, которое встречается чаще всего в его аргументе. Но есть ли стандартная библиотечная функция, которая реализует статистический режим для вектора (или...

373
Генерация статистики из репозитория Git

Я ищу несколько хороших инструментов / скриптов, которые позволят мне сгенерировать немного статистики из репозитория git. Я видел эту функцию на некоторых сайтах размещения кода, и они содержали такую ​​информацию, как ... совершает за автора совершает в день / неделю / год / и т. д. строки кода с...

214
Как рассчитать процентили с помощью python / numpy?

Есть ли удобный способ для вычисления процентилей для последовательности или одномерного массива numpy? Я ищу что-то похожее на функцию процентиля Excel. Я посмотрел статистический справочник NumPy и не смог его найти. Все, что я мог найти, это медиана (50-й процентиль), но не что-то более...

208
Простой способ рассчитать медиану с MySQL

Какой самый простой (и, надеюсь, не слишком медленный) способ расчета медианы с MySQL? Я использовал AVG(x)для нахождения среднего значения, но мне трудно найти простой способ вычисления медианы. Сейчас я возвращаю все строки в PHP, выполняю сортировку, а затем выбираю среднюю строку, но наверняка...

205
Как нормализовать массив в NumPy?

Я хотел бы иметь норму одного массива NumPy. Более конкретно, я ищу эквивалентную версию этой функции def normalize(v): norm = np.linalg.norm(v) if norm == 0: return v return v / norm Есть ли что-то подобное в skearnили numpy? Эта функция работает в ситуации, когда vесть вектор...

191
np.mean () против np.average () в Python NumPy?

Я замечаю что In [30]: np.mean([1, 2, 3]) Out[30]: 2.0 In [31]: np.average([1, 2, 3]) Out[31]: 2.0 Однако должны быть некоторые различия, поскольку в конце концов они представляют собой две разные функции. Каковы различия между...

186
Рабочий процесс для статистического анализа и написания отчетов

Есть ли у кого-нибудь мудрость в рабочих процессах для анализа данных, связанных с написанием пользовательских отчетов? Вариант использования в основном такой: Клиент заказывает отчет, в котором используется анализ данных, например, оценка численности населения и соответствующие карты для...

139
Подгонять эмпирическое распределение к теоретическому с помощью Scipy (Python)?

ВВЕДЕНИЕ : У меня есть список из более чем 30000 целочисленных значений в диапазоне от 0 до 47 включительно, например, [0,0,0,0,..,1,1,1,1,...,2,2,2,2,...,47,47,47,...]взятых из некоторого непрерывного распределения. Значения в списке не обязательно в порядке, но порядок не имеет значения для этой...

138
Экспорт данных из инструмента разработчика Chrome

Анализ сети Chrome при загрузке страницы Я хотел бы экспортировать эти данные в Microsoft Excel, чтобы у меня был список похожих данных при загрузке в разное время. Загрузка страницы за один раз не особенно мне говорит, особенно если я хочу сравнить страницы. Возможно ли это сделать с помощью...

130
Как сделать паузу выполнения, сон, подождать X секунд в R?

Как сделать паузу в сценарии R на указанное количество секунд или миллисекунд? Во многих языках есть sleepфункция, но она ?sleepссылается на набор данных. И так ?pauseи ?waitне существует. Предполагаемое назначение - самосинхронизация анимации. Желаемое решение работает без запроса...

129
Множественная линейная регрессия в Python

Кажется, я не могу найти библиотеки Python, которые выполняют множественную регрессию. Единственное, что я нахожу, - это простая регрессия. Мне нужно регрессировать мою зависимую переменную (y) по нескольким независимым переменным (x1, x2, x3 и т. Д.). Например, с этими данными: print 'y x1 x2 x3...

122
Статистика: комбинации в Python

Мне нужно вычислить combinatorials (NCR) в Python , но не может найти функцию , чтобы сделать это в math, numpyили stat библиотеках. Что-то вроде функции типа: comb = calculate_combinations(n, r) Мне нужно количество возможных комбинаций, а не фактические комбинации, поэтому...

114
Алгоритм скользящей медианы в C

В настоящее время я работаю над алгоритмом для реализации скользящего медианного фильтра (аналогичного фильтру скользящего среднего) в C. Из моего поиска в литературе, похоже, есть два достаточно эффективных способа сделать это. Первый - отсортировать начальное окно значений, затем выполнить...

109
Вычислить доверительный интервал из выборочных данных

У меня есть образцы данных, для которых я хотел бы вычислить доверительный интервал, предполагая нормальное распределение. Я нашел и установил пакеты numpy и scipy и получил numpy для возврата среднего и стандартного отклонения (numpy.mean (data) с данными в виде списка). Мы будем очень благодарны...