Вопросы с тегом «discrete-data»

Относится к данным, сгенерированным из распределения, имеющего счетное пространство выборок. Метка дискретных данных может охватывать категориальные данные, будь то номинальные (например, распределение расы в выборке людей) или порядковые (например, социально-экономический статус), или фактические дискретные случайные вариации, такие как набор счетчиков событий (например, количество ошибок на странице текста). Однако дискретные данные не обязательно должны быть целочисленными.

33
Кластеризация набора данных с дискретными и непрерывными переменными

У меня есть набор данных X, который имеет 10 измерений, 4 из которых являются дискретными значениями. Фактически, эти 4 дискретные переменные являются порядковыми, то есть более высокое значение подразумевает более высокую / лучшую семантику. 2 из этих дискретных переменных являются категориальными...

29
Справедлив ли критерий Колмогорова-Смирнова с дискретными распределениями?

Я сравниваю пример и проверяю, распространяется ли он как какой-то дискретный дистрибутив. Однако я не уверен, что Колмогоров-Смирнов подает заявку. Википедия, кажется, подразумевает, что это не так. Если это не так, как я могу проверить распределение...

26
Прогнозирование с использованием как непрерывных, так и категориальных функций

Некоторые методы прогнозирующего моделирования больше предназначены для обработки непрерывных предикторов, а другие - для обработки категориальных или дискретных переменных. Конечно, существуют методы преобразования одного типа в другой (дискретизация, фиктивные переменные и т. Д.). Однако...

24
Колмогоров-Смирнов с дискретными данными: Как правильно использовать dgof :: ks.test в R?

Вопросы для начинающих: Я хочу проверить, поступают ли два дискретных набора данных из одного распределения. Мне предложили пробу Колмогорова-Смирнова. Коновер ( Практическая непараметрическая статистика , 3d), кажется, говорит, что для этой цели можно использовать тест Колмогорова-Смирнова, но его...

22
Отбрасывание одного из столбцов при использовании быстрого кодирования

Насколько я понимаю, в машинном обучении может возникнуть проблема, если ваш набор данных имеет сильно коррелированные функции, поскольку они эффективно кодируют одну и ту же информацию. Недавно кто-то указал, что когда вы выполняете однократное кодирование для категориальной переменной, вы...

21
У этого дискретного распределения есть имя?

У этого дискретного распределения есть имя? Для i∈1...Ni∈1...Ni \in 1...N f(i)=1N∑Nj=i1jf(i)=1N∑j=iN1jf(i) = \frac{1}{N} \sum_{j = i}^N \frac{1}{j} Я наткнулся на этот дистрибутив из следующего: У меня есть список из элементов, ранжированных по какой-либо служебной функции. Я хочу случайным образом...

18
Основные вопросы об анализе выживания в дискретном времени

Я пытаюсь провести анализ выживания с дискретным временем, используя модель логистической регрессии, и я не уверен, что полностью понимаю процесс. Я был бы очень признателен за помощь с несколькими основными вопросами. Вот установка: Я смотрю на членство в группе в течение пятилетнего периода...

18
Обнаружение аномалий с фиктивными характеристиками (и другими дискретными / категориальными характеристиками)

ТЛ; др Каков рекомендуемый способ обработки discreteданных при обнаружении аномалий? Каков рекомендуемый способ обработки categoricalданных при обнаружении аномалий? Этот ответ предлагает использовать дискретные данные для фильтрации результатов. Возможно, замените значение категории шансом...

17
Как подобрать дискретное распределение для подсчета данных?

У меня есть следующая гистограмма данных подсчета. И я хотел бы приспособить к этому дискретное распределение. Я не уверен, как я должен идти об этом. Должен ли я сначала наложить на гистограмму дискретное распределение, скажем, отрицательное биномиальное распределение, чтобы получить параметры...

13
Формула вероятности для многомерного распределения Бернулли

Мне нужна формула для вероятности события в n-вариативном распределении Бернулли X∈{0,1}nX∈{0,1}nX\in\{0,1\}^n с заданными вероятностями P(Xi=1)=piP(Xi=1)=piP(X_i=1)=p_i для одного элемента и для пар элементов P(Xi=1∧Xj=1)=pijP(Xi=1∧Xj=1)=pijP(X_i=1 \wedge X_j=1)=p_{ij} . Эквивалентное я мог бы...

13
Гамильтониан Монте-Карло и пространства с дискретными параметрами

Я только начал строить модели в Стэн ; Чтобы познакомиться с этим инструментом, я прорабатываю некоторые из упражнений в Байесовском анализе данных (2-е изд.). В Waterbuck упражнение предполагает , что данные , с ( N , & thetas ; ) неизвестной. Поскольку гамильтониан Монте-Карло не допускает...

11
Визуализировать двумерное биномиальное распределение

Вопрос: как выглядит двумерное биномиальное распределение в трехмерном пространстве? Ниже приведена конкретная функция, которую я хотел бы визуализировать для различных значений параметров; а именно , и .nnnp1p1p_{1}p2p2p_{2}...

11
Оптимальное биннинг по отношению к заданной переменной отклика

Я ищу оптимальный метод биннинга (дискретизации) непрерывной переменной по отношению к заданной ответной (целевой) двоичной переменной и с максимальным количеством интервалов в качестве параметра. пример: у меня есть набор наблюдений за людьми с переменными "высота" (цифра непрерывная) и...

11
Как называется это дискретное распределение (рекурсивное разностное уравнение), которое я получил?

Я наткнулся на этот дистрибутив в компьютерной игре и хотел узнать больше о ее поведении. Это связано с решением относительно того, должно ли происходить определенное событие после определенного количества действий игрока. Подробности за этим не имеют значения. Это кажется применимым к другим...

11
Свойства дискретной случайной величины

Мой курс статистики только что научил меня, что дискретная случайная величина имеет конечное число опций ... Я этого не осознавал. Я бы подумал, как набор целых чисел, это может быть бесконечным. Поиск и проверка нескольких веб-страниц, в том числе нескольких из университетских курсов, не смогли...

11
Определение оптимальной дискретизации данных из непрерывного распределения

Предположим, у вас есть набор данных из непрерывного распределения с плотностью поддерживаемой на которая неизвестна, но довольно велико, поэтому плотность ядра (например) оценка, , довольно точна. Для конкретного приложения мне нужно преобразовать наблюдаемые данные в конечное число категорий,...

11
Как проверить, являются ли мои данные дискретными или непрерывными?

Мне кажется, что для выбора правильных статистических инструментов я должен сначала определить, является ли мой набор данных дискретным или непрерывным. Не могли бы вы научить меня, как я могу проверить, являются ли данные дискретными или непрерывными с помощью...

10
Распределение по отсортированным спискам

Скажем, у нас есть упорядоченный список товаров [a, b, c, ... x, y, z, ...] Я ищу семейство дистрибутивов с поддержкой в ​​списке выше, управляемых некоторым параметром альфа, чтобы: При альфа = 0 он присваивает вероятность 1 первому элементу, a выше, а 0 остальным. То есть, если мы сделаем выборку...

9
Дискретные данные и альтернативы PCA

У меня есть набор данных с дискретными (порядковыми, меристическими и номинальными) переменными, описывающими морфологические признаки крыла нескольких близкородственных видов насекомых. То, что я хочу сделать, - это провести какой-то анализ, который бы дал мне визуальное представление о сходстве...