Вопросы с тегом «compositional-data»

18
Как выполнить изометрическое логарифмическое преобразование

У меня есть данные о поведении при движении (время, проведенное во сне, сидячий образ жизни и выполнение физических упражнений), которое составляет приблизительно 24 (как в часах в день). Я хочу создать переменную, которая фиксирует относительное время, затрачиваемое на каждое из этих поведений, -...

16
Каковы некоторые распределения по вероятностному симплексу?

Пусть - вероятностный симплекс размерности K - 1 , т. Е. X ∈ Δ K таково, что x i ≥ 0 и ∑ i x i = 1 .ΔKΔK\Delta_{K}K−1K−1K-1x∈ΔKx∈ΔKx \in \Delta_{K}xi≥0xi≥0x_i \ge 0∑ixi=1∑ixi=1\sum_i x_i = 1 Какие дистрибутивы , которые часто (или хорошо известны, или определенные в прошлом) над...

13
Нужно ли отбрасывать переменные, которые коррелированы / коллинеарны перед запуском kmeans?

Я использую kmeans для определения групп клиентов. У меня есть около 100 переменных для определения кластеров. Каждая из этих переменных представляет собой процент расходов клиента на категорию. Итак, если у меня есть 100 категорий, у меня есть эти 100 переменных, так что сумма этих переменных...

13
Могу ли я использовать CLR (центрированное преобразование логарифмического отношения) для подготовки данных для PCA?

Я использую скрипт. Это для основных записей. У меня есть датафрейм, который показывает различные элементные композиции в столбцах на заданной глубине (в первом столбце). Я хочу провести с ним PCA, и меня не устраивает метод стандартизации, который я должен выбрать. Кто-нибудь из вас использовал...

11
Кластеризация очень искаженных, подсчитываемых данных: есть ли какие-либо предложения (трансформировать и т.д.)

Основная проблема Вот моя основная проблема: я пытаюсь кластеризовать набор данных, содержащий некоторые очень искаженные переменные со счетчиками. Переменные содержат много нулей и поэтому не очень информативны для моей процедуры кластеризации, которая, вероятно, будет алгоритмом k-средних....

10
Какой тест для сравнения состава сообщества?

Надеюсь, что этот вопрос новичка является правильным вопросом для этого сайта: Предположим, я хотел бы сравнить состав экологических сообществ на двух участках A, B. Я знаю, что на всех трех участках есть собаки, кошки, коровы и птицы, поэтому я проверяю их численность на каждом участке (на самом...

10
Почему нельзя делать корреляцию Пирсона по данным о пропорциях?

Онлайн модуль, который я изучаю, утверждает, что никогда не следует использовать корреляцию Пирсона с данными о пропорциях. Почему бы нет? Или, если это иногда хорошо или всегда хорошо,...