Вопросы с тегом «data-analysis»

20
Алгоритмы для обобщенной задачи присваивания «многие ко многим»

Кажется, я не могу найти какую-либо литературу по алгоритмам, которые могут быть использованы для решения обобщенной задачи назначения (GAP) «многие ко многим», то есть моделей, в которых не только можно назначить большее количество задач одному агенту, но также можно назначить несколько агентов....

13
Лучшие практики для хранения данных иерархического моделирования

TL, DR Какова общепринятая практика в научных вычислительных кругах для хранения большого количества иерархически структурированных данных? Например, SQL плохо работает с большими разреженными матрицами. Есть ли хороший инструмент для структурирования, складирования и анализа таких данных? Что...

11
Самый быстрый алгоритм PCA для многомерных данных

Я хотел бы выполнить PCA для набора данных, состоящего из приблизительно 40 000 выборок, каждая из которых отображает около 10 000 функций. Использование функции Matlab princomp последовательно занимает более получаса, после чего я завершаю процесс. Я хотел бы найти реализацию / алгоритм, который...

11
Ограничения Pandas и их альтернативы в Python

Я где-то читал, что Pandas был впервые разработан для финансового мира, по крайней мере, особенно для естественных наук (физика, биология и т. Д.), Так есть ли подобный пакет анализа данных Python, более «ориентированный на естественные науки»? Я только начал использовать Pandas и уже столкнулся с...

10
Соответствие аналогичным предметам из набора

Я пытаюсь сопоставить предметы. Учитывая набор из предметов, я могу оценить по шкале от 0 до 100, насколько они похожи друг на друга. Например, если элемент n 1 является молоком, а элемент n 2 также является молоком, то сходство между n 1 и n 2 будет 100%. Если n 3 является содой, то сходство между...

9
В чем разница между вычислительной наукой и наукой о данных? [закрыто]

Закрыто . Этот вопрос должен быть более сфокусированным . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он был сосредоточен только на одной проблеме, отредактировав этот пост . Закрыто 3 года назад . Предыстория: моя докторская степень была в области...