Вопросы с тегом «clustering»

18
Можно ли проверить, является ли вычислимое число рациональным или целым?

Можно ли алгоритмически проверить, является ли вычисляемое число рациональным или целым? Другими словами, возможно ли для библиотеки, которая реализует вычислимые числа, предоставлять функции isIntegerили isRational? Я предполагаю, что это невозможно, и что это как-то связано с тем, что невозможно...

12
алгоритм кластеризации для безразмерных данных

у меня есть набор данных из тысяч точек и средство измерения расстояния между любыми двумя точками, но точки данных не имеют размерности. я хочу алгоритм, чтобы найти кластерные центры в этом наборе данных. Я полагаю, что поскольку данные не имеют измерений, центр кластера может состоять из...

12
Евклидово-квадратный макс-разрез в низких размерах

Пусть x1,…,xnx1,…,xnx_1, \ldots, x_n - точки на плоскости R2R2\mathbb{R}^2 . Рассмотрим полный граф с точками в виде вершин и весами ребер . Вы всегда можете найти вес, который составляет не менее \ 2 2 от общего веса? Если нет, то какая константа должна заменить \ frac 2 3 ?2∥xi−xj∥2‖xi−xj‖2\|x_i...

11
Кластеризационные формализации, отличные от K-средних для разделяемых данных

Данные реального мира иногда имеют естественное количество кластеров (попытка сгруппировать их в число кластеров, меньших, чем какое-либо волшебство k, приведет к значительному увеличению стоимости кластеризации). Сегодня я посетил лекцию доктора Адама Мейерсона, и он назвал этот тип данных...

9
Непрерывная кластеризация

Поэтому у меня возникла проблема, связанная с кластеризацией с живыми непрерывно потоковыми данными. Поскольку у меня постоянно растущий набор данных, я не уверен, что это лучший способ запустить эффективную и действенную кластеризацию. Я придумал несколько возможных решений, в том числе: Установка...

9
Разделение множества точек на два оптимальных подмножества

Я хочу разделить набор точек на два подмножества одинакового размера так, чтобы сумма квадратов внутри кластера была минимальной. Можно предположить, что точки находятся в двумерном евклидовом пространстве. Я надеюсь на что-то более быстрое, чем обычный алгоритм кластеризации k-средних, учитывая,...

9
Нахождение похожих векторов в субквадратичном времени

Позволять d:{0,1}k×{0,1}k→Rd:{0,1}k×{0,1}k→Rd:\{0,1\}^k\times \{0,1\}^k \to \mathbb{R}быть функцией, которую мы называем функцией подобия . Примерами функции подобия являются косинусное расстояние,l2l2l_2 норма, расстояние Хэмминга, сходство Жакара и т. д. Рассматривать nnn двоичные векторы длины...