Вопросы с тегом «data-streams»

20
Сокращение использования пространства st-подключения с несколькими проходами?

Предположим, что граф с вершинами представлен как поток из ребер, но допускается несколько проходов по потоку.н мграммGGNnnмmm Моника Раух Хензингер, Прабхакар Рагхаван и Шридар Раджагопалан отметили, что пространство необходимо, чтобы определить, существует ли путь между двумя заданными вершинами...

19
Алгоритм для 'k' 'наиболее часто встречающихся чисел

Я искал наиболее эффективный (потоковый ??) алгоритм, который сообщает мне «k» наиболее часто встречающихся элементов в потоке данных в любой момент времени. Этот пост: «Разделяй и властвуй» алгоритмы потока данных заинтересовали меня. Например, предположим, что есть числа:...

18
Требования к хранилищу для медианного выбора (двухпроходные алгоритмы)

В классической статье Манро и Патерсон изучают проблему того, сколько памяти требуется алгоритму для нахождения медианы в случайно отсортированном массиве. В частности, они ориентированы на следующую модель: ввод читается слева направо в течение числа P раз. Показано, что O ( n12...

14
Какой предел сжатия данных без потерь? (если такой предел существует)

В последнее время я имел дело с алгоритмами, связанными со сжатием, и мне было интересно, какая наилучшая степень сжатия может быть достигнута при сжатии данных без потерь. До сих пор единственным источником, который я мог найти по этой теме, была Википедия: Сжатие без потерь оцифрованных данных,...

12
Алгоритмы потока данных «разделяй и властвуй»

Какие существуют полезные алгоритмы, которые работают с огромными потоками данных, и их результаты довольно малы, и можно вычислить результат для смеси двух потоков, каким-то образом объединив их результаты? Я могу назвать несколько: Очевидные вещи, как сумма, мин, макс, кол, топ-К и т. Д...

11
Границы аппроксимирующих частотных моментов

Пусть - последовательность целых чисел, где каждый . Для , пусть, - й момент частоты определяется какa j ∈ { 1 , 2 , … , n } i ∈ { 1 , 2 , … , n } m i = | { j : a j = i } | Кa1,a2,…,ama1,a2,…,ama_1, a_2,\dotsc, a_maj∈{1,2,…,n}aj∈{1,2,…,n}a_j \in \{1,2,\dotsc,n\}i∈{1,2,…,n}i∈{1,2,…,n}i \in...

9
Непрерывная кластеризация

Поэтому у меня возникла проблема, связанная с кластеризацией с живыми непрерывно потоковыми данными. Поскольку у меня постоянно растущий набор данных, я не уверен, что это лучший способ запустить эффективную и действенную кластеризацию. Я придумал несколько возможных решений, в том числе: Установка...