Количество данных на узел в Neo4j

14

Мне нужно хранить значительные объемы данных на узел в Neo4j. Данные Unicode фрагменты текста. На самом деле не каждый узел будет иметь большие куски, но многие из них будут.

Я просмотрел документацию, но не нашел упоминания о размере узла - объеме данных, который может содержать один узел.

У кого-нибудь есть идеи?

treecoder
источник
Насколько большие ваши куски в целом? Вы должны убедиться, что нашли подходящий string_block_size, чтобы сохранить количество строковых блоков в хранилище до разумного уровня, а также не тратить слишком много места только на наполовину заполненные блоки. Как будут использоваться данные? Только что обработано или также запрошено / обработано иначе? Если вам нужно сэкономить место, можно использовать сжатие + хранение в виде байтового массива.
Майкл Голод

Ответы:

13

В конечном счете, это зависит от архитектуры вашей машины.


(фон) Узлы могут хранить данные исключительно в своих свойствах. Их свойства хранятся в хранилище значений ключей. (за здесь )

Значение в каждом свойстве ограничено примитивами Java (целыми числами, числами с плавающей точкой и т. Д.), Строками и массивами примитивов / строк.

Следовательно, максимальный объем данных, который может содержать конкретное свойство , будет ограничен максимальным размером строки или максимальным размером массива строк (для каждого узла ). Это ограничение (для 32-битных компьютеров) составляет 4 ГБ. (Обратите внимание, что это может быть ограничено до 2-3 ГБ .)

(Также, сказав это, ранее была ошибка, которая ограничивала размер строки до 1 МБ . Я ожидаю, что это решено.)

Конечно, возникает вопрос о том, могут ли несколько свойств хранить более 4 ГБ на узел. Поскольку список свойств по сути является хранилищем значений ключей, можно ожидать, что максимальный размер будет ограничен дисковым пространством и выбором ключа. Однако я не могу найти ничего, чтобы поддержать или опровергнуть это.


Это не дает окончательного ответа на ваш вопрос, но, насколько я понимаю, вы сможете хранить большие объемы данных на узел (вплоть до емкости дискового пространства).

Ричард
источник