Neo4j против OrientDB против Титана

13

Я работаю над научно-исследовательским проектом, связанным с анализом социальных отношений, и мне нужно хранить данные в некоторых графовых базах данных. Изначально я выбрал Neo4j в качестве базы данных. Но швы Neo4j плохо масштабируются. Альтернатива, которую я обнаружил, это Titan и oriebtDB. Я провел это сравнение этих трех баз данных, но я хотел бы получить более подробную информацию об этих базах данных. Так может кто-нибудь помочь мне в выборе лучшего. В основном я хотел бы сравнить производительность, масштабирование, доступную документацию / учебные пособия, поддержку библиотек Python, сложность языка запросов и поддержку алгоритмов графов для этих баз данных. Также есть ли другие хорошие варианты базы данных?

Sreejithc321
источник
1
Также рассмотрим Graphlab (на основе Python): graphlab.com/products/create/overview.html Вот и хороший пост в блоге об этом: bugra.github.io/work/notes/2014-04-06/… Я не могу помочь вам с обсуждением Titan vs oriebtDB. Надеюсь, кто-то будет вмешиваться в это.
nfmcclure
Также возможно использование Spark и GraphX
sheldonkreger
В этой статье показаны некоторые подробности о масштабируемости, особое преимущество для Titan. groups.google.com/forum/#!topic/orient-database/CpPh42ukfH4
Генри Х.
2
Нет, это не так; GraphX ​​не является базой данных.
Эмре
Так как это было пару месяцев назад, я полагаю, вы добились определенного прогресса. Почему бы не добавить свой собственный ответ (здесь или в другом месте?)
Jayan

Ответы:

1

Я думаю, что вам, возможно, придется помнить общие конвейеры данных и конвейеры машинного обучения. Для которого вам нужна надежная структура для перемещения данных между табличными и графическими хранилищами, кроме мощной распределенной обработки. Насколько я понимаю, Spark GraphX ​​обещает построить эти конвейеры. Выступление Джозефа Гонсалеса (одного из создателей GraphLab из CMU) о GraphX ​​на YouTube стоит посмотреть.

Срини Вемула
источник