Я работаю над научно-исследовательским проектом, связанным с анализом социальных отношений, и мне нужно хранить данные в некоторых графовых базах данных. Изначально я выбрал Neo4j в качестве базы данных. Но швы Neo4j плохо масштабируются. Альтернатива, которую я обнаружил, это Titan и oriebtDB. Я провел это сравнение этих трех баз данных, но я хотел бы получить более подробную информацию об этих базах данных. Так может кто-нибудь помочь мне в выборе лучшего. В основном я хотел бы сравнить производительность, масштабирование, доступную документацию / учебные пособия, поддержку библиотек Python, сложность языка запросов и поддержку алгоритмов графов для этих баз данных. Также есть ли другие хорошие варианты базы данных?
data-mining
graphs
databases
social-network-analysis
Sreejithc321
источник
источник
Ответы:
Я думаю, что вам, возможно, придется помнить общие конвейеры данных и конвейеры машинного обучения. Для которого вам нужна надежная структура для перемещения данных между табличными и графическими хранилищами, кроме мощной распределенной обработки. Насколько я понимаю, Spark GraphX обещает построить эти конвейеры. Выступление Джозефа Гонсалеса (одного из создателей GraphLab из CMU) о GraphX на YouTube стоит посмотреть.
источник