繁体 English 中英

如何使用neo4j和gremlin处理大型数据集？

[英]how to handle large dataset using neo4j and gremlin?

原文 2013-10-12 10:37:30 8 1 neo4j/ gremlin

我有大约8800万个节点和2亿条边。 我正在使用Neo4j Db。 我正在使用Gremlin使用批处理图。 因此，建议使用gremlin REPL为此数据集使用gremlin查询。 我的意思是避免超时或堆相关的问题。

当前，我们的范围是不使用faunus api作为hadoop map.reduce结构。

我可以使用带有gremlin的简单Neo4j Db处理此问题吗？ 有其他选择或解决方案吗？

1 个解决方案

我认为Marko / Peter在gremlin用户的邮件列表上都给出了很好的答案：

https://groups.google.com/forum/#!topic/gremlin-users/w3xM4YJTA2I

我不确定我说的比他们说的要多得多，但是我会用自己的话再说一遍。 答案很大程度上取决于您打算对图形进行处理的性质以及图形本身的结构。 如果您的工作量是很多本地遍历（例如，从某个顶点开始并从那里遍历），并且不希望有太多的超节点，那么Gremlin和Neo4j应该做得很好。 给它很多内存，做一些neo4j特定的调整，您应该会很高兴。 另一方面，如果您的遍历本质上更具全局性（即，它们以gV或gE开头），而您必须触摸整个图形来进行计算，那么您会感到不满意。 迭代数以亿计的东西需要很长时间。

最终，您必须了解所面临的问题，用例，图形结构以及可用的图形数据库的优势/劣势，才能决定如何处理该尺寸的图形。

如何使用neo4j和gremlin设计我的数据集

[英]how to design my dataset using neo4j and gremlin

如何使用neo4j和gremlin存储树结构

[英]How to store tree structure using neo4j and gremlin

将Neo4j添加到Gremlin Server-如何？

[英]Add Neo4j to Gremlin Server - how to?

如何使用 CSV 中定义的关系将大型数据集导入 Neo4j

[英]How to import large dataset into Neo4j with relationships defined in CSV

如何对Neo4j中的大型数据集使用加载csv？

[英]How to use load csv for large dataset in neo4j?

neo4j不在大型数据集上创建索引

[英]neo4j not creating index on large dataset

大型数据集的Neo4j性能

[英]Neo4j Performance for large dataset

如何在使用定期提交从 csv 加载大数据时处理 Neo4j 中的事务回滚

[英]How to handle transaction rollback in Neo4j while Loading large data from csv using periodic commit

Neo4J中的Gremlin遍历

[英]Gremlin Traversal in Neo4J

无法使用gremlin连接到Neo4j db-实例化Neo4j数据库时出错

[英]Unable to connect to Neo4j db using gremlin - Error instantiating Neo4j Database

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何使用neo4j和gremlin设计我的数据集如何使用neo4j和gremlin存储树结构将Neo4j添加到Gremlin Server-如何？如何使用 CSV 中定义的关系将大型数据集导入 Neo4j 如何对Neo4j中的大型数据集使用加载csv？ neo4j不在大型数据集上创建索引大型数据集的Neo4j性能如何在使用定期提交从 csv 加载大数据时处理 Neo4j 中的事务回滚 Neo4J中的Gremlin遍历无法使用gremlin连接到Neo4j db-实例化Neo4j数据库时出错

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM