简体   繁体   English

用图表处理大量数据

[英]Handle a lot of data with graphs

I have a crawler which crawl only one website.我有一个只抓取一个网站的爬虫。 But a website can have thousand pages.但是一个网站可以有数千页。 Each page is a vertex, I use JGraphT for that.每个页面都是一个顶点,我JGraphT使用JGraphT

But If I crawl a huge website, I get a StackOverflowError after a moment.但是如果我抓取一个巨大的网站,我会在片刻之后收到StackOverflowError

How can I do to handle a lot of data in this case ?在这种情况下,我该如何处理大量数据? I have to use a database ?我必须使用数据库吗? There is a library which handle this specific kind of data (vertex, edge,...) in a database ?有一个库可以处理数据库中这种特定类型的数据(顶点、边等)?

Thanks谢谢

您可能想要使用Neo4j ,它是一个高性能的 NOSQL 图形数据库。

you can take a look of following may its helps:你可以看看以下可能有帮助:

  1. bigdata®大数据®
  2. TITAN泰坦

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM