[英]Fastest way to get a large number of nodes from Neo4j using py2neo
我正在尝试从 Neo4j DB 加载节点(大约 400 个)和关系(大约 800 个)以使用 D3 创建一个力有向图。 这是我的 get 函数(我正在使用 Tornado):
def get(self):
query_string = "START r=rel(*) RETURN r"
query = neo4j.CypherQuery(graph_db, query_string)
results = query.execute().data
start = set([r[0].start_node for r in results])
end = set([r[0].end_node for r in results])
nodes_to_keep = list(start.union(end))
nodes = []
for n in nodes_to_keep:
nodes.append({
"name":n['name'].encode('utf-8'),
"group":n['type'].encode('utf-8'),
"description":n['description'].encode('utf-8'),
"node":int(n['node_id'])})
#links
links = []
for r in results:
links.append({"source":int(r[0].start_node['node_id']), "target":int(r[0].end_node['node_id'])})
self.render(
"index.html",
page_title='My Page',
page_heading='Sweet D3 Force Diagram',
nodes=nodes,
links =links,
)
我认为昂贵的过程是在for n in nodes_to_keep:
中for n in nodes_to_keep:
和for r in results:
的for r in results:
因为每次我获得每个属性时,这是一次到服务器的旅行。 对?
完成这项任务的最佳方法是什么?
上述过程之所以花费这么长时间,是因为每次我请求节点属性时,我都会去服务器上从数据库中获取一些东西。 通过简单地修改 Cypher 查询,我能够大大减少此过程所需的时间。
例如,要获取所有具有关系的节点,我使用了以下查询:
query_string = """MATCH (n)-[r]-(m)
RETURN n, n.node_id, n.name, n.type, n.description, m.node_id, m.name, m.type, m.description"""
query = neo4j.CypherQuery(graph_db, query_string)
results = query.execute().data
结果包含我需要的信息,所以我只是遍历结果来获取属性。
要点是您需要编写查询,以便他们在第一时间为您提供所需的信息。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.