导入CSV关系到Neo4j

Question

我正在尝试使用CSV文件作为中介，将数据从MySQL数据库导入Neo4j。 我正在遵循基本示例，但不能完全正常工作。 我正在使用这些查询导入两个表：

//Import projects.
USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM "file:/tmp/projects.csv" AS row
CREATE (:project
{
     project_id: row.fan,
     project_name: row.project_name
});

//Import people.
USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM "file:/tmp/persons.csv" AS row
CREATE (:person
{
     person_id: row.person_id,
     person_name: row.person_name,
});

//Create indicies.
CREATE INDEX ON :project(project_id);
CREATE INDEX ON :project(project_name);
CREATE INDEX ON :person(person_id);
CREATE INDEX ON :person(person_name);

这部分有效。 什么是无效的，当我尝试导入关系时：

//Create project-person relationships.
USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM "file:/tmp/project_persons.csv" AS row
MATCH (project:project {project_id: row.project_id})
MATCH (person:person {person_id: row.person_id})
MERGE (person)-[:CONTRIBUTED]->(project);

控制台接受查询，没有错误，但是永远不会完成。 它在100％CPU，25％RAM，但磁盘使用率可以忽略的情况下运行了几天。 数据库信息中没有任何关系。

我是在某个地方犯了错误，还是真的这么慢？ project_persons.csv文件的长度为1300万行，但是定期提交现在是否应该显示出来？

Answer 1

shouldn't the periodic commit make something show up by now?

仅对于LOAD-在CREATE的前面做一个“解释”，它会告诉您它如何构造更新以及它希望处理的记录数。 我遇到了同样的问题-Neo4j将整个更新作为一个事务进行，但从未完成。 事务需要分解成5万至10万个TX块才能完成所有工作。

一种实现方法是将关系信息作为一组标记节点导入，然后使用这些节点来匹配人员和项目节点，并根据需要创建关系。

USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM "file:/tmp/project_persons.csv" AS row
CREATE (:Relations {project_id: row.project_id, person_id: row.person_id})

然后以50K批处理记录：

MATCH (r:Relations) 
MATCH (prj:project {project_id: r.project_id})
MATCH (per:person {person_id: r.person_id})
WITH r, prj, per LIMIT 50000
MERGE (per)-[:CONTRIBUTED]->(prj)
DELETE r

多次运行此操作，直到创建所有关系，然后您就可以开始了。

导入CSV关系到Neo4j

问题描述

1 个解决方案

解决方案1
0 已采纳 2016-04-03 21:51:01

导入CSV关系到Neo4j

问题描述

1 个解决方案

解决方案1 0 已采纳 2016-04-03 21:51:01

解决方案1
0 已采纳 2016-04-03 21:51:01