簡體   English   中英

將(500 萬)批量加載到 Janusgraph 的最佳方法

[英]Best method to bulk load (5 millions) into Janusgraph

在 Janusgraph 上做一些壓力測試,需要加載 est 500 萬個頂點和邊。 使用 faker python 生成假數據,想知道哪種方法是加載此類數據的最佳方法? 我嘗試使用控制台加載數據,但得到奇怪的結果和超時。

看起來您正在使用標簽中的 Gremlin Python 客戶端。 一種相當常見的技術是使用多線程(或多進程)Python 應用程序,該應用程序將數據批量發送到圖(可能一次 50 到 100 個addVaddE )。 您的問題不清楚您是否使用 Gremlin Server。 如果您使用 Gremlin 服務器,您可能需要在 YAML 文件中配置gremlinPool參數,以便為您運行它的機器的 class 提供足夠的工作人員。 以這種方式加載 500 萬個頂點和邊應該不會花費太長時間。 如果加載頂點和邊的總時間不是問題,單個線程一次發送 50 到 100 個批次仍然是相當有效的。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM