簡體   English   中英

OrientDB-大數據性能

[英]OrientDB - Performance with big data

我在項目中使用OrientDB,我真正關心的是性能。 我創建了大數據進行測試,該數據有50萬人和50萬個興趣,人與人之間的隨機關系(2 496 540個關系),人與興趣之間的隨機關系(3 322 060個關系)。

我需要做的是遍歷頂點和邊。 我試過Gremlin。 對於朋友少於100的人,獲得共同的朋友大約需要10到20秒,但是如果一個人有成千上萬的朋友,這將無法正常工作,這將花費太多時間。

g.v(id).both('KNOWS').as('here').both('KNOWS').has('id', '10:20').back('here').dedup.email

對於朋友少於100的人,獲取朋友推薦大約需要40至50秒,但是當一個人有成千上萬的朋友時,情況也是一樣。

x=[g.v(id)];g.v(id).both('KNOWS').aggregate(x).both('KNOWS').except(x).dedup.email

這些對OrientDB來說有什么辦法可以快速完成遍歷嗎?

OrientDB SQL遍歷僅支持深度優先遍歷,似乎無法在兩個人之間找到共同的朋友,並且朋友推薦很復雜。 我錯過了什么?

感謝您的回答!

為什么不從10:20開始並從那里交叉關系,而不是瀏覽所有數據庫以檢查該頂點是否與10:20相關?

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM