OrientDB-大數據性能

Question

我在項目中使用OrientDB，我真正關心的是性能。 我創建了大數據進行測試，該數據有50萬人和50萬個興趣，人與人之間的隨機關系（2 496 540個關系），人與興趣之間的隨機關系（3 322 060個關系）。

我需要做的是遍歷頂點和邊。 我試過Gremlin。 對於朋友少於100的人，獲得共同的朋友大約需要10到20秒，但是如果一個人有成千上萬的朋友，這將無法正常工作，這將花費太多時間。

g.v(id).both('KNOWS').as('here').both('KNOWS').has('id', '10:20').back('here').dedup.email

對於朋友少於100的人，獲取朋友推薦大約需要40至50秒，但是當一個人有成千上萬的朋友時，情況也是一樣。

x=[g.v(id)];g.v(id).both('KNOWS').aggregate(x).both('KNOWS').except(x).dedup.email

這些對OrientDB來說有什么辦法可以快速完成遍歷嗎？

OrientDB SQL遍歷僅支持深度優先遍歷，似乎無法在兩個人之間找到共同的朋友，並且朋友推薦很復雜。 我錯過了什么？

感謝您的回答！

Answer 1

為什么不從10:20開始並從那里交叉關系，而不是瀏覽所有數據庫以檢查該頂點是否與10:20相關？