如何使用ArangoDB列出条目最相似的用户

Question

我今天开始新项目。 我有用户表，标签表和user_tags边缘的图形结果。

我在图形上附加了一些标签给用户。 如何列出与ArangoDB条目最相似的用户。

例如：

用户ID：112有3个标签（标签ID：50、51、52、53）
用户ID：113有5个标签（标签ID：52、53、54、55、56）
用户ID：114具有4个标签（标签ID：51、52、53、54）
用户ID：115有2个标签（标签ID：48、49）

当我搜索用户ID 112用户。 结果应与此类似：

用户ID：114（3个匹配项，分别是51、52、53）
用户ID：113（2个匹配项，分别是52、53）

非常见数据不应包含在结果用户ID中：115

如果没有人知道arangodb解决方案，如果有neo4j解决方案，我可以使用neo4j。

谢谢。

Answer 1

在cypher中，这是查询：

MATCH (u1:User {id:114})-[:HAS_TAG]->(tag:Tag),
      (u:User)-[:HAS_TAG]->(tag:Tag)
WITH u, collect(id(tag)) AS tags
RETURN u, tags, size(tags) AS score
ORDER BY score DESC

干杯

Answer 2

在ArangoDB中，只要您创建一个以users和tags为顶点集合，以user_tags作为边集合的图形，此查询就可以使用：

LET active_user = FIRST(
    FOR u IN users
    FILTER u.id == @user_id
    RETURN u._id
)

LET active_tags = (
    FOR v IN 1..10 OUTBOUND active_user GRAPH 'user_tags_graph'
    RETURN (v.id)
)

FOR u IN users
FILTER u._id != active_user
    LET tags_in_use = FLATTEN(
        FOR v IN 1..10 OUTBOUND u._id GRAPH 'user_tags_graph'
        RETURN [v.id]
    )
    LET tag_matches = (
        RETURN LENGTH(INTERSECTION(active_tags, tags_in_use))
    )
    FILTER FIRST(tag_matches) > 0
    SORT tag_matches DESC
    RETURN {
        [u.id]: INTERSECTION(active_tags, tags_in_use)
    }

可能可以对其进行大量优化，但是像这样将其分解会使它更易于理解。

如何使用ArangoDB列出条目最相似的用户

问题描述

2 个解决方案

解决方案1
0 已采纳 2017-02-20 18:14:13

解决方案2
0 2017-02-25 13:50:06

如何使用ArangoDB列出条目最相似的用户

问题描述

2 个解决方案

解决方案1 0 已采纳 2017-02-20 18:14:13

解决方案2 0 2017-02-25 13:50:06

解决方案1
0 已采纳 2017-02-20 18:14:13

解决方案2
0 2017-02-25 13:50:06