R：比較兩組矢量

Question

我已經制作了兩個推薦系統，並希望主持他們推薦的產品，並了解有多少產品是相互的 。 我將兩個結果加入到數據框中 - 一個推薦系統列以“z”開頭，另一個以“b”開頭。

示例數據：

df <- data.frame(z1 = c("a", "s", "d"), z2 = c("z", "x", "c"), z3 = c("q", "w", "e"),
            b1 = c("w", "a", "e"), b2 = c("a", "i", "r"), b3 = c("z", "w", "y"))

ID   z1 z2 z3   b1 b2 b3
1    a  z  q    q  a  z
2    s  x  w    a  i  r
3    d  c  e    r  e  y

期望的結果：

ID   z1 z2 z3   b1 b2 b3   mutual_recommendation
1    a  z  q    q  a  z   3
2    s  x  w    a  i  r   0
3    d  c  e    e  r  y   1

問題是訂單可能不一樣，並且所有組合的合並都是Case或ifelse會有很多組合，特別是當Top-N推薦的數量變為10時。

Answer 1

我們可以使用apply循環遍歷數據集子集的行（刪除'ID'列），獲取前3個和后3個元素的intersect length

df$mutual_recommendation <- apply(df[-1], 1, FUN = function(x) 
                        length(intersect(x[1:3], x[4:6])))
df$mutual_recommendation
#[1] 3 0 1

Answer 2

這是另一個解決方案（注意：我更改了data.frame代碼以生成在問題中實際顯示在其下的數據框 - 它們不匹配）：

> library(dplyr)
> df %>% mutate(mutual_recommendation=apply(df,1,function(x) sum(x[1:3] %in% x[4:6]) ))
  z1 z2 z3 b1 b2 b3 mutual_recommendation
1  a  z  q  q  a  z                     3
2  s  x  w  a  i  r                     0
3  d  c  e  r  e  y                     1

R：比較兩組矢量

問題描述

2 個解決方案

解決方案1
2 已采納 2017-08-03 09:32:40

解決方案2
1 2018-04-05 22:07:25

R：比較兩組矢量

問題描述

2 個解決方案

解決方案1 2 已采納 2017-08-03 09:32:40

解決方案2 1 2018-04-05 22:07:25

解決方案1
2 已采納 2017-08-03 09:32:40

解決方案2
1 2018-04-05 22:07:25