子集 dataframe 通過 R 中的列中的唯一值

Question

您好，我有一個 dataframe 如

Group COL1 Event 
G1 SP1  1
G1 SP2  1
G1 SP3  2
G1 SP3  2 
G2 SP4  3
G2 SP7  3
G2 SP5  6
G3 SP1  1 
G4 SP1  6

如果Event是唯一的，我只想保留 COL1（例如，SP3 和 SP5 在 Event 列中是唯一的）。

然后我應該得到：

Group COL1 Event 
G1 SP3  2
G1 SP3  2 
G2 SP5  6 
G3 SP1  1 
G4 SP1  6

SP1和SP2在Event1列中為 2，因此它們沒有通過

SP4和SP7在Event3列中為 2，因此它們沒有通過

Answer 1

您可以使用 data.table 按Group和Event進行分組，並且僅在唯一 COL1 值（ uniqueN(COL1) ）的數量為 1 時返回組內容（ .SD ）。

library(data.table)
setDT(df)

df[, if(uniqueN(COL1) == 1) .SD, by = .(Group, Event)]
#    Group Event COL1
# 1:    G1     2  SP3
# 2:    G1     2  SP3
# 3:    G2     6  SP5
# 4:    G3     1  SP1
# 5:    G4     6  SP1

使用的數據：

df <- fread('
Group COL1 Event 
G1 SP1  1
G1 SP2  1
G1 SP3  2
G1 SP3  2 
G2 SP4  3
G2 SP7  3
G2 SP5  6
G3 SP1  1 
G4 SP1  6  
')

Answer 2

使用ave的base R選項

subset(df, ave(COL1, Group, Event,
      FUN = function(x) length(unique(x))) == 1)
#  Group COL1 Event
#3    G1  SP3     2
#4    G1  SP3     2
#7    G2  SP5     6
#8    G3  SP1     1
#9    G4  SP1     6

Answer 3

另一個data.table選項

> setDT(df)[,.SD[uniqueN(COL1)==1],.(Group,Event)]
   Group Event COL1
1:    G1     2  SP3
2:    G1     2  SP3
3:    G2     6  SP5
4:    G3     1  SP1
5:    G4     6  SP1

子集 dataframe 通過 R 中的列中的唯一值

問題描述

3 個解決方案

解決方案1
3 已采納 2021-01-26 14:10:18

解決方案2
3 2021-01-26 19:25:24

解決方案3
2 2021-01-26 21:06:46

子集 dataframe 通過 R 中的列中的唯一值

問題描述

3 個解決方案

解決方案1 3 已采納 2021-01-26 14:10:18

解決方案2 3 2021-01-26 19:25:24

解決方案3 2 2021-01-26 21:06:46

解決方案1
3 已采納 2021-01-26 14:10:18

解決方案2
3 2021-01-26 19:25:24

解決方案3
2 2021-01-26 21:06:46