簡體   English   中英

如何使用R從與另一列中的ID相關聯的一系列列中僅選擇特定的唯一值

[英]How to select only specific unique values from a range of columns which are associated with an ID in another column using R

ID conditionA conditionB conditionC
1    1            0       0
1    0            0       1
1    0            0       0
2    1            0       1
2    0            1       0
3    1            0       1
3    0            1       0
3    1            1       0

在上圖中,我希望每個 ID 只有每個條件的單個值,使其成為每個 ID 的一行。 這樣我就可以為每個 ID 分配一行,並且在每個條件下為 1 或 0。謝謝

這可以通過使用 dplyr 包輕松完成。

library(dplyr)

data %>%
  group_by(ID) %>%
  summarize(
    conditionA = max(conditionA), 
    conditionB = max(conditionB),
    conditionC = max(conditionC)
  )

group_by()將按ID分組,然后summarize()函數將將該ID下的所有行合並為一個。 conditionA將假定在該 ID 的所有行中找到的最大值,即,如果存在 1,則它將為 1; 如果僅存在 0,則最大值為零。 conditionBconditionC相同。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM