如何根據 R 中的行值在 data.frame 中創建新列？

Question

嘿嘿，

我有一個帶有家庭三重奏的data.frame，我想添加一個包含每個“id”（=后代）的完整同胞的列。

我的數據：

df
         id    dam    sire
1:    83295  67606   79199
2:    83297  67606   79199
3:    89826  67606   79199

我想檢索的內容：

df2
         id    dam    sire     fs1     fs2
1:    83295  67606   79199   83297   89826  
2:    83297  67606   79199   83295   89826  
3:    89826  67606   79199   83295   83297

我試過的：

（類似於： How to transform a dataframes row into columns in R? ）

library(dplyr)
library(splitstackshape)

df2 <- df %>%
  group_by(dam,sire) %>%
  summarise(id = toString(id)) %>%
  cSplit("id") %>%
  setNames(paste0("fs_", 1:ncol(.)))

colnames(df2) <- c("dam", "sire", "id", "fs1", "fs2")

每個父二人組只給我一行（而不是為每個“id”創建同一行）：

df2
     dam    sire       id      fs1     fs2
1: 67606   79199    83295    83297    89826

在某些情況下不會有完整的同胞，在某些情況下會有 15 個。

提前感謝您的建議：:)

Answer 1

我們可以group_by dam和setdiff使用sire獲取除當前id之外id's ，然后使用cSplit將逗號分隔的值分隔到不同的列中。

library(splitstackshape)
library(dplyr)

df %>%
  group_by(dam, sire) %>%
  mutate(fs = purrr::map_chr(id, ~toString(setdiff(id, .x)))) %>%
  cSplit("fs")

#      id   dam  sire  fs_1  fs_2
#1: 83295 67606 79199 83297 89826
#2: 83297 67606 79199 83295 89826
#3: 89826 67606 79199 83295 83297

數據

df <- structure(list(id = c(83295L, 83297L, 89826L), dam = c(67606L, 
67606L, 67606L), sire = c(79199L, 79199L, 79199L)), class = "data.frame",
row.names = c("1:", "2:", "3:"))

如何根據 R 中的行值在 data.frame 中創建新列？

問題描述

1 個解決方案

解決方案1
1 已采納 2019-11-18 00:00:28

如何根據 R 中的行值在 data.frame 中創建新列？

問題描述

1 個解決方案

解決方案1 1 已采納 2019-11-18 00:00:28

解決方案1
1 已采納 2019-11-18 00:00:28