合并具有相同名称r的列

Question

我在R中使用mongolite从mongodb创建的数据集进行工作。
我得到的列表看起来像这样：

   _id A  B  A  B  A  B  NA NA
    1  a  1  b  2  e  5  NA NA 
    2  k  4  l  3  c  3  d  4

我想合并数据集看起来像这样：

最后一列中的NAs在那里，因为这些列是从第一个条目中命名的，并且如果后面的条目中的列多于它们，则不会为它们分配名称（如果我也能获得帮助，那会很棒）但这不是我在这里的原因）。 同样，列数对于数据集的不同子集可能有所不同。 我试过了melt()但是由于它是一个列表而不是一个数据框，因此无法正常工作，我试过了stack()但是它不起作用，因为这些列具有相同的名称，而有些列却没有甚至有个名字 我知道这是一个非常奇怪的情况，感谢您的帮助。 谢谢。

Answer 1

使用library(magrittr)

数据：

df <- fread("
               _id A  B  A  B  A  B  NA NA
    1  a  1  b  2  e  5  NA NA 
    2  k  4  l  3  c  3  d  4 ",header=T)
setDF(df)

码：

df2 <- df[,-1]

odds<- df2 %>% ncol %>% {(1:.)%%2} %>% as.logical
even<- df2 %>% ncol %>% {!(1:.)%%2}

cbind(df[,1,drop=F],
      A=unlist(df2[,odds]),
      B=unlist(df2[,even]),
      row.names=NULL)

结果：

#   _id    A  B
# 1   1    a  1
# 2   2    k  4
# 3   1    b  2
# 4   2    l  3
# 5   1    e  5
# 6   2    c  3
# 7   1 <NA> NA
# 8   2    d  4

Answer 2

我们可以使用data.table 。 假设A和B总是彼此跟随。 我创建了一个示例，在标题中包含2组NA。 使用grep，我们可以找到fread名为V8的那些。使用R的向量回收，您可以一次性重命名多个标头。 如果您的情况以不同的方式命名，请在grep命令中更改模式。 然后我们通过熔化融化数据

library(data.table)

df <- fread("
               _id A  B  A  B  A  B  NA NA NA NA
                1  a  1  b  2  e  5  NA NA NA NA
                2  k  4  l  3  c  3  d  4 e 5",
            header = TRUE)

df
   _id A B A B A B    A  B    A  B
1:   1 a 1 b 2 e 5 <NA> NA <NA> NA
2:   2 k 4 l 3 c 3    d  4    e  5

# assuming A B are always following each other. Can be done in 1 statement.
cols <- names(df)
cols[grep(pattern = "^V", x = cols)] <- c("A", "B")
names(df) <- cols

# melt data (if df is a data.frame replace df with setDT(df)
df_melted <- melt(df, id.vars = 1, 
                  measure.vars = patterns(c('A', 'B')),
                  value.name=c('A', 'B'))

df_melted
    _id variable    A  B
 1:   1        1    a  1
 2:   2        1    k  4
 3:   1        2    b  2
 4:   2        2    l  3
 5:   1        3    e  5
 6:   2        3    c  3
 7:   1        4 <NA> NA
 8:   2        4    d  4
 9:   1        5 <NA> NA
10:   2        5    e  5

Answer 3

谢谢您的帮助，它们是我们的巨大灵感。 即使@Andre Elrico给出的解决方案在可重现示例中效果更好，但@phiver给出的解决方案在我的总体问题上效果更好。 通过同时使用这两种方法，我得出了以下结论。

library(data.table)
#The data were in a list of lists called list for this example
temp <- as.data.table(matrix(t(sapply(list, '[', seq(max(sapply(list, lenth))))), 
                            nrow = m)) 
# m here is the number of lists in list

cols <- names(temp)
cols[grep(pattern = "^V", x = cols)] <- c("B", "A") 
#They need to be the opposite way because the first column is going to be substituted with id, and this way they fall on the correct column after that
cols[1] <- "id"
names(temp) <- cols
l <- melt.data.table(temp, id.vars = 1, 
                           measure.vars = patterns(c("A", "B")), 
                           value.name = c("A", "B"))

这样，如果我需要处理超过2个列，我也可以使用它。

合并具有相同名称r的列

问题描述

3 个解决方案

解决方案1
0 2018-05-04 15:21:50

解决方案2
0 2018-05-04 17:46:12

解决方案3
0 已采纳 2018-05-08 08:48:53

合并具有相同名称r的列

问题描述

3 个解决方案

解决方案1 0 2018-05-04 15:21:50

解决方案2 0 2018-05-04 17:46:12

解决方案3 0 已采纳 2018-05-08 08:48:53

解决方案1
0 2018-05-04 15:21:50

解决方案2
0 2018-05-04 17:46:12

解决方案3
0 已采纳 2018-05-08 08:48:53