R 中的壓縮數據幀

Question

我只是有一個簡單的問題，非常感謝大家的意見，你們對我的項目幫助很大。 我還有一個關於 R 中的數據幀的問題。

我有看起來類似於這樣的數據框：

    C <- c("","","","","","","","A","B","D","A","B","D","A","B","D")
    D <- c(NA,NA,NA,2,NA,NA,1,1,4,2,2,5,2,1,4,2)
    G <- list(C=C,D=D)
    T <- as.data.frame(G)
    T
   C  D
1     NA
2     NA
3     NA
4     2
5     NA
6     NA
7     1
8  A  1
9  B  4
10 D  2
11 A  2
12 B  5
13 D  2 
14 A  1
15 B  4
16 D  2

我希望能夠將所有重復字符壓縮成一個，並且看起來類似於：

所以當然，數據都是一樣的，只是它被壓縮並形成了新的列來保存數據。 我相信有一個簡單的方法可以做到這一點，但從我看過的書中，我沒有看到任何關於這個的東西！

編輯我編輯了這個例子，因為到目前為止它沒有與答案一起工作。 我想知道空白中的 NA、空白和不均勻是否有影響？

Answer 1

這似乎得到了你正在尋找的結果。 我假設可以刪除NA值，因為它與您顯示的所需 output 匹配。

T <- na.omit(T)
T$ind <- ave(1:nrow(T), T$C, FUN = seq_along)
reshape(T, direction = "wide", idvar = "C", timevar = "ind")
#    C D.1 D.2 D.3
# 4      2   1  NA
# 8  A   1   2   1
# 9  B   4   5   4
# 10 D   2   2   2

library(reshape2)
dcast(T, C ~ ind, value.var = "D", fill = "")
#   C 1 2 3
# 1   2 1  
# 2 A 1 2 1
# 3 B 4 5 4
# 4 D 2 2 2

Answer 2

這是重塑解決方案：

require(reshape)
cast(T, C ~ ., function(x) x)

Answer 3

將 T 更改為 df 以避免壞習慣。 返回一個列表，這不是您想要的，但您可以從那里轉換。

C <- c("A","B","D","A","B","D","A","B","D")
D <- c(1,4,2,2,5,2,1,4,2)
my.df <- data.frame(id=C,val=D)

ret <- function(x) x
by.df <- by(my.df$val,INDICES=my.df$id,ret)

R 中的壓縮數據幀

問題描述

3 個解決方案

解決方案1
1 2014-07-14 18:01:45

解決方案2
1 2011-07-10 00:06:01

解決方案3
1 2011-07-10 00:15:26

R 中的壓縮數據幀

問題描述

3 個解決方案

解決方案1 1 2014-07-14 18:01:45

解決方案2 1 2011-07-10 00:06:01

解決方案3 1 2011-07-10 00:15:26

解決方案1
1 2014-07-14 18:01:45

解決方案2
1 2011-07-10 00:06:01

解決方案3
1 2011-07-10 00:15:26