R：如何為每個因子組合創建一個帶有觀察值的數據框

Question

我希望一切都好。 我正在寫有關R中一個非常具體的問題的信息，到目前為止我還無法在線找到解決方案。 如果問題已經在其他地方解決了，很抱歉打擾您，但是如果您能給我提供鏈接，我們將不勝感激。

我有3個獨立的數據集：

第一個是公司列表。 第二個是年份列表。 第三個是國家列表。

我現在的目標是將這三個數據集合並到一個新的數據框中。 最終數據幀應為這3個變量的每個組合創建一個數據行 。 這就是為什么我不能使用merge（）函數的原因。 下一步，我想沿着這個新創建的數據框匹配數據。

非常感謝您的支持-如果問題已經在其他地方解決，再次表示抱歉！

Answer 1

嘗試merge ：

A <- data.frame(Companies = LETTERS[1:3])
B <- data.frame(Years = 2000:2002)
C <- data.frame(Countries = c("GER", "UK", "US"))

X <- merge(merge(A, B), C)
X

   Companies Years Countries
1          A  2000       GER
2          B  2000       GER
3          C  2000       GER
4          A  2001       GER
5          B  2001       GER
6          C  2001       GER
7          A  2002       GER
8          B  2002       GER
9          C  2002       GER
10         A  2000        UK
...

如果您有3個以上的變量/因數，則可以編寫自己的合並函數，如下所示：

mergeN <- function(dfs = NULL) {
  if(is.null(dfs) | class(dfs) != "list") stop("'dfs' is not a list!")
  if(length(dfs) > 1) {
    dfs[[1]] <- merge(dfs[[1]], dfs[[2]]) 
    dfs[[2]] <- NULL
    Recall(dfs)
  } else {
    return(dfs[[1]]) 
  }
}

D <- data.frame(Products = letters[24:26])
E <- data.frame(Divisions = c(100,200,300))

mergeN(list(A, B, C, D, E))

這將為您提供所有3 ^ 5 = 243個組合的數據框。

由於評論而更新：

A <- data.frame(Companies = LETTERS[1:3])
B <- data.frame(Years = 2000:2002)
C <- data.frame(Countries = c("GER", "UK", "US"))

X <- merge(merge(A, B), C)

Y <- data.frame(Companies = LETTERS[1:3], Years = rep(2000,3), Countries = c("GER", "UK", "US"), Revenues = c(20433,23255,32164))

merge(X, Y, all=T)

     Companies Years Countries Revenues
1          A  2000       GER    20433
2          A  2000        UK       NA
3          A  2000        US       NA
4          A  2001       GER       NA
5          A  2001        UK       NA
6          A  2001        US       NA
7          A  2002       GER       NA
8          A  2002        UK       NA
9          A  2002        US       NA
10         B  2000       GER       NA
11         B  2000        UK    23255
12         B  2000        US       NA
13         B  2001       GER       NA
14         B  2001        UK       NA
15         B  2001        US       NA
16         B  2002       GER       NA
17         B  2002        UK       NA
18         B  2002        US       NA
19         C  2000       GER       NA
20         C  2000        UK       NA
21         C  2000        US    32164
22         C  2001       GER       NA
23         C  2001        UK       NA
24         C  2001        US       NA
25         C  2002       GER       NA
26         C  2002        UK       NA
27         C  2002        US       NA

（如果您希望NA為零： Z[is.na(Z)] <- 0 ）

Answer 2

從@Martin借入輸入數據幀，這是一種將所有數據幀放置在list ，然后使用Reduce() ：

d1 <- data.frame(Companies = LETTERS[1:3])
d2 <- data.frame(Years = 2000:2002)
d3 <- data.frame(Countries = c("GER", "UK", "US"))
d4 <- data.frame(Companies = LETTERS[1:3], Years = rep(2000,3), Countries = c("GER", "UK", "US"), Revenues = c(20433,23255,32164))

d <- list(d1, d2, d3, d4)
merged_dat <- Reduce(function(...) merge(..., all=T), d)
head(merged_dat)
#>   Companies Years Countries Revenues
#> 1         A  2000       GER    20433
#> 2         A  2000        UK       NA
#> 3         A  2000        US       NA
#> 4         A  2001       GER       NA
#> 5         A  2001        UK       NA
#> 6         A  2001        US       NA

我之所以喜歡它，是因為它可以泛化到盡可能多的數據幀。

R：如何為每個因子組合創建一個帶有觀察值的數據框

問題描述

2 個解決方案

解決方案1
0 已采納 2016-07-27 08:51:05

解決方案2
0 2016-07-28 07:41:53

R：如何為每個因子組合創建一個帶有觀察值的數據框

問題描述

2 個解決方案

解決方案1 0 已采納 2016-07-27 08:51:05

解決方案2 0 2016-07-28 07:41:53

解決方案1
0 已采納 2016-07-27 08:51:05

解決方案2
0 2016-07-28 07:41:53