如何基於R中丟失的數據在數據框中創建新行

Question

我想根據數據框中缺少的數據向正在使用的數據框添加新行。

這是一個示例數據框。

year <- c(2001,2001,2002,2002,2003,2004,2004,2005)
make <- c('Honda', 'Ford', 'Honda', 'Ford', 'Honda', 'Honda', 'Ford', 'Honda')
number_manufactured <- c(10, 20, 15, 47, 14, 19, 35, 9)

cars <- data.frame(year, make, number_manufactured)

我想向數據框添加一行以獲取number_manufactured = 0所缺少的值，例如：（2003，Ford，0）和（2005，Ford，0）

我想要的數據框是這樣的：

year <- c(2001,2001,2002,2002,2003,2003,2004,2004,2005,2005)
make <- c('Honda', 'Ford', 'Honda', 'Ford', 'Honda','Ford', 'Honda', 'Ford', 'Honda', 'Ford')
number_manufactured <- c(10, 20, 15, 47, 14, 0, 19, 35, 9, 0)

cars <- data.frame(year, make, number_manufactured)

謝謝您的幫助！

Answer 1

這是使用expand.grid和merge的基本R方法。

# get new data.frame
dfNew <- merge(cars, expand.grid(unique(cars$year), unique(cars$make)), 
               by.x=c("year", "make"), by.y=c("Var1", "Var2"), all=TRUE)
# fill in 0s
dfNew$number_manufactured[is.na(dfNew$number_manufactured)] <- 0

expand.grid返回具有兩個向量的所有組合的data.frame。 在這里，它可以滿足年份和年份的獨特水平。 將其合並到原始data.frame上以生成新的data.frame，並使用all = TRUE參數包含新的觀察值。 新的觀測值是制造數量的NA，因此第二行將其轉換為0。

Answer 2

tidyr::complete對於此類事情很方便。 您在要為其添加行的數據集中列出變量。 你也可以列出你想（默認情況下你得到填補其他變量是什么NA通過） fill 。

library(tidyr)
complete(cars, year, make, fill = list(number_manufactured = 0))

如何基於R中丟失的數據在數據框中創建新行

問題描述

2 個解決方案

解決方案1
1 已采納 2016-07-28 16:16:42

解決方案2
1 2016-08-24 21:52:40

如何基於R中丟失的數據在數據框中創建新行

問題描述

2 個解決方案

解決方案1 1 已采納 2016-07-28 16:16:42

解決方案2 1 2016-08-24 21:52:40

解決方案1
1 已采納 2016-07-28 16:16:42

解決方案2
1 2016-08-24 21:52:40