![](/img/trans.png)
[英]R: Extract Rows from One Data Frame, Based on Column Names Matching Values from Another Data Frame
[英]R: Using character entries in a data frame to index row names and column names to extract elements from another data frame
我想在我的数据框transport_data
中使用两列来提取另一个数据框CI_elec
中的相应值。 transport_data
中的scenario
和year
列给出了应用于 CI_pkm CI_elec
中CI_pkm
的 select 数据的行名和列名。
transport_data
的头部格式如下:
# A tibble: 6 x 9
scenario type year occupancy passenger.km vehicle.km TWh.vehicle.km
<chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl>
1 iea6 walk~ 2011 1 2.70e12 2.70e12 0
2 iea6 walk~ 2015 1 3.05e12 3.05e12 0
3 iea6 walk~ 2020 1 3.38e12 3.38e12 0
4 iea6 walk~ 2025 1 3.53e12 3.53e12 0
5 iea6 walk~ 2030 1 3.57e12 3.57e12 0
6 iea6 walk~ 2035 1 3.47e12 3.47e12 0
CI_elec
看起来像这样,其中 iea6 到 rcp2 是行名,2011 到 2050 是列名:
2011 2015 2020 2025 2030
iea6 0.0005787902 0.0005118950 0.0005047792 0.0005075581 0.0005060511
iea4 0.0005787902 0.0005118950 0.0004890350 0.0004754852 0.0004484639
iea2 0.0005787902 0.0005118095 0.0004521967 0.0003997270 0.0003085964
rcp8 0.0005787902 0.0005107324 0.0005350430 0.0005468413 0.0005447299
rcp6 0.0005787902 0.0005114301 0.0005086695 0.0005147240 0.0005129202
rcp2 0.0005787902 0.0005118596 0.0004671089 0.0004361393 0.0003887369
2035 2040 2045 2050
iea6 0.0004944316 0.0004812976 4.485943e-04 4.238010e-04
iea4 0.0004220578 0.0003909761 3.383678e-04 3.012483e-04
iea2 0.0002386181 0.0001679809 7.607596e-05 1.208776e-05
rcp8 0.0005370120 0.0005221591 4.914019e-04 4.727123e-04
rcp6 0.0004935201 0.0004928346 4.420779e-04 3.983801e-04
rcp2 0.0003437802 0.0003163802 2.963748e-04 2.790785e-04
function CI_pkm
为:
for (i in 1:nrow(data)){
if (grepl('fuel|liquid', data[i, 2])) {
CI[i] <- (data[i, 7] * CI_fuels$liquid) / data[i, 4]
} else if (grepl('gas', data[i, 2])) {
CI[i] <- (data[i, 7] * CI_fuels$gas) / data[i, 4]
} else if (grepl('elec|EV', data[i, 2])) {
CI[i] <- (data[i, 7] * CI_elec[data[i, 1], data[i, 3]]) / data[i, 4]
}
}
as.numeric(CI)
}
CI_pkm
不会运行,因为传递给CI_elec
的值没有被引用,因此它们不能用于从CI_elec
中提取数据。 我想做的是从CI_elec
中提取数据,使用transport_data
的scenario
列(对于行名)和year
列(对于列名)中保存的值。
我的第一个想法是我需要为scenario
和year
列中的值添加引号(可能使用dQuote
或类似的); 但是,我无法让它发挥作用。 我希望有人可以为我提供一个好的解决方案。
如果将CI_elec
matrix
,则可以使用行名和列名的矩阵对其进行索引:
CI_elec_mat = as.matrix(CI_elec)
transport_data$new_column = CI_elec[cbind(transport_data$scenario, transport_data$year)]
我看到的另一个不错的解决方案是将 pivot CI_elec
转换为长格式并使用连接将列添加到CI
。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.