繁体   English   中英

R:使用数据帧中的字符条目来索引行名和列名以从另一个数据帧中提取元素

[英]R: Using character entries in a data frame to index row names and column names to extract elements from another data frame

我想在我的数据框transport_data中使用两列来提取另一个数据框CI_elec中的相应值。 transport_data中的scenarioyear列给出了应用于 CI_pkm CI_elecCI_pkm的 select 数据的行名和列名。

transport_data的头部格式如下:

# A tibble: 6 x 9
  scenario type  year  occupancy passenger.km vehicle.km TWh.vehicle.km
  <chr>    <chr> <chr>     <dbl>        <dbl>      <dbl>          <dbl>
1 iea6     walk~ 2011          1      2.70e12    2.70e12              0
2 iea6     walk~ 2015          1      3.05e12    3.05e12              0
3 iea6     walk~ 2020          1      3.38e12    3.38e12              0
4 iea6     walk~ 2025          1      3.53e12    3.53e12              0
5 iea6     walk~ 2030          1      3.57e12    3.57e12              0
6 iea6     walk~ 2035          1      3.47e12    3.47e12              0

CI_elec看起来像这样,其中 iea6 到 rcp2 是行名,2011 到 2050 是列名:

             2011         2015         2020         2025         2030
iea6 0.0005787902 0.0005118950 0.0005047792 0.0005075581 0.0005060511
iea4 0.0005787902 0.0005118950 0.0004890350 0.0004754852 0.0004484639
iea2 0.0005787902 0.0005118095 0.0004521967 0.0003997270 0.0003085964
rcp8 0.0005787902 0.0005107324 0.0005350430 0.0005468413 0.0005447299
rcp6 0.0005787902 0.0005114301 0.0005086695 0.0005147240 0.0005129202
rcp2 0.0005787902 0.0005118596 0.0004671089 0.0004361393 0.0003887369
             2035         2040         2045         2050
iea6 0.0004944316 0.0004812976 4.485943e-04 4.238010e-04
iea4 0.0004220578 0.0003909761 3.383678e-04 3.012483e-04
iea2 0.0002386181 0.0001679809 7.607596e-05 1.208776e-05
rcp8 0.0005370120 0.0005221591 4.914019e-04 4.727123e-04
rcp6 0.0004935201 0.0004928346 4.420779e-04 3.983801e-04
rcp2 0.0003437802 0.0003163802 2.963748e-04 2.790785e-04

function CI_pkm为:

    
    for (i in 1:nrow(data)){
    
    if (grepl('fuel|liquid', data[i, 2])) {
      CI[i] <- (data[i, 7] * CI_fuels$liquid) / data[i, 4]
    } else if (grepl('gas', data[i, 2])) {
      CI[i] <- (data[i, 7] * CI_fuels$gas) / data[i, 4]
    } else if (grepl('elec|EV', data[i, 2])) {
      CI[i] <- (data[i, 7] * CI_elec[data[i, 1], data[i, 3]]) / data[i, 4]
    }
    }
    as.numeric(CI)
  } 

CI_pkm不会运行,因为传递给CI_elec的值没有被引用,因此它们不能用于从CI_elec中提取数据。 我想做的是从CI_elec中提取数据,使用transport_datascenario列(对于行名)和year列(对于列名)中保存的值。

我的第一个想法是我需要为scenarioyear列中的值添加引号(可能使用dQuote或类似的); 但是,我无法让它发挥作用。 我希望有人可以为我提供一个好的解决方案。

如果将CI_elec matrix ,则可以使用行名和列名的矩阵对其进行索引:

CI_elec_mat = as.matrix(CI_elec)
transport_data$new_column = CI_elec[cbind(transport_data$scenario, transport_data$year)]

我看到的另一个不错的解决方案是将 pivot CI_elec转换为长格式并使用连接将列添加到CI

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM