繁体   English   中英

从数据框中导入选择的列

[英]Importing a selection of columns from dataframes

我正在尝试导入多个dta文件,而无需键入单独的导入代码行,也不会浪费太多加载时间。

有两个挑战。 首先,每个 dataframe 都有自己的特殊名称。 将其视为多个 state 名称:Arizona、Alabama、Texas 等。

第二个挑战是我只想导入少数列。 例如,我只想导入标记为 state、id 和温度的列。 我不需要为马上要取消选择的列花费额外的时间。

导入这些文件后,我不需要 rbind 。

重申:我想从 dta 文件 Alabama、Arizona 和 Texas 中导入列 state、id 和 temperature

以下是一些示例数据:

set.seed(100)
arizona <- data.frame(state= "AZ",
                        id= 1:100,
                        temperature= runif(100, min=40, max=80),
                        var1= runif(100, min=10, max=20),
                        var2= runif(100, min=50, max=70))

alabama <- data.frame(state= "AL",
                        id= 1:50,
                        temperature= runif(50, min=30, max=70),
                        var1= runif(50),
                        var2= runif(50, min=50, max=70))

texas <- data.frame(state= "TX",
                        id= 1:120,
                        temperature= runif(120, min=35, max=75),
                        var1= runif(120, min=10, max=20),
                        var2= runif(120, min=50, max=70))

谢谢,

我安装的包中有两个读取Stata文件的函数,但只有在代码中没有列选择选项。 像这样未经测试的代码:

libary(haven)
in_st_list <- lapply( paste( c("Alabama", "Arizona", "Texas"), ".dta", sep=""),
        read_dta, 
        col_select= all_of( c('state', 'id', 'temperature') )
       )

如果我没有犯任何语法或实质性错误,您将获得 3 个数据框的列表。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM