[英]Importing a selection of columns from dataframes
我正在尝试导入多个dta文件,而无需键入单独的导入代码行,也不会浪费太多加载时间。
有两个挑战。 首先,每个 dataframe 都有自己的特殊名称。 将其视为多个 state 名称:Arizona、Alabama、Texas 等。
第二个挑战是我只想导入少数列。 例如,我只想导入标记为 state、id 和温度的列。 我不需要为马上要取消选择的列花费额外的时间。
导入这些文件后,我不需要 rbind 。
重申:我想从 dta 文件 Alabama、Arizona 和 Texas 中导入列 state、id 和 temperature
以下是一些示例数据:
set.seed(100)
arizona <- data.frame(state= "AZ",
id= 1:100,
temperature= runif(100, min=40, max=80),
var1= runif(100, min=10, max=20),
var2= runif(100, min=50, max=70))
alabama <- data.frame(state= "AL",
id= 1:50,
temperature= runif(50, min=30, max=70),
var1= runif(50),
var2= runif(50, min=50, max=70))
texas <- data.frame(state= "TX",
id= 1:120,
temperature= runif(120, min=35, max=75),
var1= runif(120, min=10, max=20),
var2= runif(120, min=50, max=70))
谢谢,
我安装的包中有两个读取Stata文件的函数,但只有在代码中没有列选择选项。 像这样未经测试的代码:
libary(haven)
in_st_list <- lapply( paste( c("Alabama", "Arizona", "Texas"), ".dta", sep=""),
read_dta,
col_select= all_of( c('state', 'id', 'temperature') )
)
如果我没有犯任何语法或实质性错误,您将获得 3 个数据框的列表。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.