繁体   English   中英

将 6GB SPSS (.dta) 数据集读入 R

[英]Reading in 6GB SPSS (.dta) dataset into R

我的 iMac(操作系统:Catalina 10.15.4)处理器(3.1 GHz)上有一个 6.1 GB 的大数据文件我尝试了多种方法将文件读入我的 R 全局环境。

library(foreign)
data <- read.dta(file = "File.dta", missing.type = TRUE)

install.packages("readstata13")
library(readstata13)
data <- read.dta13(file = "File.dta")

library(haven)
data <- read_dta('File.dta')

library(memisc)
data <- as.data.frame(file = "File.dta")

我得到一个错误的每一种方式:错误:向量 memory 用尽(达到限制?)

我尝试使用以下代码来解决此问题,以增加我使用的 memory:

memory.limit(size = 12000) #This is a Windows only command
Sys.setenv('R_MAX_VSIZE'=32000000000)
options(scipen = 999)

但这些都没有奏效。

有没有人在 Mac 上遇到过这个问题并且能够解决这个问题?

最好的方法是只读取选定的数据列:

data <- read_dta("032720.dta", col_select=c("WP5AA","YEAR_WAVE", "WP16", "WP18", "WP23",
                                                            "WP2319", "INCOME_5", "WP119",
                                                            "WP5358", "WP128", "EMP_2010",
                                                            "WP1219", "WP1220", "WP1223", "WP1230", 
                                                            "WP1233Recoded", "income_2", "WP3117", "WP60", "WP63", "WP67"))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM