繁体   English   中英

分层采样R:java.lang.OutOfMemoryError:Java堆空间

[英]stratified sampling R: java.lang.OutOfMemoryError: Java heap space

我想使用此功能, 这是github的代码,将我的数据集分为两部分进行采样:90%的转换数据集(例如)和10%(其余的部分)是测试(例如尝试了以下代码:


library(XLConnect)
library(readxl)
library(xlsx)
library(readxl)
ybi <- read_excel("D:/ii.xls")
#View(ybi)
test= stratified(ybi, 8, .1)

 no= (test$ID_unit) # to get indices of the testdataset samples
 train = ybi [-no,] # the indices for training data 


 write.xlsx(train,"D:/mm.xlsx",sheetName = "Newdata")

实际上我的数据有8个属性和65534行。 我已经基于8个eigth属性选择了仅10%以上的代码,这是它给我的类,没有任何问题,测试集却没有训练数据,而错误是图形(联合) 错误

如何解决!

看来JVM没有为堆分配足够的内存。

快速修复,导出系统变量_JAVA_OPTIONS

export _JAVA_OPTIONS="-Xmx8G -Xms1G -Xcheck:jni"

您还可以使用:

options(java.parameters = "-Xmx8G")

并将-Xmx设置为使R满意的值。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM