[英]stratified sampling R: java.lang.OutOfMemoryError: Java heap space
我想使用此功能, 這是github上的代碼,將我的數據集分為兩部分進行采樣:90%的轉換數據集(例如)和10%(其余的部分)是測試(例如嘗試了以下代碼:
library(XLConnect)
library(readxl)
library(xlsx)
library(readxl)
ybi <- read_excel("D:/ii.xls")
#View(ybi)
test= stratified(ybi, 8, .1)
no= (test$ID_unit) # to get indices of the testdataset samples
train = ybi [-no,] # the indices for training data
write.xlsx(train,"D:/mm.xlsx",sheetName = "Newdata")
實際上我的數據有8個屬性和65534行。 我已經基於8個eigth屬性選擇了僅10%以上的代碼,這是它給我的類,沒有任何問題,測試集卻沒有訓練數據,而錯誤是圖形(聯合) 錯誤
如何解決!
看來JVM沒有為堆分配足夠的內存。
快速修復,導出系統變量_JAVA_OPTIONS
export _JAVA_OPTIONS="-Xmx8G -Xms1G -Xcheck:jni"
您還可以使用:
options(java.parameters = "-Xmx8G")
並將-Xmx設置為使R滿意的值。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.