[英]Is it possible to slim down a GBM model, in R?
是否可以從GBM擬合模型中刪除數據? 我知道keep.data
選項。 但是,我希望能夠在處理過程中保留數據,然后精簡數據。 另外,如果我只想保留一棵樹以供將來預測(例如,在擬合1000棵樹之后,我決定500棵樹對我來說是最好的,所以我只想保留這棵樹。是否有安全的方法?從擬合模型中刪除多余的數據而又不影響預測新數據的能力?
我認為這樣做的唯一真正有用的方法是按照您的建議刪除多余的樹。
如果我在gbm示例上運行以下命令,則會發現樹占對象大小的80%,數據占10%。 因此,刪除多余的樹可以節省大量空間。
library(pryr)
bit <- unlist(lapply(gbm1,object_size))
round(bit/sum(bit),3)
您也可以嘗試壓縮對象,從而大大減小對象的大小。
memCompress(serialize(gbm1, NULL), "bzip2")
unserialize(memDecompress(gbm1, type = "bzip2"))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.