簡體   English   中英

Python H2O svmlight數據

[英]Python h2o svmlight data

我有一個svmlight格式的文件,其值的形式為:

92.91 18256731:1 71729421:1 72329637:1 83328561:1 118265976:1 134892759:1 198163358:1 352348616:1 526943048:1 5.30 102156934:1 134892759:1 198163358:1 254112843:1 262373758:1 512748316:1 526943048:1 22.00 32172600:1 72329637:1 118265976:1 134892759:1 198163358:1 411824213:1 443226486:1 445371412:1 526943048:1

我正在嘗試使用h2o.import_file(fname.svmlight)在h2o中導入此h2o.import_file(fname.svmlight)

h2o是否支持高維稀疏二進制特征?

我是否需要轉換某些索引中的哈希值才能正常工作?

您的三行svmlight就像病毒! top的是,java進程所能獲得的CPU接近800%(8核計算機)。 經過45m的cpu努力(5-6分鍾的掛鍾),我不得不在它上面使用kill -9來使我的機器恢復運行。

即使您的文件類型不受官方支持,但我認為它會使計算機癱瘓這一事實使其成為一個嚴重的錯誤,因此,我在這里進行了報告: https : //0xdata.atlassian.net/browse/PUBDEV-4798

順便說一句,您可以在此處找到顯示使用smvlight的單元測試: https : //github.com/h2oai/h2o-3/blob/30f382efac687be3959a253d975cb48c341c92b4/h2o-r/tests/testdir_misc/runit_parser_type.R

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM