繁体   English   中英

Python H2O svmlight数据

[英]Python h2o svmlight data

我有一个svmlight格式的文件,其值的形式为:

92.91 18256731:1 71729421:1 72329637:1 83328561:1 118265976:1 134892759:1 198163358:1 352348616:1 526943048:1 5.30 102156934:1 134892759:1 198163358:1 254112843:1 262373758:1 512748316:1 526943048:1 22.00 32172600:1 72329637:1 118265976:1 134892759:1 198163358:1 411824213:1 443226486:1 445371412:1 526943048:1

我正在尝试使用h2o.import_file(fname.svmlight)在h2o中导入此h2o.import_file(fname.svmlight)

h2o是否支持高维稀疏二进制特征?

我是否需要转换某些索引中的哈希值才能正常工作?

您的三行svmlight就像病毒! top的是,java进程所能获得的CPU接近800%(8核计算机)。 经过45m的cpu努力(5-6分钟的挂钟),我不得不在它上面使用kill -9来使我的机器恢复运行。

即使您的文件类型不受官方支持,但我认为它会使计算机瘫痪这一事实使其成为一个严重的错误,因此,我在这里进行了报告: https : //0xdata.atlassian.net/browse/PUBDEV-4798

顺便说一句,您可以在此处找到显示使用smvlight的单元测试: https : //github.com/h2oai/h2o-3/blob/30f382efac687be3959a253d975cb48c341c92b4/h2o-r/tests/testdir_misc/runit_parser_type.R

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM