簡體   English   中英

在.libsvm格式數據文件上應用機器學習算法

[英]Applying Machine learning algorithms on .libsvm format datafiles

我目前正在處理.libsvm格式的數據集,並且無法在這些數據集上使用不同的機器學習算法,例如kNN,SVM,隨機森林。

以.csv格式應用它們很容易,但是該方法不適用於.libsvm文件。

請說明方法。

LIBSVM格式已公開標准化,可以說比csv更好地解析/使用。 基本格式可以在這里看到。

但是您不需要自己做。

您可以使用sklearn讀取它們,它是load_svmlight_file

將svmlight / libsvm格式的數據集加載到稀疏CSR矩陣中

但是,讓自己熟悉稀疏矩陣,盡管在使用sklearn時,大多數東西都可以工作而無需關心稠密與稀疏之間的關系。

我對這種格式相對於svmlight格式的背景/演變知之甚少,但是sklearn的文檔說它們是相同的,我可以通過經驗ob能夠使用上述功能加載所有libsvm數據集來支持。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM