簡體   English   中英

我的訓練數據文件的格式是什么?

[英]What is the format of my training data file?

我是Python和機器學習的新手。 我有要在其上應用二進制分類的數據文件 但是我無法猜測其格式並將其加載到Python中。 有人可以幫我嗎?

在數據集中,第一列是類,有100個要素。 我正在使用pandas IO加載它,並嘗試了read_csv ,但是它不起作用! 而且它絕對不是JSON。 (並且到目前為止,我僅使用了這些格式,因此,如果它是一些眾所周知的格式,請先諒解!)

這是一個純文本文件。 通過查看第一行,它看起來像一個libsvm格式。 請參閱作為參考。

您可以嘗試sklearn.datasets.load_svmlight_file讀取文件。

這是文檔鏈接中有關如何使用該方法的示例:

from sklearn.externals.joblib import Memory
from sklearn.datasets import load_svmlight_file
mem = Memory("./mycache")

@mem.cache
def get_data():
    data = load_svmlight_file("mysvmlightfile")
    return data[0], data[1]

X, y = get_data()

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM