[英]external dataset learning in python for machine learning
嗨,我想使用naivebayesclassifier對數據集進行分類。為此,我想使用我從google下載的外部數據集。此數據集包含兩個用於正面評論和負面評論的文件夾。每個文件夾包含1000個.txt文件。如何導入此文件在我的代碼中作為python中的火車數據集。我是機器學習的新手,所以我對此不太了解,請幫幫我。
您可以使用( https://docs.python.org/2/library/os.html )中的os.listdir
,例如:
import os
fileList = os.listdir('train_directory')
for file in fileList:
# add content of file to dataset.
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.