[英]Why is my glob.glob loop not iterating through all text files in folder?
我試圖從包含python 3的文本文檔的文件夾中讀取。具體來說,這是對LingSpam垃圾郵件數據集的修改。 我期待我寫的代碼返回所有1893個文本文檔名稱,但是,代碼返回前420個文件名。 我不明白為什么它沒有停止文件名的總數。 有任何想法嗎?
if not os.path.exists('train'): # download data
from urllib.request import urlretrieve
import tarfile
urlretrieve('http://cs.iit.edu/~culotta/cs429/lingspam.tgz', 'lingspam.tgz')
tar = tarfile.open('lingspam.tgz')
tar.extractall()
tar.close()
abc = []
for f in glob.glob("train/*.txt"):
print(f)
abc.append(f)
print(len(abc))
我試過更改glob參數但仍然沒有成功。
編輯:顯然我的代碼適用於除我之外的所有人。 這是我的輸出
成功! 問題是
if not os.path.exists('train'): # download data
為了檢查我的輸出,我實際上已經將文件下載到我的計算機上,並且由於該行檢查了該文件夾是否存在,並且它確實存在,因此導致了問題。 我刪除了我的機器上的文件,現在它可以正常工作,但我懷疑是在運行
from urllib.request import urlretrieve
import tarfile
urlretrieve('http://cs.iit.edu/~culotta/cs429/lingspam.tgz', 'lingspam.tgz')
tar = tarfile.open('lingspam.tgz')
tar.extractall()
tar.close()
沒有if語句就會有相同的結果。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.