簡體   English   中英

為什么我的glob.glob循環不遍歷文件夾中的所有文本文件?

[英]Why is my glob.glob loop not iterating through all text files in folder?

我試圖從包含python 3的文本文檔的文件夾中讀取。具體來說,這是對LingSpam垃圾郵件數據集的修改。 我期待我寫的代碼返回所有1893個文本文檔名稱,但是,代碼返回前420個文件名。 我不明白為什么它沒有停止文件名的總數。 有任何想法嗎?

if not os.path.exists('train'):  # download data
  from urllib.request import urlretrieve
  import tarfile
  urlretrieve('http://cs.iit.edu/~culotta/cs429/lingspam.tgz', 'lingspam.tgz')
  tar = tarfile.open('lingspam.tgz')
  tar.extractall()
  tar.close()
abc = []
for f in glob.glob("train/*.txt"):
  print(f)
  abc.append(f)
print(len(abc))

我試過更改glob參數但仍然沒有成功。

編輯:顯然我的代碼適用於除我之外的所有人。 這是我的輸出

成功! 問題是

if not os.path.exists('train'):  # download data

為了檢查我的輸出,我實際上已經將文件下載到我的計算機上,並且由於該行檢查了該文件夾是否存在,並且它確實存在,因此導致了問題。 我刪除了我的機器上的文件,現在它可以正常工作,但我懷疑是在運行

  from urllib.request import urlretrieve
  import tarfile
  urlretrieve('http://cs.iit.edu/~culotta/cs429/lingspam.tgz', 'lingspam.tgz')
  tar = tarfile.open('lingspam.tgz')
  tar.extractall()
  tar.close()

沒有if語句就會有相同的結果。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM