為什么我的glob.glob循環不遍歷文件夾中的所有文本文件？

Question

我試圖從包含python 3的文本文檔的文件夾中讀取。具體來說，這是對LingSpam垃圾郵件數據集的修改。 我期待我寫的代碼返回所有1893個文本文檔名稱，但是，代碼返回前420個文件名。 我不明白為什么它沒有停止文件名的總數。 有任何想法嗎？

if not os.path.exists('train'):  # download data
  from urllib.request import urlretrieve
  import tarfile
  urlretrieve('http://cs.iit.edu/~culotta/cs429/lingspam.tgz', 'lingspam.tgz')
  tar = tarfile.open('lingspam.tgz')
  tar.extractall()
  tar.close()
abc = []
for f in glob.glob("train/*.txt"):
  print(f)
  abc.append(f)
print(len(abc))

我試過更改glob參數但仍然沒有成功。

編輯：顯然我的代碼適用於除我之外的所有人。 這是我的輸出

Answer 1

成功！ 問題是

if not os.path.exists('train'):  # download data

為了檢查我的輸出，我實際上已經將文件下載到我的計算機上，並且由於該行檢查了該文件夾是否存在，並且它確實存在，因此導致了問題。 我刪除了我的機器上的文件，現在它可以正常工作，但我懷疑是在運行

  from urllib.request import urlretrieve
  import tarfile
  urlretrieve('http://cs.iit.edu/~culotta/cs429/lingspam.tgz', 'lingspam.tgz')
  tar = tarfile.open('lingspam.tgz')
  tar.extractall()
  tar.close()

沒有if語句就會有相同的結果。

為什么我的glob.glob循環不遍歷文件夾中的所有文本文件？

問題描述

1 個解決方案

解決方案1
0 已采納 2016-03-30 20:50:10

為什么我的glob.glob循環不遍歷文件夾中的所有文本文件？

問題描述

1 個解決方案

解決方案1 0 已采納 2016-03-30 20:50:10

解決方案1
0 已采納 2016-03-30 20:50:10