如何在Python中编写多个txt文件？

Question

我正在用Python进行预处理tweet。 我的未处理推文在一个文件夹中。 每个包含未处理tweet的文件都名为1.txt，2.txt，... 10000.txt。 我想对其进行预处理，并将它们写入也名为1.txt，2.txt，... 10000.txt的新文件中。 我的代码如下：

for filename in glob.glob(os.path.join(path, '*.txt')):
with open(filename) as file:
    tweet=file.read()
    def processTweet(tweet):
        tweet = tweet.lower()
        tweet = re.sub('((www\.[^\s]+)|(https?://[^\s]+))','URL',tweet)
        tweet = re.sub('@[^\s]+','USER',tweet)
        tweet = re.sub('[\s]+', ' ', tweet)
        tweet = re.sub(r'#([^\s]+)', r'\1', tweet)            
        tweet = tweet.translate(None, string.punctuation)
        tweet = tweet.strip('\'"')
        return tweet

    fp = open(filename)
    line = fp.readline()

    count = 0
    processedTweet = processTweet(line)
    line = fp.readline()
    count += 1
    name = str(count) + ".txt"
    file = open(name, "w")
    file.write(processedTweet)
    file.close()

但是该代码只是给了我一个经过预处理的名为1.txt的新文件。 如何写其他9999个文件？ 我的代码有什么错误吗？

Answer 1

调用count = 0时，您的计数将重置为0。 因此，每次要写入文件时，都会写入“ 1.txt”。 为什么要尝试重建文件名，而不是仅对要处理的推文使用现有的文件名。 另外，您应该将函数定义移到循环之外：

def processTweet(tweet):
    tweet = tweet.lower()
    tweet = re.sub('((www\.[^\s]+)|(https?://[^\s]+))','URL',tweet)
    tweet = re.sub('@[^\s]+','USER',tweet)
    tweet = re.sub('[\s]+', ' ', tweet)
    tweet = re.sub(r'#([^\s]+)', r'\1', tweet)            
    tweet = tweet.translate(None, string.punctuation)
    tweet = tweet.strip('\'"')
    return tweet

for filename in glob.glob(os.path.join(path, '*.txt')):
  with open(filename) as file:
    tweet=file.read()

  processedTweet = processTweet(tweet)

  file = open(filename, "w")
  file.write(processedTweet)
  file.close()

如何在Python中编写多个txt文件？

问题描述

1 个解决方案

解决方案1
0 已采纳 2016-11-17 15:28:15

如何在Python中编写多个txt文件？

问题描述

1 个解决方案

解决方案1 0 已采纳 2016-11-17 15:28:15

解决方案1
0 已采纳 2016-11-17 15:28:15