[英]How can I save sort .txt into files? Python or shell script
我有一個python程序,可以下載文章文本,然后將其轉換為txt文件。 該程序當前在該程序所在的目錄中吐出txt文件。我想將此文本放在特定於它們來自的新聞源的文件夾中。 我可以將數據保存在python程序本身的文件夾中,並在新聞源文件更改時更改目錄嗎? 還是我應該創建一個外殼腳本,在需要的文件夾中運行python程序? 還是有更好的方法來排序我丟失的這些文件?
這是Python程序的代碼:
import feedparser
from goose import Goose
import urllib2
import codecs
url = "http://rss.cnn.com/rss/cnn_tech.rss"
feed = feedparser.parse(url)
g = Goose()
entryLength = len(feed['entries'])
count = 0
while True:
article = g.extract(feed.entries[count]['link'])
title = article.title
text = article.cleaned_text
file = codecs.open(feed['entries'][count]['title'] + ".txt", 'w', encoding = 'utf-8')
file.write(text)
file.close()
count = count + 1
if count == entryLength:
break
如果僅提供保存功能文件名,它們將保存到當前目錄。 但是,如果為它們提供路徑,則文件將在那里結束。 Python會處理它。
folder = 'whatever' #the folder you wish to save the files in
name = 'somefilename.txt'
filename = os.path.join(folder, filename)
使用該文件名將使文件最終位於文件夾“ whatever /”中
編輯:我看到你現在已經發布了代碼。 就像br1ckb0t在下面的評論中提到的那樣,您可以在代碼中編寫類似codecs.open(folder + feed['entries']...
。如果這樣做,請確保在文件夾后添加斜杠,否則它只會最終成為文件名的一部分。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.