[英]How to extract a part of data, that we get from website using url.open()
我寫了一個程序連接到這個網站
http://mbox.dr-chuck.net/sakai.devel/1/2
我需要解析它並在該網站中獲取電子郵件
url = http://mbox.dr-chuck.net/sakai.devel/1/2
data = urllib.urlopen(url).read()
for line in data:
templine = line.strip()
print templine
但是它會打印單個字母而不是單詞,例如當我嘗試從中打印特定行時
F
r
o
m
n
e
w
s
如何解決此問題,請幫我該怎么辦,我需要將程序打印為線條
如果您使用的是python3
,則可以執行以下操作:
from urllib.request import urlopen
data = urlopen("http://mbox.dr-chuck.net/sakai.devel/1/2").read().decode("utf8").split("\n")
for k in data:
print(k)
更新:
如果您只想打印給定網址的第二行,則可以執行以下操作:
print(data[1])
>>> 'From: "Glenn R. Golden" <ggolden@umich.edu>'
否則,如果要打印以From
或From:
開頭的所有行,則可以執行以下操作:
for k in data:
if k.split(" ")[0] == "From" or k.split(" ")[0] == "From:":
print(k)
輸出:
From news@gmane.org Tue Mar 04 03:33:20 200
From: "Glenn R. Golden" <ggolden@umich.edu>
url = 'http://mbox.dr-chuck.net/sakai.devel/1/2'
data = urllib.urlopen(url).readlines()
for line in data:
if line.startswith('From'):
print (line)
出:
From news@gmane.org Tue Mar 04 03:33:20 2003
From: "Glenn R. Golden" <ggolden@umich.edu>
使用readlines()
獲取文件中的每一行
使用startswith()
獲取以From
開頭的行
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.