如何提取我們使用url.open（）從網站獲得的部分數據

Question

我寫了一個程序連接到這個網站

http://mbox.dr-chuck.net/sakai.devel/1/2

我需要解析它並在該網站中獲取電子郵件

url = http://mbox.dr-chuck.net/sakai.devel/1/2
data = urllib.urlopen(url).read()
for line in data:
    templine = line.strip()
    print templine

但是它會打印單個字母而不是單詞，例如當我嘗試從中打印特定行時

F
r
o
m

n
e
w
s

如何解決此問題，請幫我該怎么辦，我需要將程序打印為線條

對我的語言感到抱歉，這是我要發布的第一個問題

Answer 1

如果您使用的是python3 ，則可以執行以下操作：

from urllib.request import urlopen

data = urlopen("http://mbox.dr-chuck.net/sakai.devel/1/2").read().decode("utf8").split("\n")

for k in data:
    print(k)

更新：

如果您只想打印給定網址的第二行，則可以執行以下操作：

print(data[1])
>>> 'From: "Glenn R. Golden" <ggolden@umich.edu>'

否則，如果要打印以From或From:開頭的所有行，則可以執行以下操作：

for k in data:
    if k.split(" ")[0] == "From" or k.split(" ")[0] == "From:":
        print(k)

輸出：

From news@gmane.org Tue Mar 04 03:33:20 200
From: "Glenn R. Golden" <ggolden@umich.edu>

Answer 2

url = 'http://mbox.dr-chuck.net/sakai.devel/1/2'
data = urllib.urlopen(url).readlines()
for line in data:
    if line.startswith('From'):
        print (line)

出：

From news@gmane.org Tue Mar 04 03:33:20 2003

From: "Glenn R. Golden" <ggolden@umich.edu>

使用readlines()獲取文件中的每一行

使用startswith()獲取以From開頭的行

如何提取我們使用url.open（）從網站獲得的部分數據

問題描述

2 個解決方案

解決方案1
2 2017-02-07 13:57:49

解決方案2
1 已采納 2017-02-07 14:19:40

如何提取我們使用url.open（）從網站獲得的部分數據

問題描述

2 個解決方案

解決方案1 2 2017-02-07 13:57:49

解決方案2 1 已采納 2017-02-07 14:19:40

解決方案1
2 2017-02-07 13:57:49

解決方案2
1 已采納 2017-02-07 14:19:40