解析html漂亮湯

Question

我有一個html頁面

<a email="corporate@max.ru" href="http://www.max.ru/agent?message&to=corporate@max.ru" title="Click herе" class="mf_spIco spr-mrim-9"></a><a class="mf_t11" type="booster" href="http://max.ru/mail/corporate/">

我需要解析電子郵件字符串

    soup = BeautifulSoup(data
    string = soup.find("a",{"email": ""})
    print string

但它不起作用。 哪里有錯？

Answer 1

您的錯誤在於使用attrs字典查找電子郵件屬性為空的元素。 試試這個吧。

#!/usr/bin/env python

from BeautifulSoup import BeautifulSoup
import urllib2

req = urllib2.urlopen('http://worldnuclearwar.ru')

soup = BeautifulSoup(req)
print soup.find("a", email=True)["email"]

要打印email的第一個屬性a它有一個元素email屬性。 如果您需要所有電子郵件，請嘗試

for link in soup.findAll("a", email=True):
    print link["email"]

解析html漂亮湯

問題描述

1 個解決方案

解決方案1
4 2010-10-02 18:38:52

解析html漂亮湯

問題描述

1 個解決方案

解決方案1 4 2010-10-02 18:38:52

解決方案1
4 2010-10-02 18:38:52