[英]parse html beautiful soup
我有一個html頁面
<a email="corporate@max.ru" href="http://www.max.ru/agent?message&to=corporate@max.ru" title="Click herе" class="mf_spIco spr-mrim-9"></a><a class="mf_t11" type="booster" href="http://max.ru/mail/corporate/">
我需要解析電子郵件字符串
soup = BeautifulSoup(data
string = soup.find("a",{"email": ""})
print string
但它不起作用。 哪里有錯?
您的錯誤在於使用attrs
字典查找電子郵件屬性為空的元素。 試試這個吧。
#!/usr/bin/env python
from BeautifulSoup import BeautifulSoup
import urllib2
req = urllib2.urlopen('http://worldnuclearwar.ru')
soup = BeautifulSoup(req)
print soup.find("a", email=True)["email"]
要打印email
的第一個屬性a
它有一個元素email
屬性。 如果您需要所有電子郵件,請嘗試
for link in soup.findAll("a", email=True):
print link["email"]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.