[英]How to extract required information from a text? python
我想提取:tamar tamar,0529589055
從這篇文章開始,我必須多次這樣做。
<h3 class="name">tamar tamar</h3>
<ul class="list-inline">
<li>gender:female</li>
<li>age:20</li>
<li class="phone" data="0529589055">phone: 0529589055</li>
<li class="email" data="tamar0529589055@gmail.com">email: tamar89055@gmail.com</li> <!-- <a
你有沒有想過嘗試使用正則表達式? 例如一個簡單的(\\w+ \\w+)</h3>
將提取名稱。 至少對於上面的例子。 對於類似的數字: (0\\d+)</li>
從我的頭頂。
我發現易於使用的在線正則表達式站點: https : //pythex.org
和 python 正則表達式文檔: https : //docs.python.org/2/library/re.html
BeautifulSoup就是您要找的
from bs4 import BeautifulSoup
a='''<h3 class="name">tamar tamar</h3>
<ul class="list-inline">
<li>gender:female</li>
<li>age:20</li>
<li class="phone" data="0529589055">phone: 0529589055</li>
<li class="email" data="tamar0529589055@gmail.com">email: tamar89055@gmail.com</li>
'''
soup = BeautifulSoup(a)
print(soup.find('h3',{"class": "name"}).text)
print(soup.find('li',{"class":'phone'}).text)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.