簡體   English   中英

如何從文本中提取所需信息? Python

[英]How to extract required information from a text? python

我想提取:tamar tamar,0529589055

從這篇文章開始,我必須多次這樣做。

                    <h3 class="name">tamar tamar</h3>
                    <ul class="list-inline">
                        <li>gender:female</li>
                        <li>age:20</li>
                    <li class="phone" data="0529589055">phone:  0529589055</li>
                    <li class="email" data="tamar0529589055@gmail.com">email: tamar89055@gmail.com</li>         <!--                        <a 

你有沒有想過嘗試使用正則表達式? 例如一個簡單的(\\w+ \\w+)</h3>將提取名稱。 至少對於上面的例子。 對於類似的數字: (0\\d+)</li>從我的頭頂。

我發現易於使用的在線正則表達式站點: https : //pythex.org

和 python 正則表達式文檔: https : //docs.python.org/2/library/re.html

BeautifulSoup就是您要找的

from bs4 import BeautifulSoup
a='''<h3 class="name">tamar tamar</h3>
<ul class="list-inline">
    <li>gender:female</li>
    <li>age:20</li>
<li class="phone" data="0529589055">phone:  0529589055</li>
<li class="email" data="tamar0529589055@gmail.com">email: tamar89055@gmail.com</li> 
'''
soup = BeautifulSoup(a)
print(soup.find('h3',{"class": "name"}).text)
print(soup.find('li',{"class":'phone'}).text)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM