簡體   English   中英

使用Beautiful Soup Python獲取沒有屬性的跨度文本

[英]Get span text that has no attribute using Beautiful Soup Python

我正在抓取一個網站,但在獲取跨度文本時遇到了麻煩。 我已經看到您可以在下面使用它來獲取文本:

    <span title="9 gold badges"><span class="badge1"></span><span class="badgecount">9</span></span>
    badges = soup.body.find('div', attrs={'class': 'badges'})
    for span in badges.span.find_all('span', recursive=False):
        print span.attrs['title']

但是,我感興趣的跨度沒有屬性。 我如何獲得短信?

     <span>Geolocation: 35.1391, -90.0536</span>

tag.text或tag.get_text()

for span in badges.span.find_all('span', recursive=False):
    print span.text

輸出示例:

>>> span = soup.find('span')
>>> span
<span>Geolocation: 35.1391, -90.0536</span>
>>> span.text
'Geolocation: 35.1391, -90.0536'
>>> span.get_text()
'Geolocation: 35.1391, -90.0536'

要獲取沒有屬性的所有span標簽,請嘗試以下代碼段:

for span in badges.span.find_all('span', recursive=False):
    if not span.attrs.values():
        print (span.text)

希望這對您有用。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM