[英]Get span text that has no attribute using Beautiful Soup Python
我正在抓取一個網站,但在獲取跨度文本時遇到了麻煩。 我已經看到您可以在下面使用它來獲取文本:
<span title="9 gold badges"><span class="badge1"></span><span class="badgecount">9</span></span>
badges = soup.body.find('div', attrs={'class': 'badges'})
for span in badges.span.find_all('span', recursive=False):
print span.attrs['title']
但是,我感興趣的跨度沒有屬性。 我如何獲得短信?
<span>Geolocation: 35.1391, -90.0536</span>
tag.text或tag.get_text()
for span in badges.span.find_all('span', recursive=False):
print span.text
輸出示例:
>>> span = soup.find('span')
>>> span
<span>Geolocation: 35.1391, -90.0536</span>
>>> span.text
'Geolocation: 35.1391, -90.0536'
>>> span.get_text()
'Geolocation: 35.1391, -90.0536'
要獲取沒有屬性的所有span標簽,請嘗試以下代碼段:
for span in badges.span.find_all('span', recursive=False):
if not span.attrs.values():
print (span.text)
希望這對您有用。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.