[英]Getting the text of an HTML <a> tag in BeautifulSoup
我有一個腳本,使用BeautifulSoup查找某個類的所有信息,我想獲取一個標記的文本。
我的意思是:
<a href="/weather">Weather</a>
在顯示天氣的href后面獲取文本。
每個標簽都在我正在使用的div中
blank = soup.findAll(attrs={"blank"})
我全班都回來了。
我嘗試使用.decode_contents()但:
我希望在每個元素上執行該操作,並且根據我看到的.decode_contents,您需要在列表中指定要對其執行的元素。
它仍然返回整個類和<a>
元素,而不僅僅是返回我想要的“天氣”。
我如何僅在<a>
標記中找到文本並將其返回到控制台?
blank = soup.find_all('a')
blank.attrs['href']
這將返回已解析的html數據中所有<a>
標記中所有內部文本的列表(空白)。
打印數據:
for blank in soup.find_all("a"):
print("Inner Text: {}".format(blank.text))
您可以將CSS選擇器用於特定元素。
for item in soup.select('a[href*="weather"]'):
print(item.text)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.