簡體   English   中英

<a>在BeautifulSoup中</a>獲取HTML <a>標簽</a>的文本

[英]Getting the text of an HTML <a> tag in BeautifulSoup

我有一個腳本,使用BeautifulSoup查找某個類的所有信息,我想獲取一個標記的文本。

我的意思是:

<a href="/weather">Weather</a> 

在顯示天氣的href后面獲取文本。

每個標簽都在我正在使用的div中

blank = soup.findAll(attrs={"blank"})

我全班都回來了。

我嘗試使用.decode_contents()但:

我希望在每個元素上執行該操作,並且根據我看到的.decode_contents,您需要在列表中指定要對其執行的元素。

它仍然返回整個類和<a>元素,而不僅僅是返回我想要的“天氣”。

我如何僅在<a>標記中找到文本並將其返回到控制台?

blank = soup.find_all('a')
blank.attrs['href']

這將返回已解析的html數據中所有<a>標記中所有內部文本的列表(空白)。

打印數據:

for blank in soup.find_all("a"):
    print("Inner Text: {}".format(blank.text))

您可以將CSS選擇器用於特定元素。

for item in soup.select('a[href*="weather"]'):
  print(item.text)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM