<a>在BeautifulSoup中</a>獲取HTML <a>標簽</a>的文本

Question

我有一個腳本，使用BeautifulSoup查找某個類的所有信息，我想獲取一個標記的文本。

我的意思是：

<a href="/weather">Weather</a>

在顯示天氣的href后面獲取文本。

每個標簽都在我正在使用的div中

blank = soup.findAll(attrs={"blank"})

我全班都回來了。

我嘗試使用.decode_contents（）但：

我希望在每個元素上執行該操作，並且根據我看到的.decode_contents，您需要在列表中指定要對其執行的元素。

它仍然返回整個類和<a>元素，而不僅僅是返回我想要的“天氣”。

我如何僅在<a>標記中找到文本並將其返回到控制台？

Answer 1

blank = soup.find_all('a')
blank.attrs['href']

這將返回已解析的html數據中所有<a>標記中所有內部文本的列表（空白）。

打印數據：

for blank in soup.find_all("a"):
    print("Inner Text: {}".format(blank.text))

Answer 2

您可以將CSS選擇器用於特定元素。

for item in soup.select('a[href*="weather"]'):
  print(item.text)