簡體   English   中英

python beautifulsoup提取標簽之間的出現次數

[英]python beautifulsoup extract number of appearance between tag

我想提取網頁標簽之間的“歸檔”數量。 這是我的代碼。

from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen("https://www.crummy.com/software/BeautifulSoup/")
bsObj = BeautifulSoup(html, "html.parser")

nameList = bsObj.findAll(text="file it")
print(len(nameList))

如果使用“將文件歸檔”或“下載”,則結果1效果很好。如果使用“名人堂”,則結果2效果很好。

但是,在“討論組”的情況下,應該為2,但不起作用,結果為0。

為什么在“討論組”案例或“獲取源代碼”案例中得到結果0?

import re
nameList = bsObj.findAll(text=re.compile(r"the\s+discussion\sgroup"))

在正則表達式中使用\\s+來匹配所有空白,包括\\n

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM