![](/img/trans.png)
[英]Ignore one div class in BeautifulSoup find_all in Python 3
[英]Python beautifulsoup find_all can‘t find <div class=“ ”>
我正在嘗試使用 beautifulsoup 來查找 HTML 標簽中的內容。 但是當標簽是/ div class=" " /時,就不行了。 雙引號中有空格時不能正確識別。
這是我的代碼:
from bs4 import BeautifulSoup
if __name__ == "__main__":
soup = BeautifulSoup(open("1946.html", encoding='utf-8'), 'lxml')
for k in (soup.find_all('div', class_=" ")):
print(k)
謝謝你的幫助。
whitespace
是 class 名稱列表中的分隔符,因此您找不到它。 只需從您的選擇中刪除whitespace
即可獲得結果並查看 output,因為這是解析器識別它的方式。
注意:它會解釋為沒有可用的 class。 因此,您可能必須更改選擇器策略並使用其他屬性或元素 - 問題需要改進/示例以獲得更具體的答案。
from bs4 import BeautifulSoup
html='''
<div>a</div>
<div class>b</div>
<div class="">c</div>
<div class=" ">d</div>
<div class="x ">x</div>
'''
soup = BeautifulSoup(html, 'html.parser')
for k in (soup.find_all('div', class_="")):
print(k)
<div>a</div>
<div class="">b</div>
<div class="">c</div>
<div class="">d</div>
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.