[英]Python - BeautifulSoup - German characters in html
親愛的Python專家,
我正在使用BeautifulSoup從網站上抓取一些html文本。 該站點包含德語單詞,例如“Groß”或“Bär”。 當我打印html文本時,這些字符被翻譯得很臟,從而很難在html文本中搜索單詞。
我怎么能取代SS SS到A到AE,ü到,ö到OE,在HTML文本?
我一直在尋找解決這個問題的方法,但是除了混亂的土地,它一無所獲
由於這是一個項目的幫助,非常感謝!
在讀取時,將文本分配給變量並對其進行解碼,就像您的文本存儲在變量Var
,則在讀取時使用Var.decode("utf-8")
。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.