Python selenium 擺脫連字符和其他特殊的 html 字符

Question

我用 selenium 抓取網站，然后將內容放入 pandas 以輕松使用它。 我唯一的問題是，當我在 selenium webelement 上使用 .text 函數時，所有特殊的 html 字符都被保留但不能被刪除，因為它們是不可見的。 有沒有辦法在抓取時將它們全部刪除？

謝謝你們！

Answer 1

我前段時間遇到過類似的問題。 沒有任何可重現的代碼或 HTML 很難說，但我發現刪除特殊字符的最佳方法是執行 JS 腳本：

driver.execute_script("var element = document.getElementsByClassName('<class_name>');for (var i = element.length - 1; i >= 0; --i) {element[i].remove();}")

將 <class_name> 替換為您要刪除的類的名稱。 現在您可以抓取您需要的網頁元素，而無需擔心特殊字符。

Python selenium 擺脫連字符和其他特殊的 html 字符

問題描述

1 個解決方案

解決方案1
0 2022-07-15 14:15:45

Python selenium 擺脫連字符和其他特殊的 html 字符

問題描述

1 個解決方案

解決方案1 0 2022-07-15 14:15:45

解決方案1
0 2022-07-15 14:15:45