[英]find comments in javascript and css in python requests module
我试图在 JavaScript 和 CSS 页面中找到所有评论。 此代码在 HTML 页面中找到 HTML 注释。
import requests
from bs4 import BeautifulSoup as BS
from bs4 import Comment
with requests.session() as r:
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:88.0) Gecko/20100101 Firefox/88.0'}
r = requests.get('https://example.com/page.js', verify=False, headers=headers)
response = r.text
soup = BS(response, 'html.parser')
comments = soup.find_all(string=lambda text: isinstance(text, Comment))
for c in comments:
print(c)
但是对于 JavaScript 和 CSS,注释在 /* 和 */ 之间。 有什么方法可以修改该代码以检索 JavaScript 或 CSS 评论。
我对 BeautifulSoup 不够熟悉,但是您可以找到注释在哪里,使用response.find('/*')
, response.find('*/')
在循环中,使用find
的第二个参数,开始查找对于下一条评论,仅在前一条结束之后。
免责声明:您仍然可以将 /* 或 */ 作为文本而不是评论,这更难以应对。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.