繁体   English   中英

在 python 请求模块中的 javascript 和 css 中查找评论

[英]find comments in javascript and css in python requests module

我试图在 JavaScript 和 CSS 页面中找到所有评论。 此代码在 HTML 页面中找到 HTML 注释。

import requests
from bs4 import BeautifulSoup as BS
from bs4 import Comment

with requests.session() as r:
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:88.0) Gecko/20100101 Firefox/88.0'}
    r = requests.get('https://example.com/page.js', verify=False, headers=headers)
    response = r.text
    soup = BS(response, 'html.parser')
    comments = soup.find_all(string=lambda text: isinstance(text, Comment))

    for c in comments:
        print(c)

但是对于 JavaScript 和 CSS,注释在 /* 和 */ 之间。 有什么方法可以修改该代码以检索 JavaScript 或 CSS 评论。

我对 BeautifulSoup 不够熟悉,但是您可以找到注释在哪里,使用response.find('/*')response.find('*/')在循环中,使用find的第二个参数,开始查找对于下一条评论,仅在前一条结束之后。

免责声明:您仍然可以将 /* 或 */ 作为文本而不是评论,这更难以应对。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM