繁体   English   中英

如何忽略图像和其他不必要的文件以降低 Jsoup 中的响应时间

[英]How can I ignore images and other unnecessary files to lower response time in Jsoup

我一直在使用 Jsoup 获取 html 文档,如下所示:

Jsoup.connect(url).get();

但我注意到 Jsoup 在给我数据之前等待所有内容加载。 我知道我要查找的数据在 Html 文档中。 在查看响应(通过谷歌 Chrome 网络分析工具)时,html 文档是在第一个 ~100ms 发送的,我不想等待额外的 ~1500ms 来访问该数据。

有没有办法让请求跳过不需要的文件或在 Revinge html 文档后停止请求?

任何可以使获取数据的过程更快的建议将不胜感激。

你的假设实际上是错误的。 Jsoup 仅获取您将 url 传递给的一个文档。 它不会自动获取任何资源(图像、css、js 文件等)。 您可以查看源代码来证明这一点。 Jsoup 只会跟随重定向,如果被激活。

也许服务器会延迟响应,因为您发送的请求没有User-Agent标头。 您可以使用Connection.userAgent()解决此问题并添加例如 chrome 用户代理:

Jsoup.connect(url)
        .userAgent("Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36")
        .get();

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM