簡體 English 中英

使用 Java/Jsoup 從 HTML 內容中提取 JS 庫

[英]Extract JS Libraries from HTML content using Java/Jsoup

原文 2019-02-17 18:16:25 5 1 javascript/ java/ jsoup

頁面： https : //en.wikipedia.org/wiki/Punjab,_India

HTML 源供參考（使用 Chrome） ： view-source:https://en.wikipedia.org/wiki/Punjab,_India

使用上面的頁面 URL，我想提取 HTML 中使用的所有 javascript 庫。

是否有使用Jsoup/Java或任何其他可以使用的 Java 庫的簡單方法。

1 個解決方案

您可以嘗試以下簡單的解決方案：

          List<String> sources = Jsoup.parse(html)
            .select("script")
            .stream()
            .map(element -> element.attr("src"))
            .filter(src -> !StringUtil.isBlank(src))
            .collect(Collectors.toList());

對您來說可能就足夠了。 如果沒有，請說明您期望什么輸出。

在我看來，您想從html頁面提取一些數據。 我建議您看一下此框架https://github.com/GoogleChrome/puppeteer/blob/v1.10.0/docs/api.md#，但是您必須遍歷DOM才能提取信息。 可以幫助解決此問題的另一個框架是https://jquery.com/ 。

如何使用jsoup從不同類型的粗體html表達式的各種html頁面中提取粗體內容？

[英]How to extract bold content using jsoup from various html pages of different types of bold html expression?

使用Java中的Jsoup檢測Javascript庫

[英]detect Javascript libraries using Jsoup in Java

無法通過jsoup從html提取我想要的元素

[英]Can not extract the elements i want from html by jsoup

使用YQL提取HTML內容？

[英]Extract HTML content using YQL?

Java Jsoup：提取所有文本

[英]Java Jsoup : Extract all the text

如何使用javascript或angularjs從字符串中提取html標簽的內容？

[英]How to extract content of html tags from a string using javascript or angularjs?

使用.net從HTML頁面解析（提取）內容

[英]Parse (extract) content from a html page using .net

如何使用jQuery從Ajax提取的內容中提取HTML

[英]How to Extract HTML from Content Fetched with Ajax using jQuery

如何使用jsoup從網頁中提取javascript的某些部分？

[英]How extract some part of a javascript from a webpage using jsoup?

從 HTML 提取 href 元素無法使用 node.js

[英]Extract href from HTML Element not working using node.js

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何使用jsoup從不同類型的粗體html表達式的各種html頁面中提取粗體內容？使用Java中的Jsoup檢測Javascript庫無法通過jsoup從html提取我想要的元素使用YQL提取HTML內容？ Java Jsoup：提取所有文本如何使用javascript或angularjs從字符串中提取html標簽的內容？使用.net從HTML頁面解析（提取）內容如何使用jQuery從Ajax提取的內容中提取HTML 如何使用jsoup從網頁中提取javascript的某些部分？從 HTML 提取 href 元素無法使用 node.js

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM