除了 jsoup 主动跳过我需要的一个值这一事实之外,我真的不知道如何描述我的问题。 我试图从选定用户那里获取 Instagram 帖子的平均参与度/点赞/评论的价值; 但让我们坚持参与。 到目前为止,在我的测试中,我已经看到它跳过了 <span id=... 和 <span class ...
除了 jsoup 主动跳过我需要的一个值这一事实之外,我真的不知道如何描述我的问题。 我试图从选定用户那里获取 Instagram 帖子的平均参与度/点赞/评论的价值; 但让我们坚持参与。 到目前为止,在我的测试中,我已经看到它跳过了 <span id=... 和 <span class ...
下面的代码只检索简单的文本,但我想保留 HTML 格式。 这是我的示例代码: ...
这是我的代码; 这个 function 将 URL 作为输入,在我们的例子中: https://finance.yahoo.com/quote/AAPL/financials?p=AAPL&guccounter=2并使用JSOUP提取所有div标签。 然后,我需要使用模式匹配来提取这些值。 ...
您好我想从网站上删除信息,所以我尝试使用 Jsoup(也尝试过 HttpClient)来这样做。 我意识到他们都无法“看到”html 页面的某些内容。 所以当我试图打印出解析后的 html 时,我得到了这样的空 div。 它打印出其他一些 div 就好了。 这是我的代码: 终端中的结果是: 我在 s ...
我正在使用 JSoup 从一个网站解析一些值,其中一些也是 url 链接 (href)。 当我获得 url 链接时,我将其设置为一个字符串。 该字符串有时不会成为有效的 URL 链接,因为它有一个特殊字符,如 '??() 示例: https://somelink.com/King's+Beak (' ...
我需要知道 h3[id=hm_2] 标签后所有 p 元素的大小。 有没有办法做到这一点? 由于这不起作用,结果应该是 3。提前多谢。 这是我的一段代码: HTML涉及的码片: ...
我想打印 html 表的第一列, 例如,我只需要打印序列号,或只打印大学名称。 图像结果 ...
我想用 JSoup(版本 1.15.3)生成一个 HTML 文档。 HTML 文档应包含带有比较的脚本。 这是创建脚本元素并用一些 JavaScript 填充它的代码:Element script = document.getElementsByTag("head").first().appen ...
当尝试使用 jsoup (org.jsoup 1.15.3) 获取 web 页面时,对于未编码的 URL,我得到 MalformedUrlException。 我可以看到代码试图进行编码 (org.jsoup.helper.HttpConnection#encodeUrl(java.net.URL) ...
我正在通过 jsoup 在 Java 上制作简单的天气解析器。 昨天它运行良好,但今天我立即收到错误 429(如果我没记错的话,请求太多)。 这是我的代码,我该如何解决? 我试过将 adding.timeoute() 添加到 Jsoup.connect() 但我看不到任何结果。 ...
我使用以下代码片段从 HTML 文档中提取整个文本内容,使用 Jsoup: 它确实有效,但不幸的是所有文本内容都是一行,没有换行符。 如果我将输出重定向到一个文本文件,该文本文件只有一行非常长。 问题:从 HTML 文档中提取整个文本内容的正确方法是什么,以便在将文本内容写入文件时,根据需要正确换行 ...
我试图从YahooFinance的表中获取符号,但无法弄清楚为什么我的代码没有检测到该表。 这是我试过的: 出现错误org.jsoup.select.Selector$SelectorParseException: Could not parse query 'table.W(100%).tr': ...
我在协程中有一个jsoup function,它从网站上抓取信息,然后获取它抓取的所有信息的地图列表。 但是,每当我尝试返回列表时,都会返回: 这是 function 的代码: 这是Main Activity的代码: 无论我把退货放在哪里,除了一个空列表,我什么也得不到。 然而,当我记录列表时,它会 ...
我想遍历新闻表并获取每一行的标题和评级。 我尝试了不同的选项,但我不明白为什么 select 方法会一次收到所有选项。 我需要让每个新闻块循环。 我用这种方式获取表格链接:Elements elements = document.select("#hnmain > tbody > tr ...
瓦丁 23. 我们将 html 存储在我们需要在 vaadin 组件中呈现的数据库中。 html 包含一个 web 组件“文本块” 文本块可以包含嵌套的子项:<p> <text-block page="PackageSearch" block="empty-search-Sign ...
我有一个抓取网页的程序。 我正在使用 JSoup 和 Selenium。要在 JSoup 请求中配置用户代理,我有一个包含用户代理列表的 userAgents.txt 文件。 在每次执行中,我都有一个读取.txt 文件并返回随机用户代理的方法。 该程序在 IntelliJ 中运行时按预期工作。 当我 ...
我需要解析 HTML 文本两次并收集不同的元素。 在我的第一次解析中,我用 eg 收集它们 在第二轮类似 我不能一次性收集它们。 该算法将非常复杂。 我需要根据 HTML 文本中的 position 对referenceElements进行排序,即类似于 老实说,我不知道如何比较它们。 我只找到了 ...
假设我有一个 jsoup 查询:"main#main-content > ol > li:eq(0) a" 它返回表第一行中包含的所有a元素(按预期工作)。 现在我想提取最后一个元素。 我怎样才能使用单个 jsoup 查询来做到这一点? (又名。如何重写上面的 jsoup 查询以表示 ...
我需要使用 Java 和 Jsoup 解析一个表,并根据它的值更改单元格的颜色。 这就是 html 表的样子,也是需要定义单元格颜色的方式 我写了一个脚本,可以准备一个单元格的值并从中更改文本,但是我无法同时更改颜色 这是我得到的错误: ...