cost 268 ms
jsoup 找不到 span id 或 class 的值 - jsoup does not find value of span id or class

除了 jsoup 主动跳过我需要的一个值这一事实之外,我真的不知道如何描述我的问题。 我试图从选定用户那里获取 Instagram 帖子的平均参与度/点赞/评论的价值; 但让我们坚持参与。 到目前为止,在我的测试中,我已经看到它跳过了 <span id=... 和 <span class ...

Jsoup 和 HttpClient 看不到页面内容 - Page content couldn't be seen by Jsoup and HttpClient

您好我想从网站上删除信息,所以我尝试使用 Jsoup(也尝试过 HttpClient)来这样做。 我意识到他们都无法“看到”html 页面的某些内容。 所以当我试图打印出解析后的 html 时,我得到了这样的空 div。 它打印出其他一些 div 就好了。 这是我的代码: 终端中的结果是: 我在 s ...

使用 Jsoup 从 HTML 文档中提取整个文本内容 - Extracting the entire text content from an HTML document using Jsoup

我使用以下代码片段从 HTML 文档中提取整个文本内容,使用 Jsoup: 它确实有效,但不幸的是所有文本内容都是一行,没有换行符。 如果我将输出重定向到一个文本文件,该文本文件只有一行非常长。 问题:从 HTML 文档中提取整个文本内容的正确方法是什么,以便在将文本内容写入文件时,根据需要正确换行 ...

2022-12-22 21:44:44   1   22    jsoup  
如何从Kotlin中的协程scope返回一个变量 - How to return a variable from inside coroutine scope in Kotlin

我在协程中有一个jsoup function,它从网站上抓取信息,然后获取它抓取的所有信息的地图列表。 但是,每当我尝试返回列表时,都会返回: 这是 function 的代码: 这是Main Activity的代码: 无论我把退货放在哪里,除了一个空列表,我什么也得不到。 然而,当我记录列表时,它会 ...

Maven Package:.txt 未包含在 .jar 文件中 - Maven Package: .txt is not being included in the .jar file

我有一个抓取网页的程序。 我正在使用 JSoup 和 Selenium。要在 JSoup 请求中配置用户代理,我有一个包含用户代理列表的 userAgents.txt 文件。 在每次执行中,我都有一个读取.txt 文件并返回随机用户代理的方法。 该程序在 IntelliJ 中运行时按预期工作。 当我 ...

使用 GetElementsByClass 查找所有<div>名称为 class 的元素,嵌套在一个<p>元素</p></div><div id="text_translate"><p>我在 Kotlin 中使用 Jsoup 创建一个解析器</p><p>我需要在带有 class “titleCard-synopsis” 的标签内获取带有 class “ptrack-content” 的标签的内部文本</p><p>当我尝试在由以前的 getElementsByClass 创建的元素对象中获取 getElementsByClass 时,我得到 0 个元素</p><p>代码:</p><pre class="lang-kotlin prettyprint-override"> class NetlifxHtmlParser { val html = """ <div class="titleCardList--metadataWrapper"> <div class="titleCardList-title"><span class="titleCard-title_text">Map Her</span><span><span class="duration ellipsized">50m</span></span></div> <p class="titleCard-synopsis previewModal--small-text"> <div class="ptrack-content">A hidden map rocks Hartley High as the students' sexcapades are publicly exposed. Caught as the culprit, Amerie becomes an instant social pariah.</div> </p> </div> <div class="titleCardList--metadataWrapper"> <div class="titleCardList-title"><span class="titleCard-title_text">Renaissance Titties</span><span><span class="duration ellipsized">50m</span></span></div> <p class="titleCard-synopsis previewModal--small-text"> <div class="ptrack-content">Amerie, the new outcast, receives a party invitation that gives her butterflies. But when she manages to show up, a bitter surprise awaits.</div> </p> </div> """.trimIndent() fun parseEpisode() { val doc = Jsoup.parseBodyFragment(html) val titleCards = doc.getElementsByClass("titleCard-synopsis") println("Episode: count titleCard = > ${titleCards.count()}") // 2 titleCards.forEachIndexed { index, element -> val ptrack = element.getElementsByClass("ptrack-content") println("Episode: count ptrack = > ${ptrack.count()}") // 0.! println("inner html = > ${ptrack.html()}") // null string !! } } }</pre><p> 在上面的代码中,</p><p> 首先,我正在提取名称为 class 的标签titleCard-synopsis 。</p><p> 为此,我使用doc.getElementsByClass("titleCard-synopsis")返回 2 个元素项。</p><p> 然后,在titleCard元素列表中,我通过在每个元素中使用相同的 getElementsByClass 来提取ptrack-content为 Class 的元素,</p><p> 返回空列表。</p><p> 为什么会这样?</p><p> 我的目标是,我需要提取每个标题的描述文本,存储在带有 class titleCard-synopsis 的 p 标签的内部标签中。</p><p> 如果我尝试直接从“ptrack-content”获取,它工作正常,但这是一个通用的 class 在主要 HTML 源的许多地方使用。 (这是片段)</p><p> 我需要在带有 class “titleCard-synopsis” 的标签内获取带有 class “ptrack-content” 的标签的内部文本</p><p>但是在上面的代码方法中,我只得到空列表。</p><p> 为什么?</p><p> 另请注意,如果我在titleCards ( ptrack.html() ) 的元素 object 中调用HTML()方法,我不会得到内部 DIV 标记,一个空字符串!!!</p><p> 请指导我解决问题!</p></div> - Use GetElementsByClass to find all <div> elements by class name, nested inside a <p> element

我在 Kotlin 中使用 Jsoup 创建一个解析器我需要在带有 class “titleCard-synopsis” 的标签内获取带有 class “ptrack-content” 的标签的内部文本当我尝试在由以前的 getElementsByClass 创建的元素对象中获取 getElemen ...

Jsoup:检查元素是否在另一个元素之前(排序)? - Jsoup: check if Element is before another (sorting)?

我需要解析 HTML 文本两次并收集不同的元素。 在我的第一次解析中,我用 eg 收集它们 在第二轮类似 我不能一次性收集它们。 该算法将非常复杂。 我需要根据 HTML 文本中的 position 对referenceElements进行排序,即类似于 老实说,我不知道如何比较它们。 我只找到了 ...

2022-10-11 09:21:23   1   34    jsoup  
Select 来自另一个 select 使用单个查询字符串的结果的元素 - Select an element from the result of another select using a single query string

假设我有一个 jsoup 查询:"main#main-content &gt; ol &gt; li:eq(0) a" 它返回表第一行中包含的所有a元素(按预期工作)。 现在我想提取最后一个元素。 我怎样才能使用单个 jsoup 查询来做到这一点? (又名。如何重写上面的 jsoup 查询以表示 ...

2022-10-06 21:07:05   1   59    java / jsoup  

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM