簡體   English   中英

Jsoup 停止解析網頁

[英]Jsoup stops parsing a webpage

Jsoup.parse(String html) 停止工作。 當我多次使用 jsoup 解析不同的頁面時,我有一個應用程序,但是當我想解析一個大頁面時,jsoup 就停止了,僅此而已。 它是否有頁面的限制或最大尺寸?

java.lang.OutOfMemoryError
at java.lang.Object.internalClone(Native Method)
at java.lang.Object.clone(Object.java:82)
at java.lang.AbstractStringBuilder.append0(AbstractStringBuilder.java:172)
at java.lang.StringBuilder.append(StringBuilder.java:224)
at org.jsoup.parser.Tokeniser.emit(Tokeniser.java:76)
at org.jsoup.parser.TokeniserState$1.read(TokeniserState.java:26)
at org.jsoup.parser.Tokeniser.read(Tokeniser.java:42)
at org.jsoup.parser.TreeBuilder.runParser(TreeBuilder.java:101)
at org.jsoup.parser.TreeBuilder.parse(TreeBuilder.java:53)
at org.jsoup.parser.Parser.parse(Parser.java:24)
at org.jsoup.Jsoup.parse(Jsoup.java:44)
...

編輯:我將頁面的 substring 獲取了幾千個第一個字符,然后它設法解析它。 因此,似乎 Jsoup 可以管理的字符數是有限的。可能數據類型在這里很重要。

編輯:編輯:在分析了一點可能是錯誤並嘗試編寫我自己的 HTML 解析器后,這導致了很大的壓力,我發現 Dalvik VM 在堆上只分配了 4.3 MB,我假設是不同的電腦到電腦..要嘗試增加它..

嘗試使用 HttpClient 等其他方法獲取頁面內容,然后調用

Jsoup.parse(String html);

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM