[英]JSOUP HTML Parser
有沒有一種方法來獲取元素/標簽的開始行和列號以及結束行和列號 ?
我正在創建HTML編輯器,該編輯器需要根據給定的起始行和結束行及列號來突出顯示標記,以便根據某些情況優化速度。
不,不幸的是,當前無法通過jsoup實現。
目前,Jsoup在解析時不跟蹤行號/字符位置,因此無法提取它們。 由於這不是核心用例,因此我不想通過保留此數據來擴展DOM的內存要求。 我曾考慮過可能添加一種可選的旁通道方法來在解析過程中對其進行跟蹤,類似於如何跟蹤解析錯誤,但尚未將其重點放在實現上。
來源: https : //groups.google.com/forum/#!topic / jsoup / lnbYSIZApWw
相反,您可以嘗試Jericho HTML Parser 。 在功能列表中說:
可以輕松訪問源文檔中每個位置的行號和列號。
請參閱此處的javadocs ,並研究諸如getRow()
, getColumn()
和getRowColumnVector()
。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.