簡體   English   中英

JAVA的JSP和HTML解析器

[英]JSP and HTML parser for JAVA

我一直在使用Jsoup來解析我的HTML文件,到目前為止它做得很好。 但是,它無法解析任何服務器標簽(<%...%>)。 我決定擴展它,但我找不到一個簡單的方法來擴展它的Parser和所有那些私有/包級別的類(即TreeBuilder,TransitionState ......等)......

所以我開始關注傑里科,因為它聲稱它可以解析服務器標簽 - 但是,它的文檔很差,我甚至無法輕易上手。 並且看起來它的API不像Jsoup提供的那樣友好 - 它不是那么直接提取一些節點並移動它...

我想知道是否有人之前有類似的情況以及如何解決它? 簡而言之,我只想用Java解析JSP文件。 (好吧..請不要讓我自己實施; p)

最后我得到一個解決方法:將服務器代碼塊放在HTML注釋塊中,以便1)服務器代碼可以正確執行; 2)Jsoup可以將整個塊作為HTML注釋節點處理,而不會觸及任何內部。

例如

<!--
<%@ page language="java" errorPage="/error.jsp" pageEncoding="UTF-8" contentType="text/html;charset=UTF-8" %>
<%@ page import="com.systemcrossed.groupbuystart.webapp.display.DisplayHelper" %>
<%@ page import="com.systemcrossed.groupbuystart.webapp.util.JsonUtil" %>
<%@ page import="org.apache.commons.lang.StringEscapeUtils" %>
<%@ include file="/_sys/pages/public/incl/jspCommon.jsp" %>
-->
<!--<%
    // Java code here
%>-->
<html>
<head>
    ... html stuff

它現在對我有用! 希望獲得同樣問題的人可以得到一些幫助! ;)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM