标签[jtidy] - 堆栈内存溢出

JTidy 输出字符串而不是文档？ - JTidy output in String instead of Document?

我正在尝试使用 JTidy 将 HTML 字符串转换为 XHTML 字符串，然后使用 XMLWorkerHelper 进行解析。我如何从 Tidy 以 String 而不是 Document 格式获取输出？我的代码是： ...

Java：从 XML 文本中删除 < 和 >（不是标签） - Java: remove < and > from text in XML (not tags)

我很难转义 xml 以供 Java 处理。我正在使用 JTidy 来转义不需要的字符，但很难从<tag> capacity < 1000 </tag>等值中删除“<”和“>” 我正在使用下面的代码来转义输入 ...

JTidy 没有正确处理某些字符 - JTidy not handling some characters correctly

在我调用 Tidy.parse 后，某些字符会被破坏。两个例子是：'代替'和~代替~ 我猜这些一定来自 Word 或类似的东西，但 tidy 处理它们非常糟糕。具体来说，它将它们转换为变音符号的单个实体表示，然后在我的过程中稍后将其转换为无意义的垃圾。我敢肯定还有其他的，但这些是我目前找到的 ...

将Word xml转换为html并将html转换为word xml（使用Java） - Convert word xml to html and html to word xml(Using Java)

我尝试了一些方法（ Jtidy ）通过JAVA将XML单词转换为HTML以及将HTML转换为XML单词。但是缺少最终单词XML文件中的某些单词属性。注意：我们已经基于模式处理XML标签。是否有更好的方法将Word XML转换为HTML？（反之亦然）还是在XML模式中使用单 ...

在 Java 中评估 XPath 表达式时出现异常 - Getting Exception on evaluating an XPath expression in Java

我正在尝试使用 Java 学习 Xpath 表达式的用法。我正在使用 Jtidy 将 HTML 页面转换为 XHTML，以便我可以使用 XPath 表达式轻松解析它。我有以下代码：它适用于大多数 URL，但这个： https://twitter.com/?lang=fr 我收到 ...

JTidy报告“发现了3个错误！”……但没有说明它们是什么。 - JTidy reports “3 errors were found!”… but does not say what they are

我有一大堆以编程方式生成的HTML。我使用以下Java代码通过Tidy（版本r938）运行了该代码：我得到以下输出：麻烦的是，Tidy没有告诉我发现了3个错误。我在这里摆弄一点。上面的输出实际上是所有247条警告的一长串（主要是修剪掉空的div元素）。我可 ...

JTidy正在包装我的段落 - JTidy Is Wrapping My Paragraphs

我正在使用JTidy和Flying Saucer从HTML创建PDF文档。在将文档传递到飞碟之前，我使用JTidy来确保所有元素都是干净的并且格式正确。我遇到了JTidy的问题，无法解决。有一个“ p”元素，其中包含大量文本，它是从数据库中填充的，并已使用空格格式化。在HTM ...

jTidy漂亮的打印自定义HTML标记 - jTidy pretty print custom HTML tag

我正在尝试使用JTidy来打印由用户生成的格式良好的HTML：这是我的配置：但是jTidy正在删除我的AngularJS datasource指令。有没有办法解决这个问题？我从日志中得到这个：删除tidy.setXHTML(true)或将其设置为fals ...

Jtidy-如何保留内联元素之间的空间 - Jtidy - How to preserve space between inline elements

我的HTML来源是这样的转换后的输出如下（无空格）：- HelloWorld ...

HTML jericho，jTidy或JSoup的格式片段？ - Formatting snippet of HTML jericho, jTidy or JSoup?

我想格式化/缩进HTML片段进入这个我尝试了jTidy和JSoup，但是它们使用和/或或调整了我的HTML。我想要一种可以像上面的示例那样简单地格式化HTML的一部分的东西。我找到了jericho，它似乎可以满足我的要求，但是我更喜欢使用jTidy / JSoup ...

jtidy不能很好地解析freemarker html代码 - jtidy isn't parsing well a freemarker html code

方法：通过htmlString作为参数输入的内容：在返回语句之前填充结果的内容：我什至无法想象出什么问题了...有任何帮助或指导吗？ ...

如何在XML消息中删除XML中的<和> - How to remove < and > in XMLthat is part of the XML message

我有如下所示的XML： XML包含使XML无效的'<'字符。现在，最简单的方法是修复XML的源，但是不幸的是，我无法控制XML的创建。它有类似“小于10”的消息。无论如何，有什么方法可以检查XML这样的东西并转义那些字符吗？我尝试在“看这篇文章”中看到那 ...

从包含文本的父级获取NodeList - Get NodeList from parent who contains text

我想从一个其中包含特定文本的父节点获取所有子节点。换句话说：我在确定包含所需字符串的某个子节点上开始搜索。一旦找到它，而不是从匹配相同Xpath表达式的节点中获取其他所有字符串，则需要使其他节点处于相同级别。我正在使用Java。例如：如果我寻找IIND1000，我想获取 ...

以编程方式验证HTML代码 - Validate HTML code programmatically

我正在尝试验证HTML代码的String 。也就是说，当HTML代码语法错误时，我想知道，也许是以return false的形式。我目前正在使用JTidy，但它并没有告诉我语法错误，它只是对其进行了纠正。我不需要更正它，只需说一下合成胶是好还是坏。 JTidy代码： ...

ClassNotFoundException JTidy - ClassNotFoundException JTidy

我使用myeclipse运行我的servlet。在doPost函数中，只有一句话Tidy tidy = new Tidy(); 但是，当我运行我的servlet时，出现如下错误：我已经完成了import org.w3c.tidy.Tidy; 为什么会弹出此错误？是因为我 ...

如何在使用HTML Unit解析HTML之前清理HTML - How to clean HTML before parsing it using HTML Unit

我正在使用HtmlUnit抓取html但html的格式不正确，包含未关闭的少量标签，因此HtmlUnit给出了错误的结果。因此，在将其传递给HtmlUnit之前，需要对其进行清理。我怎样才能做到这一点。简短的代码段或教程将不胜感激 ...

如何将Tidy配置设置为不替换 标签？ - How to set Tidy configuration to not replace tags?

我希望.tmpPdf文件中的输出为“你好 world1”。这里的“ Hello world”应该有在我的输出之间。 ...

在servicemix中安装功能 - Installing a feature in servicemix

我正在运行Apache servicemix 4.5.2。我想安装一个功能，即一个jar文件。我想要的功能是jtidy 。 pom依赖是：而存储库是 http://repo1.maven.org/maven2/jtidy/jtidy/4aug2000r7-dev/j ...

运行jtidy测试 - Run the jtidy tests

我正在尝试在jtidy源代码中运行单元测试，但出现此异常。有谁知道如何解决这一问题？我猜软件包文件夹设置不正确。 java.lang.Error：java.util.MissingResourceException：在org.w3c上的org.w3c.tidy.Report。（ ...

Jtidy-是否应该在页面源代码中显示TM的编码字符（ ¢）？ - Jtidy - Shouldn't display encoding character(â¢) for TM in page source code?

我正在使用Jtidy提供新闻信息，当新闻信息中包含TM时，页面源将其显示为 'â??¢'这是无效的... 这是我的代码： InputStream是= new ByteArrayInputStream（description.getBytes（））; OutputStream ...