cost 312 ms
JTidy 没有正确处理某些字符 - JTidy not handling some characters correctly

在我调用 Tidy.parse 后,某些字符会被破坏。 两个例子是:'代替'和~代替~ 我猜这些一定来自 Word 或类似的东西,但 tidy 处理它们非常糟糕。 具体来说,它将它们转换为变音符号的单个实体表示,然后在我的过程中稍后将其转换为无意义的垃圾。 我敢肯定还有其他的,但这些是我目前找到的 ...

2019-04-16 15:00:15   1   32    jtidy  
将Word xml转换为html并将html转换为word xml(使用Java) - Convert word xml to html and html to word xml(Using Java)

我尝试了一些方法( Jtidy )通过JAVA将XML单词转换为HTML以及将HTML转换为XML单词。 但是缺少最终单词XML文件中的某些单词属性。 注意:我们已经基于模式处理XML标签。 是否有更好的方法将Word XML转换为HTML? (反之亦然)还是在XML模式中使用单 ...

JTidy报告“发现了3个错误!”……但没有说明它们是什么。 - JTidy reports “3 errors were found!”… but does not say what they are

我有一大堆以编程方式生成的HTML。 我使用以下Java代码通过Tidy(版本r938)运行了该代码: 我得到以下输出: 麻烦的是,Tidy没有告诉我发现了3个错误。 我在这里摆弄一点。 上面的输出实际上是所有247条警告的一长串(主要是修剪掉空的div元素)。 我可 ...

2016-11-18 22:32:46   1   232    java / jtidy  
JTidy正在包装我的段落 - JTidy Is Wrapping My Paragraphs

我正在使用JTidy和Flying Saucer从HTML创建PDF文档。 在将文档传递到飞碟之前,我使用JTidy来确保所有元素都是干净的并且格式正确。 我遇到了JTidy的问题,无法解决。 有一个“ p”元素,其中包含大量文本,它是从数据库中填充的,并已使用空格格式化。 在HTM ...

如何在XML消息中删除XML中的&lt;和&gt; - How to remove < and > in XMLthat is part of the XML message

我有如下所示的XML: XML包含使XML无效的'&lt;'字符。 现在,最简单的方法是修复XML的源,但是不幸的是,我无法控制XML的创建。 它有类似“小于10”的消息。 无论如何,有什么方法可以检查XML这样的东西并转义那些字符吗? 我尝试在“看这篇文章”中看到那 ...

从包含文本的父级获取NodeList - Get NodeList from parent who contains text

我想从一个其中包含特定文本的父节点获取所有子节点。 换句话说:我在确定包含所需字符串的某个子节点上开始搜索。 一旦找到它,而不是从匹配相同Xpath表达式的节点中获取其他所有字符串,则需要使其他节点处于相同级别。 我正在使用Java。 例如: 如果我寻找IIND1000,我想获取 ...

以编程方式验证HTML代码 - Validate HTML code programmatically

我正在尝试验证HTML代码的String 。 也就是说,当HTML代码语法错误时,我想知道,也许是以return false的形式。 我目前正在使用JTidy,但它并没有告诉我语法错误,它只是对其进行了纠正。 我不需要更正它,只需说一下合成胶是好还是坏。 JTidy代码: ...

运行jtidy测试 - Run the jtidy tests

我正在尝试在jtidy源代码中运行单元测试,但出现此异常。 有谁知道如何解决这一问题? 我猜软件包文件夹设置不正确。 java.lang.Error:java.util.MissingResourceException:在org.w3c上的org.w3c.tidy.Report。( ...

2013-09-23 14:32:07   1   76    jtidy  
Jtidy-是否应该<sup>在页面源代码中显示TM的</sup>编码字符( <sup>¢)?</sup> - Jtidy - Shouldn't display encoding character(<sup>&acirc;&#132;&cent;) for TM in page source code?

我正在使用Jtidy提供新闻信息,当新闻信息中包含TM时,页面源将其显示为 'â??¢'这是无效的... 这是我的代码: InputStream是= new ByteArrayInputStream(description.getBytes()); OutputStream ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM