繁体   English   中英

使用xslt时,名称不能以'='字符十六进制值0x3d开头

[英]Name cannot begin with the '=' character hexadecimal value 0x3d when use xslt

我有一些HTML。 我尝试使用库进行清理: http : //sourceforge.net/projects/tidynet/

这是我的代码:

//clean up html
            Tidy tidy = new Tidy();

            tidy.Options.DocType = DocType.Omit;
            tidy.Options.DropFontTags = true;
            tidy.Options.LogicalEmphasis = true;
            tidy.Options.Xhtml = true;
            tidy.Options.XmlOut = true;
            tidy.Options.MakeClean = true;
            tidy.Options.TidyMark = false;
            tidy.Options.CharEncoding = CharEncoding.UTF8;


            /* Declare the parameters that is needed */
            TidyMessageCollection tmc = new TidyMessageCollection();
            MemoryStream input = new MemoryStream();
            MemoryStream output = new MemoryStream();

            byte[] byteArray = Encoding.UTF8.GetBytes(report);
            input.Write(byteArray, 0, byteArray.Length);
            input.Position = 0;
            tidy.Parse(input, output, tmc);

            string cleanHtml = Encoding.UTF8.GetString(output.ToArray());

然后我尝试使用xslt:

try
            {
                StringBuilder res = new StringBuilder();
                XslCompiledTransform xslt = new XslCompiledTransform();
                xslt.Load(XmlReader.Create(new StringReader(stylesheet.Content)));
                xslt.Transform(StringExtensions.ToXmlReader(cleanHtml), null, new StringWriter(res));
                var resultReport = res.ToString();
            }
            catch (Exception e)
            {

            }

我得到一个例外:

名称中不能包含“ =”字符(十六进制值0x3D)

更新如何自动从'='中清除名称?

HTML不是XML(除非是XHTML)。 几乎肯定会尝试将XSLT应用于通用HTML文档会给您带来问题。 您将必须找到一种不同的方式来进行所需的转换。

如果您想以编程方式处理HTML,则建议使用HTML Agility Pack

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM