繁体 English 中英

解码XML中的扩展字符

[英]Decoding extended characters in XML

原文 2010-01-07 18:24:12 2 2 .net/ xml/ encoding

我知道这可能很简单，可能之前曾有人问过，但是我在想出解决方案时遇到了麻烦。

我正在解析一些RSS提要，其中包括HTML作为CDATA块。 这里是一个示例： http : //g.msn.com/1ewenus50/news2

提要变化很大，但是几乎总是包含一些扩展字符。 例如，如果我制作一个简单的控制台应用程序并使用WebClient.DownloadString并查看结果，我会看到类似

“得知他在圣诞节中途飞行时曾试图进行253航班炸弹袭击者的极端分子联系。美国全国广播公司的萨凡纳·古思里报道。（今日节目）”

但是，这些怪异的字符应该是撇号，引号，破折号等。

使它们正确解码的诀窍是什么？

如果不清楚，我正在使用C＃/ .NET。 最后，这些内容将在Silverlight中呈现，但是我也在完整的.NET 3.5运行时中看到了这个问题。

2 个解决方案

以二进制形式下载它并将其解析为XML。 这样做应该正确无误-XML文档应该在编码方面进行自我描述，但是我不会把它放到某些网络服务器上（以标头的形式）以具有不同编码的方式来宣传它，这会混淆DownloadString 。

通常，涉及XML时，应该在XML API中而不是对原始数据进行尽可能多的处理。

您可能使用了错误的文本编码...我不确定您使用的是哪种还是正确的，但是这可能会让您走上正轨。

解码URL中的外语字符

[英]Decoding foreign language characters in url

从 Xml 发出解码字符串

[英]Issues decoding strings from Xml

HttpUtility.ParseQueryString无需解码特殊字符

[英]HttpUtility.ParseQueryString without decoding special characters

包含扩展字符的MIME附件名称失败

[英]MIME Attachment Names containing Extended Characters Fails

如何在C＃中替换扩展的ASCII字符？

[英]How to replace extended ASCII characters in C#?

c# - 替换扩展 ascii 字符

[英]c# - Replacing extended ascii characters

解码具有特殊字符的7Bit内容传输编码消息

[英]Decoding 7Bit content-transfer-encoding messages with special characters

扩展的ASCII字符，例如欧元符号被转换为其等效的unicode

[英]Extended ASCII characters such as euro symbol being converted to its unicode equivalent

无效的XML字符

[英]Invalid XML characters

具有从抽象类型扩展的成员的类的XML序列化

[英]XML Serialization of Class Which Has a Member Extended From an Abstract Type

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 解码URL中的外语字符从 Xml 发出解码字符串 HttpUtility.ParseQueryString无需解码特殊字符包含扩展字符的MIME附件名称失败如何在C＃中替换扩展的ASCII字符？ c# - 替换扩展 ascii 字符解码具有特殊字符的7Bit内容传输编码消息扩展的ASCII字符，例如欧元符号被转换为其等效的unicode 无效的XML字符具有从抽象类型扩展的成员的类的XML序列化

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM