[英]RESTSharp has problems deserializing XML including Byte Order Mark?
我想在一个简短的C#应用程序中使用一个公共Web服务: http : //ws.parlament.ch/
从此Web服务返回的XML在开头有一个“BOM”,这会导致RESTSharp无法通过以下错误消息对XML进行反序列化:
检索响应时出错。 查看内部细节以获取更多信息。 ---> System.Xml.XmlException: 根级别的数据无效。 System.Xml.XmlTextReaderImpl.Throw的第1行,第1位 (例外e)
在System.Xml.XmlTextReaderImpl.Throw(String res,String arg)的System.Xml.XmlTextReaderImpl.ParseRootLevelWhitespace()中的System.Xml.XmlTextReaderImpl.ParseDocumentContent()处于System.Xml的System.Xml.XmlTextReaderImpl.Read()处。 System.Xml.Linq.XDocument.Parse中的Linq.XDocument.Load(XmlReader reader,LoadOptions选项)(String text,LoadOptions options)
在RestSharp.RestClient.Deserialize [T]的RestSharp.Deserializers.XmlDeserializer.Deserialize [T](IRestResponse响应)的System.Xml.Linq.XDocument.Parse(String text)处(IRestRequest请求,IRestResponse raw)
---内部异常堆栈跟踪结束---
以下是使用http://ws.parlament.ch/sessions?format=xml获取“ 会话 ”列表的简单示例:
public class Session
{
public int Id { get; set; }
public DateTime? Updated { get; set; }
public int? Code { get; set; }
public DateTime? From { get; set; }
public string Name { get; set; }
public DateTime? To { get; set; }
}
static void Main(string[] args)
{
var request = new RestRequest();
request.RequestFormat = DataFormat.Xml;
request.Resource = "sessions";
request.AddParameter("format", "xml");
var client = new RestClient("http://ws.parlament.ch/");
var response = client.Execute<List<Session>>(request);
if (response.ErrorException != null)
{
const string message = "Error retrieving response. Check inner details for more info.";
var ex = new ApplicationException(message, response.ErrorException);
Console.WriteLine(ex);
}
List<Session> test = response.Data;
Console.Read();
}
当我第一次使用Fiddler操作返回的xml来删除前3位(“BOM”)时,上面的代码可以正常工作! 有人可以帮我直接在RESTSharp中处理这个吗? 我究竟做错了什么? 先感谢您!
我找到了解决方案 - 谢谢@arootbeer的提示!
您也可以使用#RESTSharp中的“RestRequest.OnBeforeDeserialization”事件,而不是包装XMLDeserializer。 所以你只需要在新的RestRequest()之后插入这样的东西(参见我的初始代码示例)然后它就完美了!
request.OnBeforeDeserialization = resp =>
{
//remove the first ByteOrderMark
//see: http://stackoverflow.com/questions/19663100/restsharp-has-problems-deserializing-xml-including-byte-order-mark
string byteOrderMarkUtf8 = Encoding.UTF8.GetString(Encoding.UTF8.GetPreamble());
if (resp.Content.StartsWith(byteOrderMarkUtf8))
resp.Content = resp.Content.Remove(0, byteOrderMarkUtf8.Length);
};
我遇到了同样的问题,但没有专门针对RestSharp。 用这个:
var responseXml = new UTF8Encoding(false).GetString(bytes);
原始讨论: XmlReader打破了UTF-8 BOM
来自答案的相关引言:
xml字符串不得(!)包含BOM,BOM仅允许在使用UTF-8编码的字节数据(例如流)中。 这是因为字符串表示不是编码的,而是已经是一系列unicode字符。
编辑:通过他们的文档,看起来最简单的方法来处理这个(除了GitHub问题)是调用非泛型的Execute()
方法并反序列化该字符串的响应。 您还可以创建一个包装默认XML反序列化器的IDeserializer
。
@dataCore发布的解决方案不太有用 ,但是这个应该。
request.OnBeforeDeserialization = resp => {
if (resp.RawBytes.Length >= 3 && resp.RawBytes[0] == 0xEF && resp.RawBytes[1] == 0xBB && resp.RawBytes[2] == 0xBF)
{
// Copy the data but with the UTF-8 BOM removed.
var newData = new byte[resp.RawBytes.Length - 3];
Buffer.BlockCopy(resp.RawBytes, 3, newData, 0, newData.Length);
resp.RawBytes = newData;
// Force re-conversion to string on next access
resp.Content = null;
}
};
将resp.Content
设置为null
是作为安全防护,因为如果Content
尚未设置为值,则RawBytes
仅转换为字符串。
要使其与RestSharp一起使用,您可以手动解析响应内容并删除“<”之前的所有“有趣”字符。
var firstChar = responseContent[0];
// removing any 'funny' characters coming before '<'
while (firstChar != 60)
{
responseContent= responseContent.Remove(0, 1);
firstChar = responseContent[0];
}
XmlReader.Create(new StringReader(responseContent));
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.