[英]HtmlAgilityPack - Convert MHTML To HTML as String
我有一个 MHTML 文件,我正在尝试将其转换为 HTML。
我已经安装了 HtmlAgilityPack 并尝试了以下代码:
var doc = new HtmlAgilityPack.MixedCodeDocument();
doc.Load("C:\\Users\\DickTracey\\Downloads\\Club Membership Report.mhtml");
var ms = new MemoryStream();
var sw = new StreamWriter(ms);
doc.Save(sw);
ms.Position = 0;
var sr = new StreamReader(ms);
return sr.ReadToEnd();
但它总是返回空值。
谁能解释一下将 MHTML 转换为 HTML 的正确程序?
string mhtml = "This is your MHTML string"; // Make sure the string is in UTF-8 encoding MHTMLParser parser = new MHTMLParser(mhtml); string html = parser.getHTMLText(); // This is the converted HTML
git link
: https : //github.com/DavidBenko/MHTML-to-HTML-Decoding-in-C-Sharp.git
我用 HxD 快速浏览了一个 MHTML 文件。 尽管如上所述,HtmlAgilityPack 很少或根本不支持 MHTML,但格式本身看起来很简单。 它似乎由通常的可疑对象(未编码的 HTML、CSS、JS、以 Base64 编码的图形等)以某种方式(使用 mime 类型标头)连接在一起,只需稍加努力即可解决。 话虽如此,该格式可能已经在某处完全记录了下来——所以清理浏览器的灰尘,编写一些 C# 来解析它,然后用结果勺子馈送 HtmlAgilityPack。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.