繁体   English   中英

HtmlAgilityPack - 将 MHTML 转换为 HTML 作为字符串

[英]HtmlAgilityPack - Convert MHTML To HTML as String

我有一个 MHTML 文件,我正在尝试将其转换为 HTML。

我已经安装了 HtmlAgilityPack 并尝试了以下代码:

var doc = new HtmlAgilityPack.MixedCodeDocument();
doc.Load("C:\\Users\\DickTracey\\Downloads\\Club Membership Report.mhtml");

var ms = new MemoryStream();
var sw = new StreamWriter(ms);

doc.Save(sw);
ms.Position = 0;

var sr = new StreamReader(ms);
return sr.ReadToEnd();

但它总是返回空值。

谁能解释一下将 MHTML 转换为 HTML 的正确程序?

MHTML 到 C# 中的 HTML 解码!

string mhtml = "This is your MHTML string"; // Make sure the string is in UTF-8 encoding MHTMLParser parser = new MHTMLParser(mhtml); string html = parser.getHTMLText(); // This is the converted HTML

git linkhttps : //github.com/DavidBenko/MHTML-to-HTML-Decoding-in-C-Sharp.git

我用 HxD 快速浏览了一个 MHTML 文件。 尽管如上所述,HtmlAgilityPack 很少或根本不支持 MHTML,但格式本身看起来很简单。 它似乎由通常的可疑对象(未编码的 HTML、CSS、JS、以 Base64 编码的图形等)以某种方式(使用 mime 类型标头)连接在一起,只需稍加努力即可解决。 话虽如此,该格式可能已经在某处完全记录了下来——所以清理浏览器的灰尘,编写一些 C# 来解析它,然后用结果勺子馈送 HtmlAgilityPack。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM