[英]How to convert docx to html file using open xml with formatting
我知道有很多問題有相同的標題,但我目前有一些問題,他們我沒有得到正確的方法去。
我使用Open xml sdk 2.5和Power工具將.docx
文件轉換為.html
文件,該文件使用HtmlConverter
類進行轉換。
我成功地將docx
文件轉換為Html
文件,但問題是,html文件不保留文檔文件的原始格式。 例如。 字體大小,顏色,下划線,粗體等不會反映到html文件中。
這是我現有的代碼:
public void ConvertDocxToHtml(string fileName)
{
byte[] byteArray = File.ReadAllBytes(fileName);
using (MemoryStream memoryStream = new MemoryStream())
{
memoryStream.Write(byteArray, 0, byteArray.Length);
using (WordprocessingDocument doc = WordprocessingDocument.Open(memoryStream, true))
{
HtmlConverterSettings settings = new HtmlConverterSettings()
{
PageTitle = "My Page Title"
};
XElement html = HtmlConverter.ConvertToHtml(doc, settings);
File.WriteAllText(@"E:\Test.html", html.ToStringNewLineOnAttributes());
}
}
}
所以我只想知道是否有任何方法可以保留轉換后的HTML文件中的格式。
我知道一些第三方API做同樣的事情。 但我更喜歡使用open xml或任何其他開源來做這件事。
PowerTools for Open XML剛剛發布了一個新的HtmlConverter模塊。 它現在包含一個開源的,免費實現從DOCX到HTML格式的轉換。 模塊HtmlConverter.cs支持所有段落,字符和表格樣式,字體和文本格式,編號和項目符號列表,圖像等。 見http://bit.ly/1bclyg9
您可能希望找到一個外部工具來幫助您完成此操作,例如Aspose Words
您的最終結果將與您的Word文檔完全不同,但此鏈接可能會有所幫助。
您可以使用OpenXML Viewer擴展程序進行Firefox格式轉換。 http://openxmlviewer.codeplex.com這適合我。 希望這可以幫助。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.