簡體   English   中英

如何使用帶格式的打開xml將docx轉換為html文件

[英]How to convert docx to html file using open xml with formatting

我知道有很多問題有相同的標題,但我目前有一些問題,他們我沒有得到正確的方法去。

我使用Open xml sdk 2.5和Power工具.docx文件轉換為.html文件,該文件使用HtmlConverter類進行轉換。

我成功地將docx文件轉換為Html文件,但問題是,html文件不保留文檔文件的原始格式。 例如。 字體大小,顏色,下划線,粗體等不會反映到html文件中。

這是我現有的代碼:

public void ConvertDocxToHtml(string fileName)
{
   byte[] byteArray = File.ReadAllBytes(fileName);
   using (MemoryStream memoryStream = new MemoryStream())
   {
      memoryStream.Write(byteArray, 0, byteArray.Length);
      using (WordprocessingDocument doc = WordprocessingDocument.Open(memoryStream, true))
      {
         HtmlConverterSettings settings = new HtmlConverterSettings()
         {
            PageTitle = "My Page Title"
         };
         XElement html = HtmlConverter.ConvertToHtml(doc, settings);
         File.WriteAllText(@"E:\Test.html", html.ToStringNewLineOnAttributes());
      }
    }
 }

所以我只想知道是否有任何方法可以保留轉換后的HTML文件中的格式。

我知道一些第三方API做同樣的事情。 但我更喜歡使用open xml或任何其他開源來做這件事。

PowerTools for Open XML剛剛發布了一個新的HtmlConverter模塊。 它現在包含一個開源的,免費實現從DOCX到HTML格式的轉換。 模塊HtmlConverter.cs支持所有段落,字符和表格樣式,字體和文本格式,編號和項目符號列表,圖像等。 http://bit.ly/1bclyg9

您可能希望找到一個外部工具來幫助您完成此操作,例如Aspose Words

您的最終結果將與您的Word文檔完全不同,但此鏈接可能會有所幫助。

您可以使用OpenXML Viewer擴展程序進行Firefox格式轉換。 http://openxmlviewer.codeplex.com這適合我。 希望這可以幫助。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM