簡體   English   中英

如何在C#中將MS Word 2003文檔轉換為HTML?

[英]How can i convert a MS Word 2003 document into HTML in C#?

我想將MS Word 2003文檔的內容提取到C#中的HTML中。

有任何想法嗎?

我認為這是最簡單的方法

http://asptutorials.net/C-SHARP/convert-ms-word-docs-to-html/

他們在本文中的重點是他們使用SaveAs函數http://msdn.microsoft.com/zh-cn/library/aa220734.aspx

像這樣:

    string newfilename = folder_to_save_in + FileUpload1.FileName.Replace(".doc", ".html");
    object o_nullobject = System.Reflection.Missing.Value;    
    object o_newfilename = newfilename;
    object o_format = Word.WdSaveFormat.wdFormatHTML;
    object o_encoding = Microsoft.Office.Core.MsoEncoding.msoEncodingUTF8;
    object o_endings = Word.WdLineEndingType.wdCRLF;
    // SaveAs requires lots of parameters, but we can leave most of them empty:
    wordApplication.ActiveDocument.SaveAs(ref o_newfilename, ref o_format, ref o_nullobject,
    ref o_nullobject, ref o_nullobject, ref o_nullobject, ref o_nullobject, ref o_nullobject, ref o_nullobject,
    ref o_nullobject, ref o_nullobject, ref o_encoding, ref o_nullobject,
    ref o_nullobject, ref o_endings, ref o_nullobject);

該庫是Microsoft.Office.Interop.Word;

如果我沒記錯的話,在執行代碼的機器上需要Word。 如果是ASP.NET,則在服務器上是必需的。

三種方式:1.保存為HTML,如napster所述2.將Open XML轉換為HTML; 有關XSLT的詳細信息, 訪問http://www.codeplex.com/OpenXMLViewer3 。要獲得最干凈的HTML,請編寫代碼以將文檔中的每個樣式轉換為CSS,然后將任何直接格式設置為@style。

運行C#代碼的計算機上是否安裝了Word?

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM