[英]Dynamically generated MS Word document from C# using HTML & CSS does not display header in word 2003
[英]How can i convert a MS Word 2003 document into HTML in C#?
我想將MS Word 2003文檔的內容提取到C#中的HTML中。
有任何想法嗎?
我認為這是最簡單的方法
http://asptutorials.net/C-SHARP/convert-ms-word-docs-to-html/
他們在本文中的重點是他們使用SaveAs函數http://msdn.microsoft.com/zh-cn/library/aa220734.aspx
像這樣:
string newfilename = folder_to_save_in + FileUpload1.FileName.Replace(".doc", ".html");
object o_nullobject = System.Reflection.Missing.Value;
object o_newfilename = newfilename;
object o_format = Word.WdSaveFormat.wdFormatHTML;
object o_encoding = Microsoft.Office.Core.MsoEncoding.msoEncodingUTF8;
object o_endings = Word.WdLineEndingType.wdCRLF;
// SaveAs requires lots of parameters, but we can leave most of them empty:
wordApplication.ActiveDocument.SaveAs(ref o_newfilename, ref o_format, ref o_nullobject,
ref o_nullobject, ref o_nullobject, ref o_nullobject, ref o_nullobject, ref o_nullobject, ref o_nullobject,
ref o_nullobject, ref o_nullobject, ref o_encoding, ref o_nullobject,
ref o_nullobject, ref o_endings, ref o_nullobject);
該庫是Microsoft.Office.Interop.Word;
如果我沒記錯的話,在執行代碼的機器上需要Word。 如果是ASP.NET,則在服務器上是必需的。
三種方式:1.保存為HTML,如napster所述2.將Open XML轉換為HTML; 有關XSLT的詳細信息, 請訪問http://www.codeplex.com/OpenXMLViewer3 。要獲得最干凈的HTML,請編寫代碼以將文檔中的每個樣式轉換為CSS,然后將任何直接格式設置為@style。
運行C#代碼的計算機上是否安裝了Word?
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.