簡體   English   中英

使用 C# 讀取 doc 和 docx 文件,而無需在服務器上安裝 MS Office

[英]Reading doc and docx files using C# without having MS Office installed on server

我正在開發一個項目(asp.net、c#、vb 2010、.net 4),我需要閱讀我之前上傳的 DOC 和 DOCX 文件(我已經完成了上傳部分)。 棘手的部分是我沒有在服務器上安裝 MS Office 並且我無法使用它。

是否有任何公共庫可以包含在我的項目中而無需安裝任何東西? 兩個文檔都非常簡單:

NUMBER TAB STRING  
NUMBER TAB STRING  
NUMBER TAB STRING  
...  

我們現在可以使用開源, NPOI (Apache POI的.NET端口)庫,它也支持docx,xl​​s和xlsx。 DocX也是另一個用於創建word文檔的開源庫。

對於DOCX,我建議使用Open XML API ,盡管Microsoft開發了Open XML以通過與此API通信的XML文件創建office文件,最新版本2.5於2013年發布,即5年前。

你可以使用Code7248.word_reader.dll

下面是有關如何使用Code7248.word_reader.dll的示例代碼

在項目中添加對此DLL的引用,並復制到代碼下方。

using System;
using System.Collections.Generic;
using System.Text;
//add extra namespaces
using Code7248.word_reader;


namespace testWordRead
{
    class Program
    {
        private void readFileContent(string path)
        {
            TextExtractor extractor = new TextExtractor(path);
            string text = extractor.ExtractText();
            Console.WriteLine(text);
        }
        static void Main(string[] args)
        {
            Program cs = new Program();
            string path = "D:\Test\testdoc1.docx";
            cs.readFileContent(path);
            Console.ReadLine();
        }
    }
}

更新:NPOI現在支持docx。 請試用最新版本(NPOI 2.0 beta)

 using System.IO;

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM