簡體   English   中英

如何解析文本文件中的信息

[英]How to parse information from text file

我正在研究各種選項來解析文本文件中的數據。 我們收到來自不同客戶的發票,並且格式不是預定義的。 基本上,我們收到具有不同列的表類型的結構,如下所示,並且需要從文件中提取數據。

現在,我們有一個帶有Parse方法的IExtractor接口,該接口由每個客戶端解析器實現,並根據文件實例化適當的類,並對邏輯進行硬編碼以檢索數據。

由於客戶端的數量在增加,我們正在研究更健壯和易於編碼的方法來從文本文件中提取信息。

是否建議使用正則表達式標識頁眉和頁腳,並使用另一個表達式從每一行中提取信息。 如果有人可以提出更好的替代方案,我將不勝感激。

<addition text>.....
    Date          Document            Invoice               Deductions     Paid Amount
    --------------------------------------------------------------------------------------------
    21.03.2014    9289                9280                  0.00                        48,000.00
    10.01.2013    21389               9402                  3.00                        4,000.00
    21.03.2014    9289                9280                  0.00                        48,000.00
    10.01.2013    21389               9402                  3.00                        4,000.00

    Sum Total
    Please ....<text>

如果您有太多的工作要做代碼解決方案(即您提到的IExtractor .Parse),那么我會選擇嵌入式腳本語言

然后,您可以為每個客戶端編寫腳本。

我將使用Javascript作為語言(它已內置了regex support)。 我會使用Codeplex中的jint項目

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM