[英]How to parse information from text file
我正在研究各種選項來解析文本文件中的數據。 我們收到來自不同客戶的發票,並且格式不是預定義的。 基本上,我們收到具有不同列的表類型的結構,如下所示,並且需要從文件中提取數據。
現在,我們有一個帶有Parse方法的IExtractor接口,該接口由每個客戶端解析器實現,並根據文件實例化適當的類,並對邏輯進行硬編碼以檢索數據。
由於客戶端的數量在增加,我們正在研究更健壯和易於編碼的方法來從文本文件中提取信息。
是否建議使用正則表達式標識頁眉和頁腳,並使用另一個表達式從每一行中提取信息。 如果有人可以提出更好的替代方案,我將不勝感激。
<addition text>.....
Date Document Invoice Deductions Paid Amount
--------------------------------------------------------------------------------------------
21.03.2014 9289 9280 0.00 48,000.00
10.01.2013 21389 9402 3.00 4,000.00
21.03.2014 9289 9280 0.00 48,000.00
10.01.2013 21389 9402 3.00 4,000.00
Sum Total
Please ....<text>
如果您有太多的工作要做代碼解決方案(即您提到的IExtractor .Parse),那么我會選擇嵌入式腳本語言
然后,您可以為每個客戶端編寫腳本。
我將使用Javascript作為語言(它已內置了regex support)。 我會使用Codeplex中的jint項目
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.