簡體   English   中英

SSIS和規范TXT文件中的數據

[英]SSIS and Normalizing Data in TXT file

我正在學習SSIS,並且對如何規范文本文件中的現有數據有疑問。

在我的目錄中,每個美國州都有一個文本文件,因此AK.txt和AL.txt具有以下結構:

AK,F,1910,Mary,14 AL,F,1910,Mary,875

這代表state,sex,year,name,frequency

如果我有下表:

  • 州(id,州)
  • 性別(性別,性)
  • 年(id,年)
  • 名稱(id,名稱,頻率)

我將使用SSIS中的哪種轉換將每個數據元素放入其各自的表中?

答:首先要捕獲多個文件,這是兩個選項:

  1. 使用“每個文件”迭代器循環遍歷每個文件並加載到某個文件(行集對象,原始文件或臨時表)中,然后將其用作B部分的源

  2. 或者,為每個文件創建一個平面文件源,並與聯合運算符將它們合並(不推薦)

B.使單個數據流進入多個表

使用多播將數據投射到5個流中。 然后排序並區分它們以獲得不同的記錄,然后將它們加載到表中。

我個人的喜好是加載到暫存表中,然后再通過SQL進行所有操作。

如果您的文件以comma分隔“狀態,性別,年..”,最簡單的方法是使用平面文件源。 您可以將其設置為使用逗號作為列定界符,並使用換行符作為行定界符。 確保在“ 高級 ”下也設置正確的數據類型。 然后,輸出是每個定界字段的列。 然后,使用目的地之一(OLE DB ..)並將這些內容放入yout表中。

在此處輸入圖片說明

如果您有任何疑問,請告訴我

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM