[英]SSIS and Normalizing Data in TXT file
我正在學習SSIS,並且對如何規范文本文件中的現有數據有疑問。
在我的目錄中,每個美國州都有一個文本文件,因此AK.txt和AL.txt具有以下結構:
AK,F,1910,Mary,14
AL,F,1910,Mary,875
這代表state,sex,year,name,frequency
如果我有下表:
我將使用SSIS中的哪種轉換將每個數據元素放入其各自的表中?
答:首先要捕獲多個文件,這是兩個選項:
使用“每個文件”迭代器循環遍歷每個文件並加載到某個文件(行集對象,原始文件或臨時表)中,然后將其用作B部分的源
或者,為每個文件創建一個平面文件源,並與聯合運算符將它們合並(不推薦)
B.使單個數據流進入多個表
使用多播將數據投射到5個流中。 然后排序並區分它們以獲得不同的記錄,然后將它們加載到表中。
我個人的喜好是加載到暫存表中,然后再通過SQL進行所有操作。
如果您的文件以comma
分隔“狀態,性別,年..”,最簡單的方法是使用平面文件源。 您可以將其設置為使用逗號作為列定界符,並使用換行符作為行定界符。 確保在“ 高級 ”下也設置正確的數據類型。 然后,輸出是每個定界字段的列。 然后,使用目的地之一(OLE DB ..)並將這些內容放入yout表中。
如果您有任何疑問,請告訴我
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.