[英]How to split values of an column in Pentaho Spoon?
我想創建一個Spoon
轉換,該轉換將對列的多個值起作用。 輸入到我的轉換中的是一個CSV文件。 在該CSV文件中,有一列名為“技術”,其中包含0個或多個用半冒號分隔的值,如下所示。
+------------------------------------------------------+
row_id | Technology
+------------------------------------------------------+
1 | Cobol ; Db2 ; Jcl ; Vsam ; Cics ; Changeman ;
2 | Oracle ; Sql ; Db2 ; Oracle 9i ;
3 | Windows 2000 ; SQL ;
+------------------------------------------------------+
我在數據庫中有一個名為“技術”的表,其架構如下:
+----------------------+
Technologies
+----------------------+
id | technology_name
+----------------------+
其中id
列設置為自動遞增。
我只想在Technologies
表中不存在該值的情況下插入technology
列的值。
誰能告訴我
1)哪種類型的步驟可用於拆分technology
列的值? 2)如何只插入一次值? 例如,在row 1
和row 2
,重復Db2
,但我只想插入一次Db2
。
提前致謝 !
使用“拆分字段”(在“轉換”下)拆分內容。
CSV文件輸入->拆分字段->其余的轉換
將“要拆分的字段”設置為“技術”,並將“定界符”設置為分號。
關於非重復字段,我的建議是讓名稱本身成為表的鍵。 將其轉換為小寫字母,並用數據庫安全等效項替換所有空格/特殊字符,然后將其作為主鍵。 您應該最終得到一個僅包含唯一實例的表。
心連心
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.