簡體   English   中英

如何在Pentaho Spoon中拆分列的值?

[英]How to split values of an column in Pentaho Spoon?

我想創建一個Spoon轉換,該轉換將對列的多個值起作用。 輸入到我的轉換中的是一個CSV文件。 在該CSV文件中,有一列名為“技術”,其中包含0個或多個用半冒號分隔的值,如下所示。

+------------------------------------------------------+

 row_id |   Technology
+------------------------------------------------------+

1       | Cobol ; Db2 ; Jcl ; Vsam ; Cics ; Changeman ;

2       | Oracle ; Sql ; Db2 ; Oracle 9i ;

3       | Windows 2000 ; SQL ;
+------------------------------------------------------+

我在數據庫中有一個名為“技術”的表,其架構如下:

+----------------------+

Technologies

+----------------------+
 id   | technology_name

+----------------------+

其中id列設置為自動遞增。

我只想在Technologies表中不存在該值的情況下插入technology列的值。

誰能告訴我

1)哪種類型的步驟可用於拆分technology列的值? 2)如何只插入一次值? 例如,在row 1row 2 ,重復Db2 ,但我只想插入一次Db2

提前致謝 !

使用“拆分字段”(在“轉換”下)拆分內容。

CSV文件輸入->拆分字段->其余的轉換

將“要拆分的字段”設置為“技術”,並將“定界符”設置為分號。

關於非重復字段,我的建議是讓名稱本身成為表的鍵。 將其轉換為小寫字母,並用數據庫安全等效項替換所有空格/特殊字符,然后將其作為主鍵。 您應該最終得到一個僅包含唯一實例的表。

心連心

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM