[英]How to split values of an column in Pentaho Spoon?
我想创建一个Spoon
转换,该转换将对列的多个值起作用。 输入到我的转换中的是一个CSV文件。 在该CSV文件中,有一列名为“技术”,其中包含0个或多个用半冒号分隔的值,如下所示。
+------------------------------------------------------+
row_id | Technology
+------------------------------------------------------+
1 | Cobol ; Db2 ; Jcl ; Vsam ; Cics ; Changeman ;
2 | Oracle ; Sql ; Db2 ; Oracle 9i ;
3 | Windows 2000 ; SQL ;
+------------------------------------------------------+
我在数据库中有一个名为“技术”的表,其架构如下:
+----------------------+
Technologies
+----------------------+
id | technology_name
+----------------------+
其中id
列设置为自动递增。
我只想在Technologies
表中不存在该值的情况下插入technology
列的值。
谁能告诉我
1)哪种类型的步骤可用于拆分technology
列的值? 2)如何只插入一次值? 例如,在row 1
和row 2
,重复Db2
,但我只想插入一次Db2
。
提前致谢 !
使用“拆分字段”(在“转换”下)拆分内容。
CSV文件输入->拆分字段->其余的转换
将“要拆分的字段”设置为“技术”,并将“定界符”设置为分号。
关于非重复字段,我的建议是让名称本身成为表的键。 将其转换为小写字母,并用数据库安全等效项替换所有空格/特殊字符,然后将其作为主键。 您应该最终得到一个仅包含唯一实例的表。
心连心
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.