繁体   English   中英

如何在Pentaho Spoon中拆分列的值?

[英]How to split values of an column in Pentaho Spoon?

我想创建一个Spoon转换,该转换将对列的多个值起作用。 输入到我的转换中的是一个CSV文件。 在该CSV文件中,有一列名为“技术”,其中包含0个或多个用半冒号分隔的值,如下所示。

+------------------------------------------------------+

 row_id |   Technology
+------------------------------------------------------+

1       | Cobol ; Db2 ; Jcl ; Vsam ; Cics ; Changeman ;

2       | Oracle ; Sql ; Db2 ; Oracle 9i ;

3       | Windows 2000 ; SQL ;
+------------------------------------------------------+

我在数据库中有一个名为“技术”的表,其架构如下:

+----------------------+

Technologies

+----------------------+
 id   | technology_name

+----------------------+

其中id列设置为自动递增。

我只想在Technologies表中不存在该值的情况下插入technology列的值。

谁能告诉我

1)哪种类型的步骤可用于拆分technology列的值? 2)如何只插入一次值? 例如,在row 1row 2 ,重复Db2 ,但我只想插入一次Db2

提前致谢 !

使用“拆分字段”(在“转换”下)拆分内容。

CSV文件输入->拆分字段->其余的转换

将“要拆分的字段”设置为“技术”,并将“定界符”设置为分号。

关于非重复字段,我的建议是让名称本身成为表的键。 将其转换为小写字母,并用数据库安全等效项替换所有空格/特殊字符,然后将其作为主键。 您应该最终得到一个仅包含唯一实例的表。

心连心

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM