繁体   English   中英

Pentaho Spoon数据集成,合并两个csv

[英]Pentaho Spoon Data Integration, Merge two csv

我想合并两个csv文件。 第一个看起来像这样:url; name; api。 url字段包含相同URL的50倍,名称为空,并且api字段包含相同API密钥的50倍。 第二个csv类似于:url; name; api。 url为空,名称包含50个不同的名称,api为空。

我想创建一个csv文件:url; name; api,同时包含两个csv的信息,因此url和api包含第一个csv的值和第二个csv的名称。

到目前为止,我只创建了两个csv输入,并将它们与一个csv输出挂钩。 生成的csv包含100条记录,其中50条记录的名称为null,而50条记录的url和api为null。

在此处输入图片说明

在此处输入图片说明

在此处输入图片说明

如果要增加列数,则需要“查找”或“联接”。

您有一个主流,并且对于流的每一行,您要在辅助流中获取一行(查找)或多行(加入)。

在您的情况下,我将首先删除所有不必要的字段(第一个csv文件中的名称,第二个中的url和api)和不必要的行(第一个csv文件中仅保留一行)。 然后将这两个流放入“ Join Rows steps

而且,如果我确实了解您的用例,那么您可能会使情况复杂化了,因为要在同一步骤中引导流程(此处为Text output 2 ),需要使列相同,以便它们可以添加以下行:输入一个接一个。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM