繁体   English   中英

使用Pentaho Kettle,如何在输入表中进行中间步骤读取的情况下,从CSV文件加载输出表中的数据?

[英]Using Pentaho Kettle, how to load data in output table from CSV file with intermediary step reading in an input table?

我有一个CSV文件,其中包含我需要使用Pentaho ETL Kettle加载到数据库表中的数据。 但是在将它们加载到表中之前,我需要构建每行以插入从CSV文件中获取的值以及必须从另一个输入表中收集的值(该表需要从CSV中获取数据作为参数来收集所需信息)。 我对构建转换所必须使用的步骤有些迷惑。 有人可以帮忙吗?

我认为最简单的解决方案是:

  • 首先,您通过“文本输入”步骤阅读CSV文件
  • 然后使用“数据库联接”步骤,从表中获取其他列,例如:

     SELECT col1, col2, col3 FROM input_table WHERE common_column = ? 

    用占位符? 将替换为您必须在此步骤中指定的参数。

  • 然后您可以将数据发送到输出步骤,例如“表输出”。

像这样:

读取CSV并从表中添加列

它不一定是性能最高的解决方案,它取决于您的数据如何,也可以使用“数据库查找”步骤或“表输入”步骤,然后进行联接。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM