简体   繁体   English

如何使用Oozie将远程文件复制到HDFS?

[英]How can I use Oozie to copy remote files into HDFS?

I have to copy remote files into HDFS. 我必须将远程文件复制到HDFS中。 I want to use Oozie because I need to run this job everyday at a specific time. 我想使用Oozie,因为我需要每天在特定时间执行此工作。

Oozie can help you create a workflow. Oozie可以帮助您创建工作流程。 Using oozie you can invoke an external action capable of copying files from your source to HDFS, but oozie will not do it automatically. 使用oozie,您可以调用能够将文件从源文件复制到HDFS的外部操作,但是oozie不会自动执行该操作。

Here are a few suggestions: 这里有一些建议:

  1. Use a custom program to write files to hdfs, for example using a SequenceFile.Writer. 使用自定义程序将文件写入hdfs,例如使用SequenceFile.Writer。
  2. Flume might help. 水槽可能会有所帮助。
  3. Use an integration component like camel-hdfs to move files to hdfs. 使用诸如camel-hdfs的集成组件将文件移动到hdfs。
  4. ftp files to hdfs node and then copy from local disk to hdfs. ftp文件到hdfs节点,然后从本地磁盘复制到hdfs。

Investigate more options that might be a good fit for your case. 研究更多可能适合您的情况的选项。

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM