繁体 English 中英

Python和Hadoop-使用python直接获取数据并将其直接写入hdfs？

[英]Python and Hadoop - fetch and write data directly to hdfs using python?

原文 2015-08-06 13:28:25 9 1 python/ hadoop

我想每天从yahoo / google财务中获取与股票的eod价格相关的数据。 这些价格应直接存储在HDFS中。

稍后，我可以在其上制作外部表（使用HIVE）并用于进一步分析。

因此，我没有在寻找基本的map-reduce，因为我没有任何输入文件。 python中是否有可用的连接器，可以在Hadoop中写入数据？

首先将数据转储到本地文件中。 然后找到一种将文件上传到HDFS的方法。

hdfs dfs -put data.txt /user/johndoe/some/hdfs/dir/

如果您在其他任何地方运行任务，请使用HTTP库（或良好的旧curl命令行）连接到HDFS REST服务-根据群集的设置方式可以是webHDFS或httpFS-并上传带有PUT请求的文件

http://namenode:port/webhdfs/v1/user/johndoe/some/hdfs/dir/data.txt?op=CREATE&overwrite=false

（当然还有“ data.txt”的内容作为有效载荷）

[英]Hadoop: Failed to connect to HDFS(Hadoop) using python

[英]Write on HDFS using Python

[英]Using python to push data into HDFS

[英]Read/Write files on hdfs using Python

[英]Python write to hdfs file

[英]Get list of files from hdfs (hadoop) directory using python script

[英]How to dump a file to a Hadoop HDFS directory using Python pickle?

[英]Walk HDFS using Python

[英]How can I read from and write to HDFS remotely using Python?

[英]HDFS: Read data from HDFS to parse XML files in HDFS using Python3

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Hadoop：无法使用 python 连接到 HDFS（Hadoop）使用Python在HDFS上编写使用python将数据推送到HDFS 使用Python在hdfs上读/写文件 Python写入hdfs文件使用 python 脚本从 hdfs (hadoop) 目录获取文件列表如何使用 Python pickle 将文件转储到 Hadoop HDFS 目录？使用Python漫步HDFS 如何使用Python远程读取和写入HDFS？ HDFS：使用 Python3 从 HDFS 读取数据以解析 HDFS 中的 XML 文件

相关标签