繁体   English   中英

从 hdfs 读取文件 - pyspark

[英]Read files from hdfs - pyspark

我是 Pyspark 的新手,当我执行以下代码时,出现属性错误。

我正在使用 apache spark 2.4.3

t=spark.read.format("hdfs:\\test\a.txt")
t.take(1)

我希望输出为 1,但它会引发错误。

AttributeError: dataframereader object has no attribute take

您没有正确使用 API:

  • format用于指定你想要的输入数据源格式

在这里,您正在阅读文本文件,因此您要做的就是:

t = spark.read.text("hdfs://test/a.txt")
t.collect()

查看相关文档

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM