繁体 English 中英

如何访问HDFS头节点群集中安装的pyspark

[英]How can I access pyspark installed inside hdfs headnode cluster

原文 2019-01-22 07:36:37 1 1 hadoop/ pyspark/ jupyter-notebook/ hdfs/ cluster-computing

我有一个由hadoop集群组成的头节点。我看到pyspark安装在hdfs集群中，即我可以在hdfs用户中使用pyspark shell。但是在用户headnode中没有安装pyspark。 因此，我无法从hdfs访问文件并将其带到pyspark。如何在jupyter笔记本的hdfs内使用pyspark。我在用户头节点中安装了pyspark，但无法访问hdfs文件。 jupyter无法使用hdfs中安装的spark。如何启用它，以便可以在jupyter中访问hdfs文件。

现在，当我在jupyter中访问hdfs文件时，

It says 'Spark is not installed'

我知道它的广泛性，如果我强调不足或过分强调，请在评论中让我知道

1 个解决方案

头节点是另一个Linux帐户还是另一个Linux主机？

如果只是不同的帐户，则比较两个帐户上的环境变量。 登录到hdfs并运行“ env | sort”，然后在头节点上执行相同的操作。

主要检查环境变量PATH和某些SPARK变量是否存在差异

如何控制对hdfs的访问？

[英]How can I control access to hdfs?

访问远程集群中的HDFS

[英]Access HDFS in Remote Cluster

Hadoop集群kerberized时无法访问HDFS

[英]Can't access HDFS when Hadoop cluster kerberized

如何获得火花以在Windows上访问本地HDFS？

[英]How can I get spark to access local HDFS on windows?

如何将存储在包含行的HDFS中的文本文件转换为Pyspark中的数据框？

[英]How can I convert a text file stored in HDFS containing Rows into a Dataframe in Pyspark?

如何通过java中的hdfs协议访问hadoop？

[英]How can I access hadoop via the hdfs protocol from java?

如何通过网络将数据从一个HDFS集群迁移到另一个集群？

[英]How can I migrate data from one HDFS cluster to another over the network?

如何将 HDFS（Hadoop 分布式 FS）部署到 K8s（Kubernetes）集群？

[英]How can I deploy HDFS (Hadoop Distributed FS) to a K8s (Kubernetes) cluster?

从群集外部访问hdfs

[英]Access hdfs from outside the cluster

如何默认配置pyspark以写入HDFS？

[英]How do I configure pyspark to write to HDFS by default?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何控制对hdfs的访问？访问远程集群中的HDFS Hadoop集群kerberized时无法访问HDFS 如何获得火花以在Windows上访问本地HDFS？如何将存储在包含行的HDFS中的文本文件转换为Pyspark中的数据框？如何通过java中的hdfs协议访问hadoop？如何通过网络将数据从一个HDFS集群迁移到另一个集群？如何将 HDFS（Hadoop 分布式 FS）部署到 K8s（Kubernetes）集群？从群集外部访问hdfs 如何默认配置pyspark以写入HDFS？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM