繁体   English   中英

Azure Databricks 中的 Python 版本

[英]Python Version in Azure Databricks

我正在尝试找出我在 Databricks 中使用的 python 版本。

找出我试过

import sys
print(sys.version)

我得到了 output 作为3.7.3

然而,当我去集群 - > SparkUI - > 环境

我看到集群 Python 版本是2

这是指哪个版本?

当我尝试跑步时

%sh python --version

我仍然得到 Python 3.7.3

每个工作程序/驱动程序节点是否可以有不同的 python 版本?

注意:我使用的设置有 1 个工作节点和 1 个驱动程序节点(共有 2 个节点,规格相同),Databricks 运行时版本为 6.5 ML

更新:此问题已修复。

对于新集群:如果您创建一个新集群,它将具有 python 环境变量为 3。

对于现有集群:您需要在Cluster Configuration > Advanced的 Environment Variables 选项卡中添加,它会在 Environment 变量中更改。

PYSPARK_PYTHON=/databricks/python3/bin/python3

在此处输入图像描述


谢谢让我们注意到这个。 这是一个产品错误,目前我正在与产品团队合作尽快解决问题。

使用 UI 创建的集群的默认 Python 版本是Python 3

作为 repro 的一部分,我创建了 Databricks Runtime Version: 6.5 ML 并观察到相同的行为。

集群 --> SparkUI --> 环境显示不正确的版本。

在此处输入图像描述

在此处输入图像描述

我相信您正在运行使用 Databricks Runtime 5.5 或更低版本的集群。 跑步时看到的

import sys
print(sys.version)

是 PYSPARK_PYTHON 环境变量引用的 python 版本。 Cluster --> SparkUI --> Environment中的那个是Ubuntu实例的python版本,即Python 2。

资源

这适用于gooogle colabMS Azure Databricks的所有笔记本:

!python --version

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM