标签[databricks]

有关Databricks统一分析平台的问题

0
0回复
06

使用databricks-connect运行Scala模块

I've tried to follow the instructions here to set up databricks-connect with IntelliJ.我尝试按照此处的说明使用 IntelliJ 设置 databricks-connect。 My understanding is
0
0回复
06

Databricks中恢复已删除的笔记本运行

I was trying to delete a few failed runs of a Notebook in order to clean up, but accidentally deleted one useful run.我试图删除一些失败的 Notebook 运行以进行清理,但不小心删
0
1回复
23

在数据块上运行sql查询时出现不匹配错误

I am trying to run a simple sql query on databricks and I am getting mismatch errors.我正在尝试在数据块上运行一个简单的 sql 查询,但出现不匹配错误。 I not sure how to resolve this
0
0回复
07

Databricks:无需挂载即可访问s3存储桶数据的方法

I am a newbie in AWS.我是 AWS 的新手。 I am looking if there are any ways to communicate or connect to s3 bucket from databricks without mounting.我正在寻找是否有任何
0
0回复
03

我们可以从DatabricksAutoloader中排除或仅包含特定的文件扩展名吗?

Right now the databricks autoloader requires a directory path where all the files will be loaded from.现在,databricks 自动加载器需要一个目录路径,从中加载所有文件。 But in cas
1
0回复
08

我想在数据砖中使用pytest了解代码本身中每个测试用例的运行时间

I am using data bricks notebook.我正在使用数据砖笔记本。 I have created a test_notebook.py which consists for test cases.我创建了一个 test_notebook.py,其中包含测试用例。 I start
1
1回复
19

读取csv文件时MSDatabricksSpark中绝对URI中的相对路径

I am new to Pyspark and am trying to use the database from Databricks.我是 Pyspark 的新手,正在尝试使用 Databricks 中的数据库。 I was trying to read a csv file from my
1
1回复
41

从RepoDatabricks中的另一个笔记本运行笔记本

I have a notebook with functions in a repo folder that I am trying to run in another notebook.我在 repo 文件夹中有一个带有功能的笔记本,我试图在另一个笔记本中运行它。 Normally I can r
0
0回复
30

无法在Databricks中安装geopandasPypi包(运行时5.5LTSSpark2.4.3Scala2.11)

I cannot install geopandas package in Databricks.我无法在 Databricks 中安装 geopandas 包。 I'm using cluster Run time 5.5 LTS Spark 2.4.3 Scala 2.11我正在使用集群运行时
1
0回复
15

使用Databricks-connect时未发现模块错误

I have custom libraries that I have installed on my cluster using EGG files and also on my local machine.我使用 EGG 文件在我的集群上以及我的本地机器上安装了自定义库。 I use datab
0
1回复
20

在数据块中的PythonWheel包中找不到依赖项

I created a python wheel file containing two python files (file1.py and file2.py) that have some customized modules.我创建了一个 python 轮文件,其中包含两个具有一些自定义模块的
1
0回复
26

从databricksnotebookpyspark连接Synapse/Azuresqldb

I have a req where we need to connect to azure synapse from databricks notebook.我有一个要求,我们需要从 databricks notebook 连接到 azure synapse。 We had a class for
1
1回复
27

AnalysisException:路径不存在:dbfs:/databricks/python/lib/python3.7/site-packages/sampleFolder/data;

I am packing the following code in a whl file:我将以下代码打包在 whl 文件中:from pkg_resources import resource_filenamedef path_to_model(anomaly_dir_name: str, da
2
1回复
37

在Spark作业中获取Databricks集群ID(或获取集群链接)

I want to get the cluster link (or the cluster ID to manually compose the link) inside a running Spark job.我想在正在运行的 Spark 作业中获取集群链接(或手动组合链接的集群 ID)。 Th
1
1回复
24

在azuredatabricks笔记本中重新启动集群后,包单元总是被破坏

I've my shared code in one package cell and I'm using that package to some other notebook cell.我在一个包单元中有我的共享代码,我正在将该包用于其他笔记本单元。 But everytime cluster
0
0回复
48

如何在数据块DRE7.6及更高版本上使用python3/python2mypthon3.zip编译的zip执行spark提交作业?

I am trying to execute spark submit job with python3 and python2 compiled mypthon3.zip on Databricks DRE 7.6 and above and getting below error我正在尝试在 D
1
0回复
36

如何将具有不同属性模式的XML转换为Scala中的数据帧

I have the following XML file, each table has different attribute names and the schema's are different for each of these at_name's.我有以下 XML 文件,每个表都有不同
-1
0回复
26

如何使用databricks连接数据库并为pyshark中的每个查询返回结果集

Create a class database.创建类数据库。 Class will need to have类将需要有 Constructor to initialize dB connection and other variables用于初始化 dB 连接和其他变量的构造函数 Methods
0
1回复
74

Databricks:非火花代码的远程执行

Using databricks-connect, I am able to run spark-code on a cluster.使用 databricks-connect,我可以在集群上运行 spark-code。 The official documentation ( https://do
0
0回复
20

Databricks:此JVM问题中只能启动一个streamingContext未解决

I'm trying to run a streaming job in databricks notebook on spark 2.4.5 version.我正在尝试在 spark 2.4.5 版本的 databricks notebook 中运行流作业。 Trying it with not

1 2 3 4 5 6 7 8 9 10 下一页