簡體   English   中英

Databricks 中的 Python

[英]Python in Databricks

如何使用 python 在數據塊中啟動基本查詢?

我需要的數據在數據塊中,到目前為止,我一直在使用 Juypterhub 來提取數據並修改一些東西。 但現在我想消除在 Jupyterhub 中提取數據的步驟,並直接將我的 python 代碼移動到數據塊中,然后安排作業。

我開始像下面

%python
import pandas as pd
df = pd.read_sql('select * from databasename.tablename')

並得到以下錯誤

類型錯誤:read_sql() 缺少 1 個必需的位置參數:'con'

所以我嘗試更新

%python
import pandas as pd
import pyodbc

odbc_driver = pyodbc.drivers()[0]
conn = pyodbc.connect(odbc_driver) 

df = pd.read_sql('select * databasename.tablename', con=conn)

我得到了以下錯誤

ModuleNotFoundError:沒有名為“pyodbc”的模塊

有人可以幫忙嗎? 我可以使用 sql 來提取數據,但我在 python 中已經有很多代碼,我不知道要在 sql 中進行轉換。所以我現在只想讓我的 python 代碼在數據塊中工作。

你應該直接使用 spark 的 SQL 設施:

my_df = spark.sql('select * FROM databasename.tablename') 

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM