[英]read_sql_table in Dask returns NoSuchTableError
我有一个使用 Pandas 的 read_sql,它工作正常。 但是,当我尝试使用相同的逻辑在 Dask 下重新创建相同的数据框时。 它给了我 NoSuchTableError。 我确定该表存在于我的 SQL 数据库中。
熊猫#作品:
import urllib
import sqlalchemy as sa
import pandas as pd
sql = "SELECT * FROM my_table"
params = urllib.parse.quote_plus("DRIVER={SQL Server Native Client 11.0};\
SERVER=my_server;\
DATABASE=db_name;\
Trusted_Connection=yes;")
engine = sa.create_engine('mssql+pyodbc:///?odbc_connect=%s' % params)
df = pd.read_sql(sql, engine)
print(df.head())
由于 Dask 使用的是来自 sqlalchemy 的完整 URL,我还尝试在 sqlalchemy 中重新创建相同的连接并且它可以工作。 它只是让我感到困惑,为什么它在 Dask 中不起作用。
sqlalchemy #作品:
import pyodbc
import sqlalchemy as sal
from sqlalchemy import create_engine
engine = sal.create_engine('mssql+pyodbc://my_server/db_name\
?driver=SQL+Server+Native+Client+11.0?trusted_connection=yes')
result = engine.execute("select * from my_table")
for row in result:
print(row[0])
Dask #NoSuchTableError:
import urllib
import sqlalchemy as sa
import dask.dataframe as dd
from sqlalchemy.engine.url import make_url
params = urllib.parse.quote_plus("DRIVER={SQL Server Native Client 11.0};\
SERVER=my_server;\
DATABASE=db_name;\
Trusted_Connection=yes;")
conn_str = 'mssql+pyodbc:///?odbc_connect={}'.format(params)
url = make_url(conn_str)
df = dd.read_sql_table('my_table', url, index_col='ID')
print(df.head())
有没有人遇到过相同/类似的问题? 任何想法都非常感谢! 提前致谢。
在不知道有关如何设置 SQL Server 的更多详细信息的情况下,我相信这将是 Dask 文档中特定于 SQL Server 的内容,您需要提供schema=
关键字,如下所示:
dftest = dd.read_sql_table(table="table_name_only", uri=uri, index_col="somekey", schema="schema_name", divisions=[1,2,3])
请注意,这里的uri
是 SQLAlchemy 字符串,而不是连接对象。
https://docs.dask.org/en/latest/dataframe-api.html#dask.dataframe.read_sql_table
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.