[英]How to use server side cursors with psycopg2
我有一个有 400 万行的表,我使用 psycopg2 来执行:
SELECT * FROM ..WHERE query
我之前没有听说过服务器端游标,当您期望获得大量结果时,我正在阅读它是一个很好的做法。
我发现文档有点有限,我有一些基本问题。
首先,我将服务器端游标声明为:
cur = conn.cursor('cursor-name')
然后我执行查询为:
cur.itersize = 10000
sqlstr = "SELECT clmn1, clmn2 FROM public.table WHERE clmn1 LIKE 'At%'"
cur.execute(sqlstr)
我的问题是:我现在该怎么办? 我如何获得结果?
我是否遍历行:
row = cur.fetchone()
while row:
row = cur.fetchone()
或者我使用 fetchmany() 并且我这样做:
row = cur.fetchmany(10)
但在第二种情况下,我如何“滚动”结果?
还有 itersize 的意义是什么?
Psycopg2 有一个很好的界面来处理服务器端游标。 这是一个可能使用的模板:
with psycopg2.connect(database_connection_string) as conn:
with conn.cursor(name='name_of_cursor') as cursor:
cursor.itersize = 20000
query = "SELECT * FROM ..."
cursor.execute(query)
for row in cursor:
# process row
上面的代码创建连接并自动将查询结果放入服务器端游标中。 值itersize
设置客户端将从服务器端游标一次下拉的行数。 您使用的值应该平衡网络调用的数量与客户端上的内存使用情况。 例如,如果您的结果计数为 300 万,则itersize
值为 2000(默认值)将导致 1500 次网络调用。 如果 2000 行消耗的内存很少,请增加该数字。
当for row in cursor
使用for row in cursor
您当然一次处理一行,但 Psycopg2 将为您一次预取itersize
行。
如果您出于某种原因想使用fetchmany
,您可以执行以下操作:
while True:
rows = cursor.fetchmany(100)
if len(rows) > 0:
for row in rows:
# process row
else:
break
fetchmany
这种用法不会触发对服务器的网络调用以获取更多行,直到预取批次用完为止。 (这是一个复杂的例子,上面的代码没有提供任何内容,但演示了如何在需要时使用fetchmany
。)
除了cur.fetchmany(n)
您还可以使用 PostgreSQL游标:
cur.execute("declare foo cursor for select * from generate_series(1,1000000)")
cur.execute("fetch forward 100 from foo")
rows = cur.fetchall()
# ...
cur.execute("fetch forward 100 from foo")
rows = cur.fetchall()
# and so on
当我不想一次加载数百万行时,我倾向于做这样的事情。 如果您将数百万行加载到内存中,您可以将程序变成一个非常占用内存的程序。 特别是如果您要从这些行或类似的东西中制作 python 域对象。 我不确定名称中的uuid4
是否必要,但我的想法是,如果两个进程进行相同的查询,我希望单个服务器端游标不重叠。
from uuid import uuid4
import psycopg2
def fetch_things() -> Iterable[MyDomainObject]:
with psycopg2.connect(database_connection_string) as conn:
with conn.cursor(name=f"my_name_{uuid4()}") as cursor:
cursor.itersize = 500_000
query = "SELECT * FROM ..."
cursor.execute(query)
for row in cursor:
yield MyDomainObject(row)
如果有人知道这是否会在 SQL 服务器或类似问题上造成存储问题,我很感兴趣。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.