[英]Using psycopg2 with Lambda to Update Redshift (Python)
我正在尝试使用 python 从 Lambda function 更新 Redshift。 为此,我试图组合 2 个代码片段。 当我单独运行它们时,这两个片段都可以正常工作。
从 PyDev 为 Eclipse 更新 Redshift
import psycopg2 conn_string = "dbname='name' port='0000' user='name' password='pwd' host='url'" conn = psycopg2.connect(conn_string) cursor = conn.cursor() cursor.execute("UPDATE table SET attribute='new'") conn.commit() cursor.close()
接收上传到 S3 存储桶的内容(Lambda 上提供的预建模板)
from __future__ import print_function import json import urllib import boto3 print('Loading function') s3 = boto3.client('s3') def lambda_handler(event, context): #print("Received event: " + json.dumps(event, indent=2)) # Get the object from the event and show its content type bucket = event['Records'][0]['s3']['bucket']['name'] key = urllib.unquote_plus(event['Records'][0]['s3']['object']['key']).decode('utf8') try: response = s3.get_object(Bucket=bucket, Key=key) print("CONTENT TYPE: " + response['ContentType']) return response['ContentType'] except Exception as e: print(e) print('Error getting object {} from bucket {}. Make sure they exist and your bucket is in the same region as this function.'.format(key, bucket)) raise e
由于这两个部分都有效,我尝试将它们组合起来,以便在将文件上传到 s3 时更新 Redshift:
from __future__ import print_function
import json
import urllib
import boto3
import psycopg2
print('Loading function')
s3 = boto3.client('s3')
def lambda_handler(event, context):
#print("Received event: " + json.dumps(event, indent=2))
# Get the object from the event and show its content type
bucket = event['Records'][0]['s3']['bucket']['name']
key = urllib.unquote_plus(event['Records'][0]['s3']['object']['key']).decode('utf8')
conn_string = "dbname='name' port='0000' user='name' password='pwd' host='url'"
conn = psycopg2.connect(conn_string)
cursor = conn.cursor()
cursor.execute("UPDATE table SET attribute='new'")
conn.commit()
cursor.close()
try:
response = s3.get_object(Bucket=bucket, Key=key)
print("CONTENT TYPE: " + response['Body'].read())
return response['Body'].read()
except Exception as e:
print(e)
print('Error getting object {} from bucket {}. Make sure they exist and your bucket is in the same region as this function.'.format(key, bucket))
raise e
由于我使用的是外部库,因此我需要创建一个部署 package。 我创建了一个新文件夹 (lambda_function1) 并将 my.py 文件 (lambda_function1.py) 移动到该文件夹。 我运行以下命令在该文件夹中安装 psycopg2:
pip install psycopg2 -t \lambda_function1
我收到以下反馈:
Collecting psycopg2
Using cached psycopg2-2.6.1-cp34-none-win_amd64.whl
Installing collected packages: psycopg2
Successfully installed psycopg2-2.6.1
然后我压缩了目录的内容。 并将 zip 上传到我的 lambda function。 当我将文档上传到 function 监控的存储桶时,我在 cloudwatch 日志中收到以下错误:
Unable to import module 'lambda_function1': No module named _psycopg
当我查看图书馆时,唯一名为“_psycopg”的东西是“_psycopg.pyd”。
是什么导致了这个问题? 当我使用 3.4 时,Lambda 使用 Python 2.7 是否重要? 我将文件内容压缩到 Windows 机器上是否重要? 有没有人能够从 lambda 成功连接到 Redshift?
为了使其工作,您需要使用静态链接的libpq.so
库构建psycopg2
。 查看此存储库https://github.com/jkehler/awslambda-psycopg2 。 它已经构建了 psycopg2 包以及如何自己构建它的说明。
回到你的问题:
是什么导致了这个问题?
psycopg2
需要为 Linux 构建一个使用静态链接库编译的。
当我使用 3.4 时,Lambda 使用 Python 2.7 有关系吗?
是的,lambda 只支持 2.7 版本。 只需创建虚拟环境并在其中安装所有必要的软件包。
我在 Windows 机器上压缩文件的内容有关系吗?
只要您压缩的所有库都可以在 Linux 上运行,它就不会
有没有人能够从 lambda 成功连接到 Redshift?
是的。
我刚刚遇到了同样的问题。 我偶然发现了另一个答案中提到的同一个github 项目,该项目对问题的解释如下:
由于 AWS Lambda 在 AMI 映像中缺少所需的 PostgreSQL 库,我们需要使用 PostgreSQL libpq.so 库静态链接的 libpq 库而不是默认的动态链接来编译 psycopg2。
这在之前的答案中已经指出,我开始按照说明使用静态链接的 PostgreSQL 库构建自己的 psycopg2 版本。 不过我找到了一个更简单的选择。 我在psycopg2 github 页面上注意到以下内容:
您还可以通过从 PyPI 安装 psycopg2-binary 包来获取独立包,不需要编译器或外部库:
$ pip install psycopg2-binary
二进制包是开发和测试的实用选择,但在生产中建议使用从源代码构建的包。
当我 pip 安装了 psycopg2-binary 包并将其包含在我的 requirements.txt 文件中时,我能够完美地从 lambda 函数连接到我的 postgresql 数据库。 我正在使用我强烈推荐的圣杯。 我意识到 psycopg2 建议不要将二进制版本用于生产,但我没有看到使用二进制版本或自己编译和静态链接它之间的巨大差异。 如果我错了,请有人纠正我。
哦,男孩! 虽然有些答案可能真的很棒而且有效! 只是偶然发现了这个https://pypi.org/project/aws-psycopg2/ ,它对我来说就像一个魅力。 步骤:
mkdir aws-psycopg2
cd aws-psycopg2
vi get_layer_packages.sh
export PKG_DIR="python"
rm -rf ${PKG_DIR} && mkdir -p ${PKG_DIR}
docker run --rm -v $(pwd):/foo -w /foo lambci/lambda:build-python3.6 \
pip install -r requirements.txt --no-deps -t ${PKG_DIR}
vi 要求.txt
aws-psycopg2
然后做: chmod +x get_layer_packages.sh
./get_layer_packages.sh
zip -r aws-psycopg2.zip 。
将此 zip 上传到 AWS Lambda 层!
要将psycopg2与 aws lambda 一起使用,请使用import aws-psycopg2
由于 aws 支持 psycopg2 但导入 psycopg2 的方式有点不同,因为 aws 本身有一个为 psycopg2 编译的库,所以我们需要使用aws-psycopg2导入
在 lambda 上使用 psycopg2 的另一种方法(如果您在 Windows 上编程并在 lambda 上使用 python 3.6)
假设您的打包正确, no module named psycopg2
的no module named psycopg2
错误通常表示您的 psycopg2 部署的二进制文件对于您的目标操作系统或 Python 版本不正确。
对于 Lambda,我们发现psycopg2 二进制文件有效(使用 manylinux_x86_64)。 有报告的风险段错误,由于竞争的存在的libssl二进制文件,虽然我们还没有那个呢。 (这基本上是上面 jshammon 回答的 +1)
“正确的解决方案”可能是专门为 Lambda 重新编译jkehlers只缺少lib_pq.so
,但它目前不支持 ssl+py3.7 并且我们太 Windows 无法自己重新编译它。
这么多答案,但对我不起作用! 请注意,AWS-Lambda 没有预装大多数与数据库相关的库,因此您需要添加一个包含代码和库的zip
文件才能使其正常工作。 请按照此处的步骤操作: 链接
这是我在尝试的所有方法中找到的最简单的方法:
我在需要 psycopg2 的 lambda 函数中添加了一个lamdba 层。 以下是可用 Lambda 层的列表: https : //github.com/jetbridge/psycopg2-lambda-layer
我正在使用无服务器框架,这就是我的 Lambda 函数的样子:
functions:
example:
handler: handler.example
layers:
- arn:aws:lambda:us-east-1:898466741470:layer:psycopg2-py37:3
events:
- http:
path: example
method: post
authorizer: aws_iam
cors: true
我已经阅读了一些解决方案,包括用户在 Github 上定制了 Psychopg2 模块年的解决方案,但问题仍然存在。
我最近通过在我的 Macbook 上卸载当前的 Psychopg2 来解决它,然后去 pip 站点安装它。
pip install psycopg2
。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.