簡體   English   中英

在 aws lambda 上運行 python tika

[英]Running python tika on aws lambda

我正在使用tika python從 pdf 中獲取解析的文本。 它在后台運行 Tika rest 服務,使其可用作鏈接中提到的 python 庫。

在我的本地系統或雲實例上,使用此庫的 python 程序的首次運行在啟動服務時需要一些時間。 但是第二次運行沒有延遲,因為服務已經在運行。 現在,我正在將此程序轉換為 aws lambda function。 因此,每次運行時,服務器都會重新啟動,並且每次啟動 tika 服務都需要額外的時間。

我最近嘗試過引入“EFS for lambda”,但 tika 服務器不會在 EFS 中啟動,因為沒有 java。 有什么方法可以讓 tika 服務器保持運行,以便 lambda 功能可以在沒有每個 lambda function 啟動服務的情況下訪問服務? 還是不能使用 aws lambda?

不幸的是,運行 Lambda function 並不能保證MicroVM可以存活多久。 此外,許多 MicroVM 可以同時啟動以運行 Lambda。

理想情況下,您會將必須永久保持活動狀態的任何東西(或至少讓您控制何時停止它)移動到EC2等服務或使用ECSEKS作為容器運行。

然后,您可以在 VPC 內運行 Lambda 並與資源通信,而無需額外的啟動時間。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM