繁体   English   中英

Amazon Textract 与 Amazon Rekognition DetectText

[英]Amazon Textract vs Amazon Rekognition DetectText

我如何决定何时使用 Amazon Textract 与 Amazon Rekognition 的TextDetect方法?

我的用例是从移动设备单击图片并将图像数据转换为文本并存储到 AWS RDS 中。

在端到端的问题解决方面,Textract 会表现得更好,因为它的 OCR 功能更全。 如果您只是想从野外拍摄的图片中提取一两行文本,例如路牌或广告牌(即:不是文档或表格),我会推荐 Amazon Rekognition。

Amazon Textract是一种较新的 AWS 服务,它是专门为解决文档和 PDF 图像中的 OCR(光学字符识别)问题而创建的。 虽然 Rekognition 是一种更通用的计算机视觉服务,但 Textract 有更多面向 OCR 的调整参数来优化准确有效地提取文本的过程。

开箱即用,如果您尝试做的只是检测文本和相关元数据(坐标、角度、置信度值),则 Rekognition DetectText方法的性能可能与analyze_document中等效的analyze_document方法类似,但 Textract 提供了进一步的语义结构化这有助于文本管理/格式化,抽象开发人员传统上需要自己编写的其他形式的后处理。

最后,在比较两种检测文本方法的成本时,与 Rekognition(1.00 美元/1000 张图像)相比,Textract 的成本要高一些(1.50 美元/1000 张图像)。

如果图片中只有随机文本,则使用Amazon Rekognition 它会在任何位置找到文本。

Amazon Textract旨在将纸质文档转换为有组织的数据 它可能不适用于随机图片(虽然我还没有尝试过,所以我不能确定!)。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM