繁体 English 中英

Amazon Textract 与 Amazon Rekognition DetectText

[英]Amazon Textract vs Amazon Rekognition DetectText

原文 2019-05-06 15:34:20 8 2 amazon-web-services/ amazon-rekognition/ amazon-textract

我如何决定何时使用 Amazon Textract 与 Amazon Rekognition 的TextDetect方法？

我的用例是从移动设备单击图片并将图像数据转换为文本并存储到 AWS RDS 中。

2 个解决方案

在端到端的问题解决方面，Textract 会表现得更好，因为它的 OCR 功能更全。 如果您只是想从野外拍摄的图片中提取一两行文本，例如路牌或广告牌（即：不是文档或表格），我会推荐 Amazon Rekognition。

Amazon Textract是一种较新的 AWS 服务，它是专门为解决文档和 PDF 图像中的 OCR（光学字符识别）问题而创建的。 虽然 Rekognition 是一种更通用的计算机视觉服务，但 Textract 有更多面向 OCR 的调整参数来优化准确有效地提取文本的过程。

开箱即用，如果您尝试做的只是检测文本和相关元数据（坐标、角度、置信度值），则 Rekognition DetectText方法的性能可能与analyze_document中等效的analyze_document方法类似，但 Textract 提供了进一步的语义结构化这有助于文本管理/格式化，抽象开发人员传统上需要自己编写的其他形式的后处理。

最后，在比较两种检测文本方法的成本时，与 Rekognition（1.00 美元/1000 张图像）相比，Textract 的成本要高一些（1.50 美元/1000 张图像）。

如果图片中只有随机文本，则使用Amazon Rekognition 。 它会在任何位置找到文本。

Amazon Textract旨在将纸质文档转换为有组织的数据。 它可能不适用于随机图片（虽然我还没有尝试过，所以我不能确定！）。