繁体   English   中英

Google Cloud Platform - 使用自定义数据格式进行 Vertex AI 训练

[英]Google Cloud Platform - Vertex AI training with custom data format

我需要在顶点 AI 中训练自定义 OCR。 我的数据有裁剪图像文件夹,每个图像都是一行,一个 csv 文件有 2 列:图像名称和图像中的文本。 但是当我尝试将它导入到 Vertex AI 的数据集中时,我看到该图像数据集仅支持分类、分割、object 检测。 所有数据集都有固定数量的label,但我的数据有无限数量的标签(如果我们将图像中的文本视为标签),所以所有类型都不符合我的要求。 我可以使用顶点 AI 进行训练吗?如何操作?

由于 Vertex AI 管理的数据集不支持 OCR 应用程序,您可以使用 Vertex AI 的训练和预测服务训练和部署自定义 model。

我找到了一篇关于从头开始构建 OCR 系统的好文章 该 OCR 系统分两步实施

  1. 文本检测
  2. 文字识别

请注意,本文不受 Google Cloud 官方支持。

在本地测试 model 后,您可以使用自定义 model 培训服务在 Vertex AI 上对其进行培训。 请按照此 Codelab 获取有关训练和部署自定义model的分步说明。

训练完成后,可以部署 model 以使用 Vertex AI 提供的预构建容器或根据您的要求自定义容器进行推理。 您还可以在同步请求的批量预测和异步请求的在线预测之间进行选择。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM