簡體   English   中英

用於文本分類的Tensorflow模型

[英]Tensorflow model for text classification

我正在使用OCR和Tensorflow構建一個Android應用程序。 它掃描超市中的價格標簽,並將掃描數據放入不同的字段。 我已經完成了OCR部分,因此圖像 - >文本識別工作正常,Tensorflow只需要處理文本輸入。

我是Tensorflow和整體機器學習的新手。 是否可以使用Tensorflow進行以下工作?如果是,您是否可以分享一些有關如何操作的想法?

平均輸入如下:

CARLSBERG
EESTI
HELE OLU 5%
1.59 +0.10
500 ml pudel
3.18 /I
4740019113419

目標是按如下方式對此數據進行排序:

Brand: CARLSBERG
Product name: HELE OLU 5%
Size: 500
Units: ml

確定特定字符串將如何分類的參數是:

  • 案件
  • 電話號碼
  • 超市(默認情況下已知)
  • 總行數
  • 字母/數字比率

我認為第一步是親自動手或生成一些標記的訓練數據。 你應該研究一下特征提取; 例如,如果您注意到某個項目,第二行通常是價格,您可以將其表示為參數。 或者說如果一個數字后面跟一個像ml / l / oz這樣的單位,它可能就是音量。 您想知道的是,您對某個特定行/字符串的價格是多么自信。

但是,我認為TensorFlow更適合問題的OCR部分,你已經解決了。 你要問的是更多的文本解析,這可以通過NLP方法更好地解決。

正如4d11的回答中所提到的,機器學習中最大的挑戰之一就是獲得高質量,大小合適的訓練數據集。

在將數據輸入Tensorflow網絡/模型方面,我建議您查看有關功能列的“入門”教程: https//www.tensorflow.org/get_started/feature_columns

特征列用於以數字方式表示不同類型的數據,以用於可以饋送到模型中的表示。 本教程詳細介紹了它的工作方式以及為什么您可以選擇以不同的方式表示不同的數據。 我發現作為介紹非常有用。

用於文本識別的Tensorflow模型(具有視覺注意力的CNN + seq2seq)可用作Python包並與Google Cloud ML Engine兼容。 https://github.com/emedvedev/attention-ocr

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM