簡體   English   中英

文本光學識別及其結構分析(標題、副標題、正文)

[英]Optical recognition of text and analysis of its structure (title, subtitle, text body)

我們希望分析具有不同語言的具有非常廣泛的排列/結構的文本(非手寫)和圖像的文檔掃描。 我們試圖解決的第一個問題是提取文本並識別和分離標題、副標題和正文。

目前我們正在進行文獻研究。 有大量關於深度學習、計算機視覺、光學字符識別或自然語言處理的文獻,但實際上沒有一篇專注於文本結構的光學識別。

我們想知道,處理文本結構光學識別的學科/領域的名稱是什么?

解決這些問題的最新方法和工具是什么?

光學布局識別 (OLR)。 可以在此處找到用於布局分析和區域提取的開源工具的一個很好的示例。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM