簡體   English   中英

在jpeg / bmp / pdf圖像中搜索直線,圓和文本

[英]Searching jpeg/bmp/pdf image for straight lines, circles and text

我想創建一個圖像解析器,它將讀取具有以下內容的圖像:
1.直線
2.圈子
3.弧形
4.文字

我願意為任何類型的圖像格式(jpeg,bmp或PDF格式)提供解決方案。

我見過QImage文檔。 它應該為我提供像素數據,我可以以2D矩陣的形式存儲。 目前我將假設只有兩種顏色黑色和白色。 白色表示空像素,黑色表示繪制的像素。

所以我會有一個稀疏矩陣

0 1 1 1 0 0 0
0 0 0 0 0 0 1
0 1 1 0 0 0 1
1 0 0 1 0 0 1
1 0 0 1 0 0 0
0 1 1 0 0 0 0

現在我想解碼這個矩陣並搜索元素。 搜索水平和垂直線很容易,因為對於每個元素,我只能掃描其相鄰的行元素和列元素。

如何搜索其他元素(有角度的線,圓,弧和可能的文本)?

對於文本,我讀到QImage有text()函數,但我不知道它的輸入文件是什么類型的。

我還可以考慮其他圖書館嗎? 請注意,我只是希望能夠讀取圖像,不需要處理。

有沒有其他方法可以實現這一目標? 還是我太野心了?

謝謝

解決這個問題的一個有趣方法是使用機器學習系統,例如神經網絡和遺傳算法。 特別是神經網絡在模式匹配方面非常擅長,並且經常被看作用於諸如手寫識別之類的任務。

如果您搜索它,有很多相關信息。 這是一篇這樣的文章,它是對NN的介紹。

如果您的輸入圖像始終是黑白的,我認為調整代碼示例以使其工作並不太困難。

我建議使用Viola-Jones物體檢測算法

雖然這種方法通常是在人臉檢測上實現的 - 原始文章討論了一般物體檢測,例如文本,圓圈和線條。

看看OpenCV庫。

它提供了大多數用於圖像檢測和視覺的標准算法,並且其實現的代碼質量一般都很高。

請注意,這通常是一個非常困難的問題,因此在獲得滿意的解決方案之前,您可能需要進行大量的研究。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM