繁体   English   中英

从笔记本中提取文本

[英]Text Extraction from Notebook

我正在尝试从图像中提取手写文本。 我将python与opencv函数一起使用,例如find_contours。 当我使用像这样的图像时,一切都很好:

在此处输入图片说明

效果很好,因为我有简单的背景。 但随后我用此图像对其进行了测试:

在此处输入图片说明

由于背景中有笔记本的线条,因此我无法仅提取文本。 尽管文本是红色的,但我将所有图像都变成了灰度或有时达到阈值,因此所有颜色都变成了黑色,就像笔记本上的线条一样。 这样,文本的颜色就无关紧要。 所以我的问题是:有人可以给我建议或可能的解决方案,以处理这种背景以提取文本。 我真的不想使用滑动窗口方法。 先感谢您

我决定再次尝试使用OpenCV中的HoughLinesP功能,这一次给了我更多希望和满意的结果。 这是我用来删除大部分行的代码的片段:

import cv2
import numpy

img = cv2.imread('thresh.png')
edges = cv2.Canny(img, 50, 150, apertureSize=3)
minLineLength = 0
maxLineGap = 5
lines = cv2.HoughLinesP(edges, 1, numpy.pi / 180, 100, minLineLength, maxLineGap)

for x in range(len(lines)):
    for x1, y1, x2, y2 in lines[x]:
        cv2.line(img, (x1, y1), (x2, y2), (0, 0, 0), 2)

cv2.imwrite('houghlines3.jpg', img)

附加信息:thresh.png是存储初始图片阈值版本的图像。 这整个过程的工作方式是在图像中找到线条并将其绘制为黑色(因为在我的阈值中,接近白色的部分变为黑色,反之亦然)。 这就是清除界线的方式。

PS:希望我能帮助别人! 干杯!

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM