自动扫描文档图像增强

Question

我正在基于Microsoft纸白板扫描和图像增强功能开发自动图像增强功能

在“白平衡和图像增强”部分中，他们提供了增强的步骤：

首先：他们估计扫描文档或检测到的白板的背景：

1. “将白板区域划分为矩形单元。单元大小应与我们期望板上单个字符的大小大致相同（在我们的实现中为15 x 15像素）。”

然后

2. “将每个单元格中的像素按其亮度值进行排序。由于墨水吸收了入射光，因此白板像素的亮度高于笔画像素的亮度。因此，该单元格内的白板颜色是最高的颜色实际上，我们对前25个百分位数的像素颜色进行平均，以减少传感器噪声带来的误差。”

然后

3. “通过在RGB空间中局部拟合一个平面来过滤单元格的颜色。有时某些单元格完全被笔触覆盖，因此在步骤2中计算出的单元格颜色是不正确的。这些颜色被异常值拒绝为异常值。局部拟合的平面，并替换为其相邻点的插值。”

我的问题是第二和第三步：

它们如何获得照度值，我应该将输入图像转换为YUV颜色空间并从Y通道获得照度值，还是仅在RGB颜色空间上工作？

如何在RGB空间中拟合局部平面？

这是我的python代码，我尝试从输入图像中制作单元格，从YUV颜色空间中获取亮度值，以及一个简单的结果，与从本文中获得的结果相比，该结果似乎不正确。

Python代码：

import cv2
import numpy as np



## Return List of cells from a given Image
def SubImage(image):
    Cells = []
    CellRows = []
    for i in range(0,rows/CellSize):
        subIm = image[i*CellSize:(i+1)*CellSize,:]
        CellRows.append(subIm)
    for img in CellRows:
        for i in range(0,cols/CellSize):
            subIm = img[:,i*CellSize:(i+1)*CellSize]
            Cells.append(subIm)
    return Cells


## Sort luminosity Value
def GetLuminance(Cells):
    luminance = []
    for cel in Cells:
        luminance.append(cel.max())
    return luminance


## Estimate the background color of the white board
def UniformBackground(CelImage,img,luminance):
    a = 0

    for c in range(0,len(CelImage)):
        cel = CelImage[c]
        for i in range(0,cel.shape[0]):
            for j in range(0, cel.shape[1]):
                cel[i,j] = min(1,cel[i,j]/ luminance[c])
    for i in range(0,rows/CellSize):
        for j in range(0,cols/CellSize):
            img[i*CellSize:(i+1)*CellSize,j*CellSize:(j+1)*CellSize] = CelImage[a]
            a = a + 1

if __name__ == '__main__':
    img = cv2.imread('4.png')
    CellSize = 15
    rows,cols,depth = img.shape


    if (rows%CellSize !=0):
        rows = rows - rows%CellSize

    if (cols%CellSize !=0):
        cols = cols - cols%CellSize

    yuvImg = cv2.cvtColor(img, cv2.COLOR_BGR2YUV)
    # Get cells from Y channel
    CellsY = SubImage(yuvImg[:,:,0])
    CellsB = SubImage(img[:,:,0])
    CellsG = SubImage(img[:,:,1])
    CellsR = SubImage(img[:,:,2])

    # Get Luminance From Y cells
    LuminanceY = GetLuminance(CellsY)

    # Uniform Background
    UniformBackground(CellsB, img[:,:,0], LuminanceY)
    UniformBackground(CellsG, img[:,:,1], LuminanceY)
    UniformBackground(CellsR,img[:,:,2], LuminanceY)

    #bgrImg = cv2.cvtColor(imgB, cv2.COLOR_GRAY2BGR)
    #print imgB
    cv2.imwrite('unifrom.jpg',img)

输入白板图片：

输出图像：

预期产量：

Answer 1

temp = cel[i,j]/luminance[c]
if temp > thresh : ##Let thresh be 0.7
   cel[i,j] = 255

亮度值更高的Cel被转换为白色，而其他Cel则保持原样。 具有统一背景的图像输出

Answer 2

让我们逐步解决：

“按每个像素的亮度值对它们进行排序”

是的，您必须将图像转换为具有亮度分量的其他色彩空间，例如Lab色彩空间。

...实际上，我们对前25个百分位数的像素颜色进行平均，以减少传感器噪声引起的误差

意思是说，在获得LAB图像后，您需要将其拆分为多个通道，即L通道图像以其直方图表示，例如具有100个bin（这是夸张的），并且仅取落在最白bin中的像素（例如从75到100）。现在，在找到每个单元中的白色像素之后， 请记住它们！！！ 例如，您可以创建一个遮罩图像，该遮罩图像在除选择为“白色”的像素之外的所有像素上均为0

通过在RGB空间中局部拟合平面来过滤单元格的颜色

现在回到RBG空间。 如您所见，白板消失了，白板变得越来越暗。 如果您将白板像素RGB颜色绘制为轴为R，G和B的3d世界中的3d点，则会得到近似于平面的散点（因为所有这些白板颜色均为灰色）。 现在，将在上一步中标记为“白板”的点放到平面上。 如何安装飞机？ 您就可以使用最小二乘去这个，但他们是如何在文章中写它，我认为他们有RANSAC的初衷。

自动扫描文档图像增强

问题描述

2 个解决方案

解决方案1
0 2018-08-13 08:40:02

解决方案2
0 2018-08-13 13:12:56

自动扫描文档图像增强

问题描述

2 个解决方案

解决方案1 0 2018-08-13 08:40:02

解决方案2 0 2018-08-13 13:12:56

解决方案1
0 2018-08-13 08:40:02

解决方案2
0 2018-08-13 13:12:56