繁体   English   中英

PIL 的色彩空间转换 YCbCr -> RGB

[英]PIL's colour space conversion YCbCr -> RGB

PIL v1.1.7 使用的算法给出了“褪色”的结果。 使用ffmpeg转换相同的源数据时,它看起来是正确的。 使用mplayer可以得到与ffmpeg相同的结果(也许它们在下面使用相同的库)。 这让我相信 PIL 可能会堵塞色彩空间转换。 转换似乎来自libImaging/ConvertYCbCr.c

/*  JPEG/JFIF YCbCr conversions

    Y  = R *  0.29900 + G *  0.58700 + B *  0.11400
    Cb = R * -0.16874 + G * -0.33126 + B *  0.50000 + 128
    Cr = R *  0.50000 + G * -0.41869 + B * -0.08131 + 128

    R  = Y +                       + (Cr - 128) *  1.40200
    G  = Y + (Cb - 128) * -0.34414 + (Cr - 128) * -0.71414
    B  = Y + (Cb - 128) *  1.77200

*/

这只是源代码中的注释,当然它是 C 代码,实际的 function 是通过查找表实现的,而不是矩阵乘法( static INT16 R_Cr

void
ImagingConvertYCbCr2RGB(UINT8* out, const UINT8* in, int pixels)
{
    int x;
    UINT8 a;
    int r, g, b;
    int y, cr, cb;

    for (x = 0; x < pixels; x++, in += 4, out += 4) {

        y = in[0];
        cb = in[1];
        cr = in[2];
        a = in[3];

        r = y + ((           R_Cr[cr]) >> SCALE);
        g = y + ((G_Cb[cb] + G_Cr[cr]) >> SCALE);
        b = y + ((B_Cb[cb]           ) >> SCALE);

        out[0] = (r <= 0) ? 0 : (r >= 255) ? 255 : r;
        out[1] = (g <= 0) ? 0 : (g >= 255) ? 255 : g;
        out[2] = (b <= 0) ? 0 : (b >= 255) ? 255 : b;
        out[3] = a;
    }
}

我已经用谷歌搜索了,但似乎对进行这种色彩空间转换的“正确”方法有很多困惑。 所以我的问题是,以上是否正确——如果不是,还有什么更好的方法?


编辑:阅读 Mark Ransom 提供的链接后,我发现存在冲突的定义取决于您是使用 YCbCr 的全部范围还是限制在有效范围内。 有关更多信息,请参见下面的链接:

似乎 PIL 版本使用了不正确的算法,所以我推出了自己的 function 进行转换,得到正确的外观结果(“SDTV”版本)。 代码如下,供未来读者使用:

from numpy import dot, ndarray, array

def yuv2rgb(im, version='SDTV'):
    """
    Convert array-like YUV image to RGB colourspace

    version:
      - 'SDTV':  ITU-R BT.601 version  (default)
      - 'HDTV':  ITU-R BT.709 version
    """
    if not im.dtype == 'uint8':
        raise TypeError('yuv2rgb only implemented for uint8 arrays')

    # clip input to the valid range
    yuv = ndarray(im.shape)  # float64
    yuv[:,:, 0] = im[:,:, 0].clip(16, 235).astype(yuv.dtype) - 16
    yuv[:,:,1:] = im[:,:,1:].clip(16, 240).astype(yuv.dtype) - 128

    if version.upper() == 'SDTV':
        A = array([[1.,                 0.,  0.701            ],
                   [1., -0.886*0.114/0.587, -0.701*0.299/0.587],
                   [1.,  0.886,                             0.]])
        A[:,0]  *= 255./219.
        A[:,1:] *= 255./112.
    elif version.upper() == 'HDTV':
        A = array([[1.164,     0.,  1.793],
                   [1.164, -0.213, -0.533],
                   [1.164,  2.112,     0.]])
    else:
        raise Exception("Unrecognised version (choose 'SDTV' or 'HDTV')")

    rgb = dot(yuv, A.T)
    result = rgb.clip(0, 255).astype('uint8')

    return result

如果您查看 Wikipedia 的定义,您会发现 YCbCr 有两个相互冲突的定义。 ITU-R BT.601定义将值压缩到 16-235 范围以提供脚部空间和头部空间,而JPEG版本使用完整范围 0-255。 如果您要使用 JPEG 的公式对 BT.601 空间中的值进行解码,那么结果肯定会被淘汰。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM