CMOS图像传感器工作原理

首先来看下CMOS图像传感器长啥样:

在这里插入图片描述
我们知道计算机不能处理模拟信号,只能处理数字信号,所以现实世界的光影也不能直接被计算机处理,要记录数字影像,那么我们必须把真实的影像通过数字化转变为计算机能读取写入的格式。因此我们就需要一种东西,能够把光信号转换为电信号,这也就是 CCD 和CMOS 的由来,由于成本和功耗等等原因我们现在看到的数字相机和手机都是 CMOS, 具体原因展开太麻烦所以也就不详细说了。

每一个 CMOS 像素都包括感光二极管(Photodiode)、浮动式扩散层(Floating diffusion layer)、传输电极门 (Transfer gate)、起放大作用的MOSFET、起像素选择开关作用的M0SFET.在 CMOS 的曝光阶段,感光二极管完成光电转换,产生信号电荷,曝光结束后,传输电极门打开,信号电荷被传送到浮动式扩散层,由起放大作用的MOSFET电极门来拾取,电荷信号转换为电压信号。所以这样的 CMOS 也就完成了光电转换、电荷电压转换、模拟数字转换的三大作用,通过它我们就能把光信号转化为电信号,最终得到数字信号被计算机读取,这样,我们就已经拥有了记录光线明暗的能力,但这还不够,因为我们需要色彩。

在这里插入图片描述
现代彩色CMOS 的原理也很简单,直接在黑白图像传感器的基础上增加色彩滤波阵列(CFA),从而实现从黑白到彩色的成像。很著名的一种设计就是Bayer CFA(拜耳色彩滤波阵列)。一个很有趣的事就是,我们用来记录光影的 CMOS, 和我们用来输出光影的显示器,原理也刚好是向相反的,CMOS 把光转化为电信号最后以数字格式记录,显示器把解码的数字格式从电信号重新转化为光。光电之间的转换也就构成了我们人类数字影像的基础。好了回到正题,为什么是 RGB 三种颜色?为什么 G 的占比要高于 R 和 B 呢?
在这里插入图片描述
这是因为人视网膜上的感光细胞分为两种:视锥细胞和视杆细胞,分别对应人眼的明视觉和暗视觉。视锥细胞又分三种:红色感光细胞、绿色感光细胞、蓝色感光细胞,它们对照明的明暗条件敏感度较低,只有当光照强度达到一定条件锥细胞才能够起作用。视杆细胞对光照的敏感度较高,可以在光照条件很暗的情况下对景物成像,却不能感受颜色。这也解释了为什么在晚上的时候人仍然能够看到物体,却不能有效地分辨物体的颜色的现象跟颜色有关的三种视锥细胞,每一种都对 RGB 三种颜色最敏感。

在这里插入图片描述
注意,是最敏感,所以蓝视锥细胞不仅能感应蓝色,也可以感应到绿和一部分红色,绿视锥细胞不仅能感应绿,也可以感应一部份蓝和红,最后红视锥细胞也是如此。所以通过三种视锥细胞感应到不同波长光谱的比例,人类就能识别出视觉上除了红绿蓝之外的其他颜色。

在这里插入图片描述
人造的大部分显示器,也都是利用这个特性来欺骗人类看到红绿蓝之外的颜色,比如上图就是我的显示器在显示黄色时实际发出的光谱,根本就没有黄色,这就是一个骗子显示器,但是通过对人眼视觉特性的利用,我们看到的就是黄色。1931年,CIE(国际标准照明委员会)建立了一系列表示可见光谱的颜色空间标准,定义了CIE-RGB基色系统。规定了RGB系统的三原色光波长分别为700nm,546.1nm,435.8nm的红光(R)、绿光(G)、蓝光(B)。

在这里插入图片描述
通过混色实验可以得到上图的一组曲线,它们表示在 380nm-780nm 范围 内当各个光谱能量一样时,某一波长的光谱色与

在这里插入图片描述
混色结果一样,并称这三条曲线为 CIE1931 RGB 系统光谱三刺激值曲线,这与后文中我们要提到的标定有很大关系。
在这里插入图片描述
这还可以延伸一下,由于计算颜色三刺激值时会出现负值,所以 CIE 又设计出了一套 CIE-XYZ 系统,用 X, Y, Z 来代表红绿蓝三原色,上图也就是 CIE1931 XYZ 系统光谱三刺激值曲线。
在这里插入图片描述
著名的 CIE 1931 xy 色度图也就是从此而来,我们可以用它描述出任意的一种人眼可见色彩。当然后来为了更精确的修正,还有 CIE 1976 u’v 色度图,我们的很多评测也都使用了这个标准。因此,在理论上只需要记录 RGB, 也就能还原出我们眼睛看到的所有颜色了。
好了我们回到滤镜颜色的问题上。对于基于 Bayer CFA 的设计,当我们拍摄右侧图 1 的场景时,CMOS 所有像素传回来的图像直接组合的结果就是右侧图 2, 当我们将滤镜颜色加到像素上会得到图 3, 很明显这也不应该是我们最后看到的图像。所以由 3 到 4 的过程,就需要插值算法来补足。

在这里插入图片描述
对于 Bayer CFA 设计的 CMOS, 有常用的插值算法,比如相邻像素插值、双线性插值、三次多项式插值等,它们的目的都是为了还原出全部的 RGB 三个通道分量,比如双线性插值就是这么算的:对于只有红色分量的像素:例如 R32:
在这里插入图片描述
通过还原得到完整的 RGB 分量,我们就能得到一幅没有缺损的图像了,但是这就是终点了吗?并不是,我们不能直接把这样的图像存储,因为这其中有一个很重要的问题:Bayer CFA 经过插值之后,CFA 的色特性与人眼的视觉特性并不一定重合,所以图像中的像素颜色可能都是偏色的,这里可能是光学透镜的光谱特性导致,也可能是 Bayer CFA 上的彩色滤镜光谱特性导致,跟拍摄的环境光也有很大关系。所以还有一步,那就是校正标定。校正标定之中最重要的则是伽马校正和颜色校正,先看伽马校正:在现实世界中,几乎所有的显示器、摄影胶片以及很多电子照相机的光电转换特性都是非线性的。这些非线性部件的输出与输入之间的关系通常用幂函数表示。理想状态下,色彩强度 (Intensity)与电子束的电压信号之间成线性关系,但实际情况刚好想法,色彩强度与输入的电压信号之间是非线性关系。显示器的输出强度和输出电压的响应大致成幂指数关系,下方式子表示输出的强度随着输入电压的增长成指数增长,通常我们就把这个幂指数称为伽马(Gamma):

在这里插入图片描述
为了使图像在显示器上的效果和实际情形更为接近,在摄像机获取图像后,必须进行伽马校正,把上边式子的非线性关系校正为线性关系:

在这里插入图片描述
其中,是经过校正处理后的图像的像素值;是没有经过校正的像素值;伽马值γ表示校正的程度,γ=1 时,不进行校正,γ值越大,像素灰度值的校正程度越大。颜色校正:由于不同厂家在制造 CMOS 时使用的彩色滤光片不同,CMOS 对不同波段的光电响应度不同,都会导致相机的光谱响应曲线不同,比如这是某一个 CMOS 的光谱相应曲线:

在这里插入图片描述
很容易的就会发现彩色相机 RGB 三刺激值曲线图和之前我们提到过的 CIE 1931-RGB 系统有很大差别。
想减小这种差异,就要对原始图像的像素灰度值(R,G,B)进行必要的补偿,带来和人眼感知相近的颜色,这其中的工作就是颜色标定。好了,铺垫了这么久,终于讲到那当我们把 RGGB 换成 RYYB, 用黄色滤镜替代绿色会怎么样了。

在这里插入图片描述
黄光的光谱主波是 570-590 纳米,刚好被夹在红绿主波之间,所以只要彩色滤镜的光谱特性设计得足够好,那么理论上黄色也就能记录红+绿。

在这种非常理想的条件下,RYYB 的感光总量肯定可以超过 RGGB, 不过这也给插值算法补全 RGB 的那一步带来了一定困难,插值不理想的话后期色彩标定也会出现问题。
在这里插入图片描述 转自:https://tech.qudong.com/2019/0402/558867.shtml