数字图像处理第三版（冈萨雷斯）——第二章数字图像基础

最新推荐文章于 2025-05-03 14:44:38 发布

原创

最新推荐文章于 2025-05-03 14:44:38 发布 · 2.3k 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#dip #经验分享 #其他 #算法 #矩阵

数字图像处理（冈萨雷斯）——第二章数字图像基础

2.1 视觉感知要素
- 2.1.1 人眼的结构
- 2.1.2 亮度适应和辨别
2.2 光和电磁波谱
2.3 图像感知和获取
- 2.3.1 简单的图像形成模型
2.4 图像取样和量化
2.4.4 图像内插（image interpolation）
2.5 像素间的一些基本关系
2.6 数字图像处理所用数学工具介绍

2.1 视觉感知要素

虽然数字图像处理这一领域建立在数学和概率公式表示的基础上，但人的直觉和分析在选择一种技术而不选择另一种技术时会起核心作用，这种选择通常是基于主观的视觉判断做出的。

2.1.1 人眼的结构

人眼分辨细节的能力与当前电子传感器是可以类比的

眼睛由三层膜包裹：角膜与巩膜外壳、脉络膜和视网膜。

视网膜

视网膜是眼睛最里面的膜，它布满了整个后部的内壁，当眼睛适当聚焦时，来自眼睛外部物体的光在视网膜上成像。感受器通过感受视网膜表面分布的不连续光形成图案。光感受器分为：锥状体和杆状体。
- 锥状体
  
  每只眼睛中的锥状体数量约为600~700万个，主要位于视网膜中成为中间凹的中间部分，对颜色高度敏感。使用锥状体人可以充分分辨图像细节，因为每个锥状体都连接到自身的神经末梢，肌肉通过控制眼球运动使得感兴趣物体图像落到中央凹上。锥状体视觉称为白昼视觉或亮视觉。
- 杆状体
  
  约有7500~15000万个杆状体分布在视网膜表面，由于分布面积较大而且几个杆状体连接到一个神经末梢，故减少了感受器感受细节的数量，用来给出视野内的总体图像。没有色彩感觉，对低照明度敏感。杆状体视觉称为暗视觉或微光视觉。

2.1.2 亮度适应和辨别

人的视觉系统能够适应的光强度级别范围很宽—从暗阈值到强闪光约有1010个量级。实验数据指出，主观亮度(感知亮度，即由人的视觉系统感知的亮度)是进入人眼的光强的对数函数。
马赫带效应表明感知亮度不是强度的简单函数。

2.2 光和电磁波谱

电磁波谱
$\begin{array}{c} \lambda=c / v \\ E=h v \end{array}$
其中， $c$ 是光速 $2.998×10^8m/s$ 、 $h$ 是普朗克常数。

电磁波的能量与频率成正比
可见光波段的跨越范围： $0.43 μ m$ (紫色)~ $0.79 μ m$ (红色)。
彩色谱主要分为6个主要区域：紫色、蓝色、绿色、黄色、橘黄色和红色。
人感受到的物体颜色由物体反射光的性质决定。若一个物体相对平衡地反射所有可见光，观察者看到的物体是白色的。若一个物体在可见光谱的有限范围内反射时，会呈现各种颜色色调。例如，绿色物体反射波长范围为： $500 n m$ ~ $570 n m$ 的光，而吸收其他波长的大部分能量。
没有颜色的光称为单色光或无色光，其唯一属性是强度或大小。
灰度级：表示单色光的强度。
除频率外，还用3个基本量来描述彩色光源的质量：发光强度、光通量和亮度。发光强度是从光源发出的能量总量，通常用瓦特(W)来度量。光通量给出了观察者从光源感受到的能量，通常用流明数(lm)来度量。亮度是光感知的主观描绘子，它实际上不能度量。它是描述彩色感觉的参数之一，具体体现了强度的无色概念。

2.3 图像感知和获取

使用单个传感器获取图像
使用条带传感器获取图像
使用传感器阵列获取图像

2.3.1 简单的图像形成模型

$f (x, y) = i (x, y) r (x, y)$
其中 $0 < i (x, y) < \infty ， 0 （全吸收） < r (x, y) < 1 （全反射）$
$i (x, y)$ ：入射分量。入射到被观察场景的光源照射总量.
$r (x, y)$ ：反射分量。场景中物体所反射的光照总量.
当一幅图像由物理过程产生时，其亮度值正比于物理源(如电磁波)辐射的能量。
令单色图像的任何坐标 $x_{0},y_{0})$ 处的强度表示为 $\ell=f\left(x_{0}, y_{0}\right)$
其中 $\ell$ 的取值范围为 $[L m i n ， L m a x]$
区间 $[L m i n ， L m a x]$ 为灰度级。实际情况下常令该区间为 $[0 ， L - 1]$ ，其中 $\ell = 0$ 为黑色， $\ell = L-1$ 为白色。
灰度级一般为 $2$ 的整数次幂,且 $L = 2^k$

2.4 图像取样和量化

2.4.1 取样和量化

取样(sampling): digitization of continuous spatial coordinates (x, y) –坐标值数字化
量化(quantization): Digitizing the amplitude values –幅度值数字化
数字图像的质量在很大程度上取决于取样和量化中所用的样本数(对应于取样)和灰度级（对应于量化）。

2.4.2 数字图像的表示

灰度级（Gray levels）、动态范围、对比度：
出于储存和量化硬件的考虑，灰度级数 $L$ 通常取为2的整数次幂，即
$L=2^{k} \Rightarrow$ Dynamic range $= [0, L - 1]$
灰度跨越的值域非正式的称为动态范围Dynamic range在这里定义为系统中最大可度量灰度与最小可检测灰度之比，其上限取决于饱和度，下限取决于噪声。与这一概念紧密联系的是图像的对比度，即一幅图像中最高和最低灰度级间的灰度差。
存储数字图像所需的比特数为
$b=M\times{N}\times{k}$
当一幅图像有 $2 k$ 个灰度级时，实际上通常称该图像为一幅“ $k$ 比特图像”。例如，有256个可能的离散灰度值的图像，称为8比特图像。

2.4.3 空间和灰度分辨率

图像分辨率(image resolution)-- 数字图像解析场景元素的能力(capability of digital images to resolve the elements of scene)，即单位距离内可分辨的最大线对数量
空间分辨率（取样）（spatial resolution）: 图像中可辨别的最小细节的度量Smallest discernible detail (or spatial size) in an image。空间分辨率的度量必须针对空间单位来规定才有意义。单位距离的线对数和单位距离的**点数(像素数)（印刷出版业，dpi(dots per inch）**是最通用的度量。
灰度分辨率（量化）（gray-level resolution）：灰度级中可分辨的最小变化Smallest discernible change in gray level。灰度分辨率指的是用于量化灰度的比特数,最通用的数是8比特。例如，通常说一幅被量化为256灰度级的图像有8比特的灰度分辨率.
图像分辨率表示的是能看到图像细节的多少，依赖于MxN和L
保持MxN不变而减少L则会导致伪轮廓
保持L不变而减少MxN则会导致取样棋盘格
空间分辨率和灰度分辨率的变化对图像质量的影响
**等偏爱曲线：**在N-k平面内对应于主观感觉质量相等的曲线
实验结果：当图像中的细节增加时，等偏爱曲线会更加垂直。
结论：
1. 图像质量一般随N和k的增加而增加，在极少数情况下，对固定的N，减少k能改进质量。最有可能的原因是减少k常能增加图像的视觉反差
2. 当N值固定时，这类图像的感觉质量与所用灰度级数(对于图2.23所示的灰度级范围)近似无关。
3. 对具有大量细节的图像，只需很少的灰度级数就可较好的表示
4. $N\times{k}$ 为常数的图像主观看起来可以有较大的差异

2.4.4 图像内插（image interpolation）

内插广泛用于放大、收缩、旋转和几何校正等处理中，本质上，内插是用已知数据来估计未知位置的数值的处理。

最近邻内插：把原图像中最近邻的灰度赋给了每个新位置，最简单，但会造成某些直边缘严重失真。
双线性内插：用4个最近邻点去估计给定位置的灰度，可给出比最近邻内插好得多的结果，但随之而来的是计算量的增加。注意：双线性内插不是一种线性内插方法。
$v (x, y) = a x + b y + c x y + d$
其中， $v (x ， y)$ 为 $（ x ， y ）$ 处赋予的灰度值。系数可由4个最邻近点写出的未知方程确定。
双三次内插：用16个最近邻点，复杂度较高，在保持细节方面比双线性内插相对要好。双三次内插是商业图像编辑软件Adobe photoshop和Corel Photopaint的标准内插方法。
$v(x,y)=\sum_{i=0}^3\sum_{j=0}^3{a_{ij}x^iy^j}$

2.5 像素间的一些基本关系

2.5.1 相邻像素

4邻域：位于 $(x, y)$ 的像素p的4个水平和垂直的相邻像素,其坐标为:
$(x + 1, y), (x - 1, y), (x, y + 1), (x, y - 1)$ 用 $N_4（p）$ 表示。
$D$ 邻域: $p$ 的四个对角相邻像素，坐标为：
$(x + 1, y + 1), (x + 1, y - 1), (x - 1, y + 1), (x - 1, y - 1)$ 用 $N_D(p)$