数字图像处理 · 期末复习思维导图

▼第2章数字图像处理基础

Q1 图像数字化包括哪两个过程？每个过程对数字化图像质量有何影响？▼

采样（空间离散化）→ 决定空间分辨率。采样越细(M×N越大)，图像细节越清晰；采样不足→马赛克/混叠。
量化（灰度离散化）→ 决定灰度/颜色分辨率。量化越细(k越大)，灰度层次越丰富；量化不足→假轮廓。
原则：缓变图像→细量化+粗采样；细节丰富图像→细采样+粗量化。

Q2 数字化图像的数据量与哪些因素有关？▼

① 空间分辨率 M×N（采样点数）
② 量化位数 k（每像素比特数，灰度级Q=2^k）
③ 颜色通道数 c（灰度图c=1，RGB图c=3）
b = M×N×k×c (bit)，B = M×N×k×c/8 (Byte)

Q3 数字化设备由哪几部分组成？主要特征有哪些？▼

五部分：采样孔 → 扫描机构 → 光传感器(CCD/CMOS) → 量化器(A/D) → 输出存储
五特征：像素大小、量化位数、图像大小、线性度、噪声

Q4 常见的图像文件格式有哪些？各有何特点？▼

BMP不压缩，文件头54B固定，数据倒序存放
TIF交换标准，结构复杂，功能强大但读写慢
GIFLZW压缩，支持多帧/动画
JPEGDCT有损压缩，高压缩比，网络常用
PCXRLE压缩，结构简单，存取快
PBM/PGM/PPM结构极简，用作格式转换平台
DICOM医学影像专用格式

Q5 试述BMP图像格式文件中调色板的作用。▼

调色板是颜色查找表(LUT)，仅用于≤8位的灰度和索引图像。每个表项(RGBQUAD)存储RGB值，将像素的索引号映射为实际颜色。
真彩色图像(24位)直接存储RGB值，不需要调色板。调色板通过索引机制在低色彩深度时节省存储空间。

▼第3章图像增强（一）— 直方图与点运算

Q1 图像增强的目的是什么？包含哪些内容？▼

目的：改善图像视觉效果，突出感兴趣信息，抑制无用信息，便于人眼判读或机器识别。
内容：空域增强（点运算、直方图修正、平滑/锐化滤波）和频域增强（低通/高通/同态滤波）。

Q2 对于一幅灰度图像，如何使其反色？▼

g(x,y) = 255 − f(x,y)（8位图像），即用最大灰度值减去每个像素的原始灰度值。

Q3 什么是灰度直方图？有哪些应用？▼

灰度直方图是灰度级分布函数，统计图像中各灰度级出现的频率。
应用：判断量化是否恰当、确定二值化阈值、计算图像信息量(H)、直方图均衡化/规定化、图像匹配。

Q4 从灰度直方图你能获得图像的哪些信息？▼

① 图像的明亮程度（偏左→暗，偏右→亮）
② 图像的对比度（集中窄范围→低对比度，分布宽→高对比度）
③ 灰度分布特征（单峰/双峰/多峰），双峰可用于阈值分割

Q5 在直方图修正技术中采用的变换函数的基本要求是什么？▼

① 在有效灰度范围内单调递增（保持灰度次序不变）
② 变换后灰度值范围不超出允许范围（如0~255）

Q6 直方图均衡化处理采用何种变换函数？▼

采用累积分布函数(CDF)：s = T(r) = (L−1)·∑₀ʳ pᵣ(w)
即灰度级r的变换值等于从0到r的各灰度级概率之和乘以(L−1)，使输出直方图近似均匀分布。

▼第3章图像增强（二）— 图像平滑

Q1 何谓图像平滑？试述均值滤波的基本原理。▼

图像平滑：抑制或消除图像中的噪声，使灰度变化平缓。
均值滤波：用邻域内像素灰度的算术平均值替换中心像素值。能有效抑制噪声但会使边缘模糊。模板系数均为1/n²。

Q2 何谓中值滤波？有何特点？▼

中值滤波：用邻域内像素灰度的中值（排序后取中间值）替换中心像素。
特点：① 对椒盐噪声抑制效果极佳 ② 保护边缘，边缘模糊程度比均值滤波轻 ③ 属于非线性滤波。

Q3 对给定图像做3×3中值滤波处理▼

方法：对每个3×3窗口内的9个灰度值排序，取第5个（中值）作为中心像素新值。边界像素需特殊处理（不处理或补0/镜像）。

Q4 比较邻域平均与中值滤波的差异。▼

均值滤波线性滤波，取平均值，抑制高斯噪声有效，但边缘模糊严重。
中值滤波非线性滤波，取中值，抑制椒盐噪声有效，边缘保护更好。

▼第3章图像增强（三）— 锐化与伪彩色

Q1 图像锐化处理有几种方法？▼

① 梯度法（Roberts、Sobel、Prewitt算子）— 一阶微分检测边缘
② Laplacian算子 — 二阶微分增强细节
③ 高通滤波 — 频域方法，增强高频分量
④ 反锐化掩膜 — 原图减去平滑图得到锐化结果

Q2 Laplace算子为何能增强图像边缘？▼

Laplace算子是二阶微分算子，在灰度突变处（边缘）产生零交叉(zero-crossing)，在边缘两侧产生正负响应。
增强公式：g(x,y) = f(x,y) − ∇²f(x,y)（中心为负的模板）。在边缘处二阶导增强，平坦区几乎为零，从而突出边缘。

Q3 什么是伪彩色增强？常用方法有哪些？▼

伪彩色增强：将灰度图像映射为彩色图像，利用人眼对彩色的分辨能力远高于灰度的特性。
常用方法：① 灰度分层法（密度分割）② 灰度-彩色变换函数法 ③ 频域伪彩色增强。

▼第4章图像几何变换

📌 讲义标注：练习题 P107 — 作业：1,3,7 | 思考题：2,11（教材习题，以下为核心知识点梳理）

核心01 图像几何变换的主要类别与表示方法▼

① 基本变换：平移、旋转、缩放、镜像（水平/垂直）
② 复合变换：多个基本变换的组合，用齐次坐标和3×3变换矩阵级联
③ 齐次坐标表示：[x' y' 1]ᵀ = M · [x y 1]ᵀ，将平移/旋转/缩放统一为矩阵乘法

核心02 插值方法：最近邻 vs 双线性 vs 高阶插值▼

几何变换后目标像素对应的源坐标可能不是整数，需插值估计灰度。
最近邻取最邻近整数坐标像素值，速度快，但产生锯齿。
双线性利用周围2×2=4个像素加权平均，平滑但边缘稍模糊。
三次样条/Sinc利用4×4=16个像素，质量最高，计算量最大。

核心03 向前映射 vs 向后映射▼

向前映射（像素移交）：源→目标逐像素映射，可能产生空洞或重叠。
向后映射（像素填充）：目标→源逐像素反求，每个目标像素都有值，更常用。

▼第5章频域处理

Q1 什么是图像的频域处理？与时域处理有何异同？▼

频域处理：将图像经傅里叶变换(DFT)转到频率域，在频域对频谱进行滤波处理，再IDFT回空间域。
异同：空域处理直接操作像素值（卷积/模板），直观；频域处理可精确控制频率分量（低频=平滑区，高频=边缘/噪声），二者通过卷积定理关联：f(x,y)*h(x,y) ⇔ F(u,v)·H(u,v)

Q2 构建实现图像频域增强的框架。▼

f(x,y) → DFT → F(u,v) → 滤波H(u,v) → G(u,v)=F(u,v)·H(u,v) → IDFT → g(x,y)
步骤：① DFT变换到频域 ② 频谱中心化(shift，低频移到中心) ③ 设计滤波器H(u,v)乘以频谱 ④ 逆中心化 ⑤ IDFT返回空域。

Q3 3种以上频域低通滤波方法及优缺点。▼

① 理想低通(ILPF)：截止频率D₀内全通，外全阻 — 优点：简单；缺点：产生振铃效应
② 巴特沃斯低通(BLPF)：平滑过渡 — 优点：振铃小，阶数n控制过渡陡峭度；缺点：有轻微振铃
③ 高斯低通(GLPF)：无振铃 — 优点：完全无振铃，平滑自然；缺点：截止不够陡峭，过渡带宽

Q4 3种以上频域高通滤波方法及优缺点。▼

① 理想高通(IHPF)：D₀外全通 — 振铃严重
② 巴特沃斯高通(BHPF)：平滑过渡 — 振铃可控，阶数调节
③ 高斯高通(GHPF)：无振铃 — 边缘增强自然
④ 同态滤波：对数变换→频域滤波→指数逆变换，同时压缩动态范围+增强对比度，处理非均匀光照图像效果显著。

▼第6章数学形态学

核心01 膨胀(Dilation)和腐蚀(Erosion)的定义与作用▼

膨胀：A⊕B = {z | (B̂)z ∩ A ≠ ∅} — 扩大目标边界，填充孔洞，连接断裂区域。
腐蚀：A⊖B = {z | (B)z ⊆ A} — 收缩目标边界，消除小噪声点和细连接。
对偶性：(A⊖B)ᶜ = Aᶜ ⊕ B̂

核心02 开运算与闭运算的定义、效果及应用▼

开运算：A∘B = (A⊖B)⊕B — 先腐蚀后膨胀。平滑轮廓，断开狭窄连接，消除细小突出/毛刺。
闭运算：A•B = (A⊕B)⊖B — 先膨胀后腐蚀。填充小孔洞，弥合狭窄断裂，平滑轮廓。
应用：开运算→去噪/分离；闭运算→填孔/连接。开闭级联→形态滤波。

核心03 用r/4圆形结构元素对几何形状做膨胀/腐蚀（画图题要点）▼

膨胀效果：圆→半径变为r+r/4=1.25r；正方形→边长r+2·r/4=1.5r、四角变圆角；等腰三角形→各边外扩r/4，尖角变圆角。
腐蚀效果：圆→半径变为0.75r；正方形→边长r−2·r/4=0.5r；等腰三角形→各边内缩r/4，尖角附近可能退化消失。
关键结论：膨胀=外扩（Minkowski和），腐蚀=内缩（Minkowski差），圆结构元素产生圆角化效应。

▼第7章图像分割（一）— 阈值分割

Q1 什么是区域？什么是图像分割？按途径可分哪几类？▼

区域：图像中具有相似特性的连通像素集合。
图像分割：将图像划分为若干有意义区域，提取感兴趣目标的过程。
分类：① 基于边界（边缘检测、边界跟踪）② 基于区域（阈值法、区域增长、分裂合并）③ 特定理论方法（聚类、图割、活动轮廓等）。

Q2 何谓阈值分割？分割的依据是什么？▼

用阈值T将灰度图像分为目标(1)和背景(0)：g(x,y)=1 if f(x,y)≥T else 0。
依据：直方图双峰特性——目标与背景灰度分布有可分性，取谷底为阈值。

Q3 Ostu方法寻找阈值的依据是什么？▼

最大类间方差法：σB² = ω₁ω₂(μ₁−μ₂)²，遍历0~L−1灰度级，取使σB²最大的灰度级为T。类间方差越大→目标和背景分离性越好。无需先验知识。

Q4 P参数法适合分割何种特征的图像？▼

适用于已知目标面积比例P的场景（如工业检测、文字识别）。从直方图累计频率=P处取阈值，简单快速但需先验知识。

Q5 熵阈值法的依据？Shannon熵的定义？▼

依据：使分割后目标和背景的总信息熵最大（各区域灰度分布最"有序"）。
Shannon熵：H = −∑ p(i)·log₂p(i)，度量灰度分布的不确定性，熵越大越均匀。

Q6 最小误差分割法的出发点？▼

假设目标和背景灰度均服从正态分布，选择阈值使分类误差概率最小。
阈值由两正态分布参数(μ₁,σ₁,P₁)和(μ₂,σ₂,P₂)通过二次方程确定。

Q7 区域增长法要解决哪3个问题？▼

① 种子点选择（初始生长点如何确定）
② 生长准则（判断邻域像素是否加入区域的相似性条件）
③ 终止条件（何时停止生长）

▼第7章图像分割（二）— 现代分割方法

现代01 Mean Shift分割的基本原理▼

非参数概率密度梯度估计方法。像素点沿密度梯度上升方向迭代移动，收敛到局部密度极大值点。结合空域核hs和值域核hr（类似双边滤波）。
步骤：Mean Shift滤波收敛→同收敛点像素为初始区域→合并距离近的类→优化(合并小区域)。

现代02 Graph Cut分割的基本原理▼

交互式分割。构建S-T网络图，用户标记部分前景/背景为硬约束。
最小化能量：E(A)=R(A)+λ·B(A)，R为区域项（属于前/背景代价），B为边界项（邻域差异惩罚）。用最大流/最小割求全局最优。

现代03 Active Contour (Snake)模型基本原理▼

用参数曲线v(s)表示目标边界。能量：E = Eint(内力：光滑性) + Eimage(外力：吸引到边缘)。
通过变分法求解力平衡方程，迭代使曲线收敛到目标边界。
局限：对初始曲线敏感、难入凹部、不能自动分裂合并。改进：GVF外力场扩展捕获范围。

▼第8章图像特征与理解

📌 本章侧重特征提取方法体系，以下为核心考点梳理

核心01 常用图像几何特征有哪些？▼

① 面积：零阶矩 M₀₀ = ∑∑f(x,y)
② 周长：边界链码长度或边界像素数
③ 质心：x̄=M₁₀/M₀₀, ȳ=M₀₁/M₀₀
④ 圆形度：4π·面积/周长²（圆=1，越不规则越接近0）
⑤ 矩形度：面积/外接矩形面积
⑥ 主轴方向：由二阶中心矩μ₁₁确定

核心02 不变矩的定义及意义▼

基于归一化中心矩构造的6个组合量(φ₁~φ₆)，对平移、旋转、尺度变换保持不变。
零阶矩→面积，中心矩→平移不变，归一化→尺度不变，主轴对齐→旋转不变。
应用：目标识别分类（字符识别、飞机型号区分、染色体分析等）。

核心03 纹理分析常用方法▼

① 灰度共生矩阵(GLCM)：最重要！统计(g₁,g₂)灰度对出现概率，提取能量/熵/惯性矩/局部平稳性/最大概率等特征。
② 灰度差分统计：对比度(CON)、角度方向二阶矩(ASM)、熵(ENT)、均值(MEAN)
③ 行程长度统计：同灰度连续像素的长度分布
④ 自相关函数：粗糙度度量，粗纹理→相关函数扩展大

核心04 模板匹配原理及加速方法▼

模板T在搜索图S上逐像素滑动，计算归一化相关系数R(i,j)，Rmax处为匹配目标。R=1表示完美匹配。
缺点：计算量大(O(H·W·M·N))，对变形/旋转敏感。
加速：二次匹配（隔行粗匹配+逐像素精匹配）、积分图加速SSD计算。

核心05 直方图匹配常用距离度量▼

① 直方图相交法：∑min(HQ,HD)/∑HQ
② 欧几里得距离：‖HQ−HD‖₂
③ 闵可夫斯基距离：λ=1为City Block，λ=2为欧氏
④ χ²距离：对镜头切换识别效果好
⑤ 中心矩法：用RGB三分量前3阶矩加权匹配
局限：丢失颜色空间位置信息 → 改进：分块直方图匹配

核心06 SIFT特征提取步骤与特点▼

四步：① DOG尺度空间构建 ② 极值点检测（3D非极大值抑制+剔除低对比度/边缘点）③ 主方向分配（梯度直方图36bin→峰值为主方向）④ 128维描述子（16块×8方向）。
特点：平移/旋转/尺度/光照不变；特征点多、鲁棒。但实时性不足。
SURF改进：用积分图+盒滤波器近似Hessian，大幅加速；64/128维描述子可选。

📖 数字图像处理 · 期末复习思维导图