📖 数字图像处理 · 期末复习思维导图

基于课程讲义整理 | 第2~8章 | 通信工程专业

第2章 数字图像处理基础
Q1 图像数字化包括哪两个过程?每个过程对数字化图像质量有何影响?
采样(空间离散化)→ 决定空间分辨率。采样越细(M×N越大),图像细节越清晰;采样不足→马赛克/混叠。
量化(灰度离散化)→ 决定灰度/颜色分辨率。量化越细(k越大),灰度层次越丰富;量化不足→假轮廓。
原则:缓变图像→细量化+粗采样;细节丰富图像→细采样+粗量化。
Q2 数字化图像的数据量与哪些因素有关?
空间分辨率 M×N(采样点数)
量化位数 k(每像素比特数,灰度级Q=2^k)
颜色通道数 c(灰度图c=1,RGB图c=3)
b = M×N×k×c (bit)B = M×N×k×c/8 (Byte)
Q3 数字化设备由哪几部分组成?主要特征有哪些?
五部分:采样孔 → 扫描机构 → 光传感器(CCD/CMOS) → 量化器(A/D) → 输出存储
五特征:像素大小、量化位数、图像大小、线性度、噪声
Q4 常见的图像文件格式有哪些?各有何特点?
BMP不压缩,文件头54B固定,数据倒序存放
TIF交换标准,结构复杂,功能强大但读写慢
GIFLZW压缩,支持多帧/动画
JPEGDCT有损压缩,高压缩比,网络常用
PCXRLE压缩,结构简单,存取快
PBM/PGM/PPM结构极简,用作格式转换平台
DICOM医学影像专用格式
Q5 试述BMP图像格式文件中调色板的作用。
调色板是颜色查找表(LUT),仅用于≤8位的灰度和索引图像。每个表项(RGBQUAD)存储RGB值,将像素的索引号映射为实际颜色。
真彩色图像(24位)直接存储RGB值,不需要调色板。调色板通过索引机制在低色彩深度时节省存储空间。
第3章 图像增强(一)— 直方图与点运算
Q1 图像增强的目的是什么?包含哪些内容?
目的:改善图像视觉效果,突出感兴趣信息,抑制无用信息,便于人眼判读或机器识别。
内容:空域增强(点运算、直方图修正、平滑/锐化滤波)和频域增强(低通/高通/同态滤波)。
Q2 对于一幅灰度图像,如何使其反色?
g(x,y) = 255 − f(x,y)(8位图像),即用最大灰度值减去每个像素的原始灰度值。
Q3 什么是灰度直方图?有哪些应用?
灰度直方图是灰度级分布函数,统计图像中各灰度级出现的频率。
应用:判断量化是否恰当、确定二值化阈值、计算图像信息量(H)、直方图均衡化/规定化、图像匹配。
Q4 从灰度直方图你能获得图像的哪些信息?
① 图像的明亮程度(偏左→暗,偏右→亮)
② 图像的对比度(集中窄范围→低对比度,分布宽→高对比度)
③ 灰度分布特征(单峰/双峰/多峰),双峰可用于阈值分割
Q5 在直方图修正技术中采用的变换函数的基本要求是什么?
① 在有效灰度范围内单调递增(保持灰度次序不变)
② 变换后灰度值范围不超出允许范围(如0~255)
Q6 直方图均衡化处理采用何种变换函数?
采用累积分布函数(CDF)s = T(r) = (L−1)·∑₀ʳ pᵣ(w)
即灰度级r的变换值等于从0到r的各灰度级概率之和乘以(L−1),使输出直方图近似均匀分布。
第3章 图像增强(二)— 图像平滑
Q1 何谓图像平滑?试述均值滤波的基本原理。
图像平滑:抑制或消除图像中的噪声,使灰度变化平缓。
均值滤波:用邻域内像素灰度的算术平均值替换中心像素值。能有效抑制噪声但会使边缘模糊。模板系数均为1/n²。
Q2 何谓中值滤波?有何特点?
中值滤波:用邻域内像素灰度的中值(排序后取中间值)替换中心像素。
特点:① 对椒盐噪声抑制效果极佳 ② 保护边缘,边缘模糊程度比均值滤波轻 ③ 属于非线性滤波。
Q3 对给定图像做3×3中值滤波处理
方法:对每个3×3窗口内的9个灰度值排序,取第5个(中值)作为中心像素新值。边界像素需特殊处理(不处理或补0/镜像)。
Q4 比较邻域平均与中值滤波的差异。
均值滤波线性滤波,取平均值,抑制高斯噪声有效,但边缘模糊严重。
中值滤波非线性滤波,取中值,抑制椒盐噪声有效,边缘保护更好。
第3章 图像增强(三)— 锐化与伪彩色
Q1 图像锐化处理有几种方法?
梯度法(Roberts、Sobel、Prewitt算子)— 一阶微分检测边缘
Laplacian算子 — 二阶微分增强细节
高通滤波 — 频域方法,增强高频分量
反锐化掩膜 — 原图减去平滑图得到锐化结果
Q2 Laplace算子为何能增强图像边缘?
Laplace算子是二阶微分算子,在灰度突变处(边缘)产生零交叉(zero-crossing),在边缘两侧产生正负响应。
增强公式:g(x,y) = f(x,y) − ∇²f(x,y)(中心为负的模板)。在边缘处二阶导增强,平坦区几乎为零,从而突出边缘。
Q3 什么是伪彩色增强?常用方法有哪些?
伪彩色增强:将灰度图像映射为彩色图像,利用人眼对彩色的分辨能力远高于灰度的特性。
常用方法:① 灰度分层法(密度分割)② 灰度-彩色变换函数法 ③ 频域伪彩色增强。
第4章 图像几何变换
📌 讲义标注:练习题 P107 — 作业:1,3,7 | 思考题:2,11(教材习题,以下为核心知识点梳理)
核心01 图像几何变换的主要类别与表示方法
基本变换:平移、旋转、缩放、镜像(水平/垂直)
复合变换:多个基本变换的组合,用齐次坐标和3×3变换矩阵级联
齐次坐标表示:[x' y' 1]ᵀ = M · [x y 1]ᵀ,将平移/旋转/缩放统一为矩阵乘法
核心02 插值方法:最近邻 vs 双线性 vs 高阶插值
几何变换后目标像素对应的源坐标可能不是整数,需插值估计灰度。
最近邻取最邻近整数坐标像素值,速度快,但产生锯齿。
双线性利用周围2×2=4个像素加权平均,平滑但边缘稍模糊。
三次样条/Sinc利用4×4=16个像素,质量最高,计算量最大。
核心03 向前映射 vs 向后映射
向前映射(像素移交):源→目标逐像素映射,可能产生空洞或重叠。
向后映射(像素填充):目标→源逐像素反求,每个目标像素都有值,更常用
第5章 频域处理
Q1 什么是图像的频域处理?与时域处理有何异同?
频域处理:将图像经傅里叶变换(DFT)转到频率域,在频域对频谱进行滤波处理,再IDFT回空间域。
异同:空域处理直接操作像素值(卷积/模板),直观;频域处理可精确控制频率分量(低频=平滑区,高频=边缘/噪声),二者通过卷积定理关联:f(x,y)*h(x,y) ⇔ F(u,v)·H(u,v)
Q2 构建实现图像频域增强的框架。
f(x,y) → DFT → F(u,v) → 滤波H(u,v) → G(u,v)=F(u,v)·H(u,v) → IDFT → g(x,y)
步骤:① DFT变换到频域 ② 频谱中心化(shift,低频移到中心) ③ 设计滤波器H(u,v)乘以频谱 ④ 逆中心化 ⑤ IDFT返回空域。
Q3 3种以上频域低通滤波方法及优缺点。
理想低通(ILPF):截止频率D₀内全通,外全阻 — 优点:简单;缺点:产生振铃效应
巴特沃斯低通(BLPF):平滑过渡 — 优点:振铃小,阶数n控制过渡陡峭度;缺点:有轻微振铃
高斯低通(GLPF):无振铃 — 优点:完全无振铃,平滑自然;缺点:截止不够陡峭,过渡带宽
Q4 3种以上频域高通滤波方法及优缺点。
理想高通(IHPF):D₀外全通 — 振铃严重
巴特沃斯高通(BHPF):平滑过渡 — 振铃可控,阶数调节
高斯高通(GHPF):无振铃 — 边缘增强自然
同态滤波:对数变换→频域滤波→指数逆变换,同时压缩动态范围+增强对比度,处理非均匀光照图像效果显著。
第6章 数学形态学
核心01 膨胀(Dilation)和腐蚀(Erosion)的定义与作用
膨胀:A⊕B = {z | (B̂)z ∩ A ≠ ∅} — 扩大目标边界,填充孔洞,连接断裂区域。
腐蚀:A⊖B = {z | (B)z ⊆ A} — 收缩目标边界,消除小噪声点和细连接。
对偶性:(A⊖B)ᶜ = Aᶜ ⊕ B̂
核心02 开运算与闭运算的定义、效果及应用
开运算:A∘B = (A⊖B)⊕B — 先腐蚀后膨胀。平滑轮廓,断开狭窄连接,消除细小突出/毛刺。
闭运算:A•B = (A⊕B)⊖B — 先膨胀后腐蚀。填充小孔洞,弥合狭窄断裂,平滑轮廓。
应用:开运算→去噪/分离;闭运算→填孔/连接。开闭级联→形态滤波。
核心03 用r/4圆形结构元素对几何形状做膨胀/腐蚀(画图题要点)
膨胀效果:圆→半径变为r+r/4=1.25r;正方形→边长r+2·r/4=1.5r、四角变圆角;等腰三角形→各边外扩r/4,尖角变圆角。
腐蚀效果:圆→半径变为0.75r;正方形→边长r−2·r/4=0.5r;等腰三角形→各边内缩r/4,尖角附近可能退化消失。
关键结论:膨胀=外扩(Minkowski和),腐蚀=内缩(Minkowski差),圆结构元素产生圆角化效应。
第7章 图像分割(一)— 阈值分割
Q1 什么是区域?什么是图像分割?按途径可分哪几类?
区域:图像中具有相似特性的连通像素集合。
图像分割:将图像划分为若干有意义区域,提取感兴趣目标的过程。
分类:基于边界(边缘检测、边界跟踪)② 基于区域(阈值法、区域增长、分裂合并)③ 特定理论方法(聚类、图割、活动轮廓等)。
Q2 何谓阈值分割?分割的依据是什么?
用阈值T将灰度图像分为目标(1)和背景(0):g(x,y)=1 if f(x,y)≥T else 0
依据:直方图双峰特性——目标与背景灰度分布有可分性,取谷底为阈值。
Q3 Ostu方法寻找阈值的依据是什么?
最大类间方差法:σB² = ω₁ω₂(μ₁−μ₂)²,遍历0~L−1灰度级,取使σB²最大的灰度级为T。类间方差越大→目标和背景分离性越好。无需先验知识。
Q4 P参数法适合分割何种特征的图像?
适用于已知目标面积比例P的场景(如工业检测、文字识别)。从直方图累计频率=P处取阈值,简单快速但需先验知识。
Q5 熵阈值法的依据?Shannon熵的定义?
依据:使分割后目标和背景的总信息熵最大(各区域灰度分布最"有序")。
Shannon熵:H = −∑ p(i)·log₂p(i),度量灰度分布的不确定性,熵越大越均匀。
Q6 最小误差分割法的出发点?
假设目标和背景灰度均服从正态分布,选择阈值使分类误差概率最小
阈值由两正态分布参数(μ₁,σ₁,P₁)和(μ₂,σ₂,P₂)通过二次方程确定。
Q7 区域增长法要解决哪3个问题?
种子点选择(初始生长点如何确定)
生长准则(判断邻域像素是否加入区域的相似性条件)
终止条件(何时停止生长)
第7章 图像分割(二)— 现代分割方法
现代01 Mean Shift分割的基本原理
非参数概率密度梯度估计方法。像素点沿密度梯度上升方向迭代移动,收敛到局部密度极大值点。结合空域核hs和值域核hr(类似双边滤波)。
步骤:Mean Shift滤波收敛→同收敛点像素为初始区域→合并距离近的类→优化(合并小区域)。
现代02 Graph Cut分割的基本原理
交互式分割。构建S-T网络图,用户标记部分前景/背景为硬约束。
最小化能量:E(A)=R(A)+λ·B(A),R为区域项(属于前/背景代价),B为边界项(邻域差异惩罚)。用最大流/最小割求全局最优。
现代03 Active Contour (Snake)模型基本原理
参数曲线v(s)表示目标边界。能量:E = Eint(内力:光滑性) + Eimage(外力:吸引到边缘)
通过变分法求解力平衡方程,迭代使曲线收敛到目标边界。
局限:对初始曲线敏感、难入凹部、不能自动分裂合并。改进:GVF外力场扩展捕获范围。
第8章 图像特征与理解
📌 本章侧重特征提取方法体系,以下为核心考点梳理
核心01 常用图像几何特征有哪些?
面积:零阶矩 M₀₀ = ∑∑f(x,y)
周长:边界链码长度或边界像素数
质心:x̄=M₁₀/M₀₀, ȳ=M₀₁/M₀₀
圆形度:4π·面积/周长²(圆=1,越不规则越接近0)
矩形度:面积/外接矩形面积
主轴方向:由二阶中心矩μ₁₁确定
核心02 不变矩的定义及意义
基于归一化中心矩构造的6个组合量(φ₁~φ₆),对平移、旋转、尺度变换保持不变。
零阶矩→面积,中心矩→平移不变,归一化→尺度不变,主轴对齐→旋转不变。
应用:目标识别分类(字符识别、飞机型号区分、染色体分析等)。
核心03 纹理分析常用方法
灰度共生矩阵(GLCM):最重要!统计(g₁,g₂)灰度对出现概率,提取能量/熵/惯性矩/局部平稳性/最大概率等特征。
灰度差分统计:对比度(CON)、角度方向二阶矩(ASM)、熵(ENT)、均值(MEAN)
行程长度统计:同灰度连续像素的长度分布
自相关函数:粗糙度度量,粗纹理→相关函数扩展大
核心04 模板匹配原理及加速方法
模板T在搜索图S上逐像素滑动,计算归一化相关系数R(i,j),Rmax处为匹配目标。R=1表示完美匹配。
缺点:计算量大(O(H·W·M·N)),对变形/旋转敏感。
加速:二次匹配(隔行粗匹配+逐像素精匹配)、积分图加速SSD计算。
核心05 直方图匹配常用距离度量
直方图相交法:∑min(HQ,HD)/∑HQ
欧几里得距离:‖HQ−HD‖₂
闵可夫斯基距离:λ=1为City Block,λ=2为欧氏
χ²距离:对镜头切换识别效果好
中心矩法:用RGB三分量前3阶矩加权匹配
局限:丢失颜色空间位置信息 → 改进:分块直方图匹配
核心06 SIFT特征提取步骤与特点
四步:① DOG尺度空间构建 ② 极值点检测(3D非极大值抑制+剔除低对比度/边缘点)③ 主方向分配(梯度直方图36bin→峰值为主方向)④ 128维描述子(16块×8方向)。
特点:平移/旋转/尺度/光照不变;特征点多、鲁棒。但实时性不足
SURF改进:用积分图+盒滤波器近似Hessian,大幅加速;64/128维描述子可选。