新闻资讯
看你所看,想你所想

实用MATLAB图像和视频处理

实用MATLAB图像和视频处理

实用MATLAB图像和视频处理

《实用MATLAB图像和视频处理》是2013年出版的图书,作者是Oge Marques。

基本介绍

  • 书名:实用MATLAB图像和视频处理
  • 作者:Oge Marques
  • 译者:章毓晋
  • ISBN:9787302339168
  • 定价:69元
  • 出版时间:2013-12-12
  • 装帧:平装

图书简介

介绍图像和视频处理技术并辅以MATLAB算法实现的书籍。本书是一本楚成王。目前介绍图像处理的书籍很多,也有一些介绍视频处理的书籍,但将两者结合在一本书中的还不太多。视频处理是对图像处理的一种扩展,近年来视频的广泛套用也促进了图像技术的推广。另外,学习图像和视频处理技术除了要理解原理,对算法进行实现也很重要。这一方面可帮助读者进一步理解原理,另一方面也有助于藉助图像和视频处理技术解决实际问题。MATLAB是面向科学和工程计算的软体平台,用其来展示现图像和视频处理技术既方便又实用。
本书是作为一本实用教材来编写的,没有过多地介绍图像和视频处理技术中的数学公式,而是注重方法的概念和算法的效果。全书每章都以“将学习什幺?”开始,介绍本章要分析的主要问题;每章末尾都有“学到了什幺?”,总结归纳该章的要点。大多数章在介绍图像和视频处理技术后,还提供了相应的MATLAB教程,以一步一步引导读者实现相应技术的算法,并且可以看到处理的结果。另外,每章都有“了解更多”,给出深入学习或套用的参考(很多章还提供了相应的网站或网页,可以获得更新的信息)。

图书目录

表 格 列 表
编号
表 题
页码
表3.1
MATLAB数据类别
26
表3.2
MATLAB数组和矩阵算术操作
29
表3.3
MATLAB特殊的矩阵操作示例
29
表3.4
IPT支持的特殊算术函式
30
表3.5
关係操作符
30
表3.6
逻辑操作符
30
表3.7
逻辑函式
30
表3.8
选出来的内置变数和内置常量
31
表4.1
执行图像数据类转换的IPT函式
48
表4.2
执行图像数据类转换的IPT函式
50
表7.1
对所选仿射变换係数的汇总
90
表8.1
线性点变换示例(图8.4中的图像和曲线)
110
表9.1
一个直方图示例
123
表9.2
均衡化的直方图:数值
127
表9.3
期望的直方图
129
表9.4
直接直方图规定化:汇总
130
表9.5
结果直方图
130
表10.1
卷积模板示例
149
表13.1
bwmorph支持的操作
228
表16.1
用于CIE XYZ和CIELAB彩色空间的IPT函式
283
表16.2
用于ICC配置操作的IPT函式
283
表16.3
对应RGB立方体的8个顶点的代表性彩色的R、G和B值
284
表16.4
MATLAB中的彩色映射
289
表17.1
三幅具有不同质量因子的JPEG图像的客观质量测度
315
表17.2
五幅具有不同质量因子的JPEG图像的压缩率
317
表17.3
五幅具有不同质量因子的JPEG图像的客观质量测度
317
表18.1
RST不变矩
325
表18.2
标记区域的性质
325
表18.3
图18.16中三幅图像的统计纹理描述符
333
表18.4
图18.16中三幅图像的统计纹理描述符(基于共生矩阵)
335
表18.5
特徵提取结果表
336
表20.1
模拟彩色电视系统的参数
368
表20.2
代表性的数字视频格式
374
表20.3
ITU-R的BT.601-5建议的参数
375
表20.4
代表性的数字视频格式
目 录
第1部分?图 像 处 理
第1章 引言和概述 3
1.1 动机 3
1.2 基本概念和术语 4
1.3 典型图像处理操作示例 5
1.4 数字图像处理系统的组成 8
1.5 机器视觉系统 9
1.6 资源 10
1.7 练习题 13
第2章 图像处理基础 15
2.1 数字图像表达 15
2.1.1 二值(1比特)图像 16
2.1.2 灰度(8比特)图像 17
2.1.3 彩色图像 17
2.1.4 压缩 18
2.2 图像档案格式 19
2.3 基本术语 20
2.4 图像处理操作概述 21
2.4.1 全局(点)操作 22
2.4.2 面向邻域的操作 22
2.4.3 结合多幅图像的操作 23
2.4.4 变换域操作 23
第3章 MATLAB基础 25
3.1 MATLAB介绍 25
3.2 MATLAB的基本元素 25
3.2.1 工作环境 26
3.2.2 数据种类 26
3.2.3 MATLAB中的数组和矩阵索引 26
3.2.4 标準数组 27
3.2.5 命令行操作 27
3.3 编程工具:脚本和函式 27
3.3.1 M-档案 28
3.3.2 操作符 29
3.3.3 重要变数和常量 30
3.3.4 数字表示 31
3.3.5 流程控制 31
3.3.6 代码最佳化 31
3.3.7 输入和输出 31
3.4 图形和可视化 31
3.5 教程3.1:MATLAB——导览 32
3.6 教程3.2:MATLAB数据结构 34
3.7 教程3.3:MATLAB编程 39
3.8 练习题 43
第4章 图像处理工具箱一览 45
4.1 图像处理工具箱:概述 45
4.2 基本功能和特性 45
4.2.1 显示有关图像档案的信息 46
4.2.2 读一个图像档案 47
4.2.3 数据类和数据转换 48
4.2.4 显示一幅图像的内容 50
4.2.5 发掘一幅图像的内容 51
4.2.6 将结果图像写入一个档案 52
4.3 教程4.1:MATLAB图像处理工具箱——导游 53
4.4 教程4.2:基本图像操作 54
4.5 练习题 58
第5章 图像感测和採集 60
5.1 介绍 60
5.2 光、彩色和电磁频谱 61
5.2.1 光和电磁频谱 61
5.2.2 图像种类 61
5.2.3 光和彩色感知 62
5.2.4 彩色编码和表达 63
5.3 图像採集 64
5.3.1 图像感测器 64
5.3.2 相机光学器件 66
5.4 图像数位化 67
5.4.1 採样 68
5.4.2 量化 69
5.4.3 空间和灰度解析度 69
5.5 练习题 72
第6章 算术和逻辑运算 74
6.1 算术运算:基础和套用 74
6.1.1 加法 74
6.1.2 减法 76
6.1.3 乘法和除法 78
6.1.4 结合若干个算术操作 78
6.2 逻辑运算:基础和套用 79
6.3 教程6.1:算术运算 81
6.4 教程6.2:逻辑运算和感兴趣区域处理 85
6.5 练习题 87
第7章 几何操作 89
7.1 介绍 89
7.2 映射和仿射变换 90
7.3 插值方法 92
7.3.1 对插值的需求 92
7.3.2 简单的插值方法 93
7.3.3 零阶(最近邻)插值 93
7.3.4 一阶(双线性)插值 93
7.3.5 高阶插值 93
7.4 使用MATLAB进行几何操作 94
7.4.1 放大、缩小和调整大小 94
7.4.2 平移 95
7.4.3 旋转 95
7.4.4 裁剪 95
7.4.5 翻转 95
7.5 其他几何操作和套用 95
7.5.1 扭曲 95
7.5.2 非线性图像变换 96
7.5.3 变形 97
7.5.4 接缝焊接 97
7.5.5 图像配準 98
7.6 教程7.1:图像裁剪、大小调整、翻转和旋转 98
7.7 教程7.2:空间变换和图像配準 101
7.8 练习题 106
第8章 灰度变换 108
8.1 介绍 108
8.2 灰度(点)变换综述 109
8.3 点变换示例 111
8.3.1 对比度操纵 111
8.3.2 求反 112
8.3.3 幂律(伽玛)变换 112
8.3.4 对数变换 113
8.3.5 分段线性变换 114
8.4 指定变换函式 115
8.5 教程8.1:灰度变换 117
8.6 练习题 121
第9章 直方图处理 122
9.1 图像直方图:定义和示例 122
9.2 计算图像的直方图 123
9.3 解释图像的直方图 123
9.4 直方图均衡化 125
9.5 直接直方图规定化 129
9.6 其他直方图修改技术 131
9.6.1 直方图滑动 131
9.6.2 直方图伸展 131
9.6.3 直方图收缩 133
9.7 教程9.1:图像直方图 133
9.8 教程9.2:直方图均衡化和规定化 136
9.9 教程9.3:其他直方图修改技术 138
9.10 练习题 142
第10章 邻域处理 145
10.1 介绍 145
10.2 卷积和相关 145
10.2.1 一维域中的卷积 146
10.2.2 二维域中的卷积 147
10.2.3 相关 149
10.2.4 处理图像边界 150
10.3 图像平滑(低通滤波器) 151
10.3.1 均值滤波器 152
10.3.2 变型 153
10.3.3 高斯模糊滤波器 154
10.3.4 中值和其他非线性滤波器 155
10.4 图像锐化(高通滤波器) 156
10.4.1 拉普拉斯运算元 156
10.4.2 複合拉普拉斯运算元模板 157
10.4.3 方向差分滤波器 158
10.4.4 非锐化掩膜 158
10.4.5 高频提升滤波 158
10.5 感兴趣区域处理 158
10.6 结合空间增强方法 159
10.7 教程10.1:卷积和相关 159
10.8 教程10.2:空间平滑滤波器 161
10.9 教程10.3:空间锐化滤波器 163
10.10 练习题 167
第11章 频域滤波 169
11.1 介绍 169
11.2 傅立叶变换:数学基础 170
11.2.1 基本概念 170
11.2.2 2-D离散傅立叶变换:数学公式 171
11.2.3 傅立叶变换性质汇总 172
11.2.4 其他数学变换 174
11.3 低通滤波 174
11.3.1 理想LPF 174
11.3.2 高斯LPF 175
11.3.3 巴特沃斯LPF 177
11.4 高通滤波 179
11.4.1 理想HPF 179
11.4.2 高斯HPF 179
11.4.3 巴特沃斯HPF 180
11.4.4 高频增强 180
11.5 教程11.1:2-D傅立叶变换 180
11.6 教程11.2:频域里的低通滤波器 182
11.7 教程11.3:频域高通滤波器 185
11.8 练习题 190
第12章 图像恢复 191
12.1 对图像退化和恢复问题建模 191
12.2 噪声和噪声模型 192
12.2.1 噪声机率密度函式示例 192
12.2.2 噪声估计 196
12.3 使用空域技术的噪声消除 197
12.3.1 均值滤波器 197
12.3.2 序统计滤波器 199
12.3.3 自适应滤波器 201
12.4 使用频域技术的噪声消除 202
12.4.1 周期性噪声 202
12.4.2 带阻滤波器 202
12.4.3 带通滤波器 203
12.4.4 陷波滤波器 204
12.5 图像去模糊技术 205
12.6 教程12.1:使用空域技术的噪声消除 208
12.7 练习题 214
第13章 形态图像处理 216
13.1 介绍 216
13.2 基本概念和操作 216
13.3 膨胀和腐蚀 219
13.3.1 膨胀 220
13.3.2 腐蚀 221
13.4 複合操作 223
13.4.1 开启 223
13.4.2 闭合 224
13.4.3 击中-击不中变换 225
13.5 形态滤波器 226
13.6 基本形态算法 227
13.6.1 边界提取 229
13.6.2 区域填充 230
13.6.3 连通组元提取和标记 231
13.7 灰度形态学 232
13.7.1 膨胀和腐蚀 232
13.7.2 开启和闭合 233
13.7.3 高帽和低帽变换 233
13.8 教程13.1:二值形态图像处理 234
13.9 教程13.2:基本形态算法 237
13.10 练习题 240
第14章 边缘检测 241
14.1 问题的提出 241
14.2 基本概念 241
14.3 一阶导数边缘检测 243
14.4 二阶导数边缘检测 247
14.5 坎尼边缘检测器 249
14.6 边缘连线和边界检测 250
14.7 教程14.1:边缘检测 253
14.8 练习题 260
第15章 图像分割 261
15.1 介绍 261
15.2 基于强度的分割 262
15.2.1 图像阈值化 262
15.2.2 全局阈值化 263
15.2.3 照明和噪声对阈值化的影响 264
15.2.4 局部阈值化 266
15.3 基于区域的分割 266
15.3.1 区域生长 267
15.3.2 区域分裂合併 269
15.4 分水岭分割 270
15.5 教程15.1:图像阈值化 271
15.6 练习题 276
第16章 彩色图像处理 277
16.1 彩色心理物理学 277
16.1.1 基本概念 277
16.1.2 CIE的XYZ色度图 279
16.1.3 感知均匀彩色空间 282
16.1.4 ICC配置 283
16.2 彩色模型 283
16.2.1 RGB彩色模型 284
16.2.2 CMY和CMYK彩色模型 285
16.2.3 HSV彩色模型 285
16.2.4 YIQ(NTSC)彩色模型 286
16.2.5 YCbCr彩色模型 287
16.3 彩色图像在MATLAB中的表示 287
16.3.1 RGB图像 287
16.3.2 索引图像 288
16.4 伪彩色图像处理 290
16.4.1 强度切割 291
16.4.2 灰度到彩色变换 292
16.4.3 频域伪彩色化 292
16.5 全彩色图像处理 293
16.5.1 彩色变换 294
16.5.2 直方图处理 295
16.5.3 彩色图像平滑和锐化 296
16.5.4 彩色噪声消除 296
16.5.5 基于彩色的图像分割 297
16.5.6 彩色边缘检测 299
16.6 教程16.1:伪彩色图像处理 300
16.7 教程16.2:全彩色图像处理 301
16.8 练习题 304
第17章 图像压缩和编码 306
17.1 介绍 306
17.2 基本概念 306
17.2.1 冗余 307
17.2.2 图像编码和解码模型 308
17.3 无损和有损压缩技术 309
17.3.1 无损压缩技术 309
17.3.2 有损压缩技术 310
17.4 图像压缩标準 311
17.4.1 二值图像压缩标準 311
17.4.2 连续色调静止图像压缩标準 311
17.4.3 JPEG 312
17.4.4 JPEG2000 312
17.4.5 JPEG-LS 313
17.5 图像质量测度 313
17.5.1 主观质量测量 313
17.5.2 客观质量测量 314
17.6 教程17.1:图像压缩 315
第18章 特徵提取和表达 319
18.1 介绍 319
18.2 特徵矢量和矢量空间 319
18.3 二值目标特徵 321
18.3.1 面积 321
18.3.2 重心 321
18.3.3 最小二阶矩的轴 321
18.3.4 投影 322
18.3.5 欧拉数 323
18.3.6 周长 323
18.3.7 细度比例 323
18.3.8 偏心率 324
18.3.9 宽高比 324
18.3.10 矩 324
18.4 边界描述符 326
18.4.1 链码、弗里曼码和形状数 327
18.4.2 边界标誌 329
18.4.3 傅立叶描述符 330
18.5 基于直方图(统计的)特徵 331
18.6 纹理特徵 332
18.7 教程18.1:特徵提取和表达 335
18.8 练习题 338
第19章 视觉模式识别 339
19.1 介绍 339
19.2 基础 339
19.2.1 一个视觉模式分类器的设计和实现 339
19.2.2 模式和模式类 341
19.2.3 数据预处理 342
19.2.4 训练和测试集 342
19.2.5 混淆矩阵 343
19.2.6 系统误差 343
19.2.7 命中率,虚警率,ROC曲线 343
19.2.8 查準率和查全率 344
19.2.9 距离和相似性测度 346
19.3 统计模式分类技术 347
19.3.1 最小距离分类器 348
19.3.2 k-最近邻分类器 349
19.3.3 贝叶斯分类器 349
19.4 教程19.1:模式分类 350
19.5 练习题 355
第2部分?视 频 处 理
第20章 视频基础 359
20.1 基本概念和术语 359
20.2 单色模拟视频 363
20.2.1 模拟视频光栅 363
20.2.2 消隐区间 364
20.2.3 同步信号 364
20.2.4 複合单色模拟视频的频谱内容 365
20.3 视频中的彩色 365
20.4 模拟视频标準 367
20.4.1 NTSC 367
20.4.2 PAL 368
20.4.3 SECAM 368
20.4.4 HDTV 368
20.5 数字视频基础 369
20.5.1 数字视频的优点 369
20.5.2 一个数字视频序列的参数 370
20.5.3 音频分量 370
20.6 模-数转换 371
20.7 彩色表达和色度亚採样 373
20.8 数字视频格式和标準 374
20.8.1 Rec.601数字视频格式 374
20.8.2 常用中间格式 376
20.8.3 源中间格式 376
20.9 视频压缩技术和标準 376
20.10 在MATLAB中的视频处理 378
20.10.1 读取视频档案 378
20.10.2 处理视频档案 378
20.10.3 播放视频档案 379
20.10.4 编写视频档案 379
20.11 教程20.1:MATLAB中的基本数字视频操作 379
20.12 教程20.2:使用YUV视频数据 383
20.13 练习题 387
第21章 视频採样率和标準转换 389
21.1 视频採样 389
21.2 採样率转换 389
21.3 标準转换 390
21.3.1 去隔行 390
21.3.2 PAL和NTSC信号间的转换 391
21.3.3 彩色空间转换 392
21.3.4 宽高比转换 393
21.3.5 3﹕2下拉 393
21.4 教程21.1:行下转换 394
21.5 教程21.2:去隔行 395
21.6 教程21.3:从NTSC到PAL的转换 400
21.7 教程21.4:3﹕2下拉 401
21.8 练习题 402
第22章 数字视频处理技术和套用 403
22.1 运动估计和运动补偿基础 403
22.2 运动估计的一般方法 405
22.2.1 运动表达 406
22.2.2 运动估计準则 406
22.2.3 最佳化方法 407
22.3 运动估计算法 407
22.3.1 穷举搜寻块匹配算法 407
22.3.2 快速算法 409
22.3.3 分层块匹配算法 410
22.3.4 相位关联方法 411
22.4 视频增强和降噪 411
22.4.1 视频降噪 411
22.4.2 帧间滤波技术 412
22.5 案例研究:複杂背景中的目标分割和跟蹤 413
22.6 教程22.1:基于块的运动估计 415
22.7 教程22.2:帧内和帧间滤波技术 419
22.8 练习题 422
附录A 人类视觉感知 423
A.1 介绍 423
A.2 人眼 423
A.3 人类视觉的特性 426
A.3.1 解析度、观察距离和观察角 426
A.3.2 细节和锐度感知 429
A.3.3 光学转移函式和调製转移函式 429
A.3.4 亮度感知 429
A.3.5 对比度和对比敏感度函式 431
A.3.6 运动感知 432
A.3.7 时空解析度和频率回响 433
A.3.8 掩膜 434
A.4 关于人类视觉系统知识的意义和套用 435
附录B 图形用户界面开发 437
B.1 介绍 437
B.2 GUI档案结构 437
B.3 传递系统控制 438
B.4 UserData目标 440
B.5 一个工作的GUI演示 441
B.6 结束语 442
参考文献 443
索引 450

前言

译 者 序
本书是一本介绍图像和视频处理技术并辅以MATLAB算法实现的书籍。目前介绍图像处理的书籍很多,也有一些介绍视频处理的书籍,但将两者结合在一本书中的还不太多。视频处理是对图像处理的一种扩展,近年来视频的广泛套用也促进了图像技术的推广。另外,学习图像和视频处理技术除了要理解原理,对算法进行实现也很重要。这一方面可帮助读者进一步理解原理,另一方面也有助于藉助图像和视频处理技术解决实际问题。MATLAB是面向科学和工程计算的软体平台,用其来展示现图像和视频处理技术既方便又实用。
本书是作为一本实用教材来编写的,没有过多地介绍图像和视频处理技术中的数学公式,而是注重方法的概念和算法的效果。全书每章都以“将学习什幺?”开始,介绍本章要分析的主要问题;每章末尾都有“学到了什幺?”,总结归纳该章的要点。大多数章在介绍图像和视频处理技术后,还提供了相应的MATLAB教程,以一步一步引导读者实现相应技术的算法,并且可以看到处理的结果。另外,每章都有“了解更多”,给出深入学习或套用的参考(很多章还提供了相应的网站或网页,可以获得更新的 信息)。
本书从结构上看,共有22章和两个附录。全书共有编了号的图323个、表格35个、公式284个,练习题114个。另外还有插图列表、表格列表、参考文献目录和索引术语。全书译成中文约合747千字。本书可作为相关专业本科生和其他专业研究生学习图像技术的课程教材,也可供从事相关领域科技开发和套用的技术人员自学参考。
本书的翻译基本忠实于原来的结构和文字风格。根据中文书籍规範,将序言、前言、致谢、插图列表和表格列表均移到目录前。另外,对原书的索引,考虑中文习惯进行了一些调整,并重新按中文次序进行了排列,以方便使用。
本书作者将全书分为了两个单元:图像处理(第1~19章)和视频处理(第20~22章)。据译者从教学角度看,似可分为4个部分:(1)基础概述(包括第1、2、3、4章),(2)图像处理(包括第5、6、7、8、9、10、11、12、16、17章),(3)图像分析(包括第13、14、15、18、19章),(4)视频处理(包括第20、21、22章)。可使用前两部分作为一门40~48学时的入门图像技术课程的教材,而使用后两部分作为一门30~36学时的后续图像技术课程的教材。
感谢清华大学出版社编辑的精心组稿、认真审阅和细心修改。
最后,作者感谢妻子何芸、女儿章荷铭以及父母家人在各方面的理解和支持。
序 言
今年早些时候,在为办公室搬迁而打包时,我震惊地发现我的很多书(很多情况下是出版商免费送给我用于评估和潜在用途的)都是仿製品:书中的材料都是从多年甚至几十年前的教材中综合和重新包装而来的。Oge Marque的这本书不是仿製品,儘管其许多题材已经存在多年了。她包含经过深思熟虑而彙编出来的材料,与当今成像科学、成像技术、图像理解,尤其是图像处理的学生非常相关。
成像是我主要的专业领域。我对这本书很感兴趣,因为成像和图像处理近年来共同发展。一些成像的方式(计算成像是首先想到的流行语)假定将有(事实上必须)对由感测器系统所收集原始信息的后检测处理。确实,如果没有关键的后处理操作,感测器可能给出对观察者很少或根本没有意义的输出。
归根结底,图像处理在商业化的大规模生产系统中是由特殊的硬体实现的。而在一个成像系统的研究和开发阶段,处理几乎都是使用MATLAB来实现的。Marque的这本书通过直接将所描述的许多处理操作与MATLAB相联繫来解决这个问题。
已有大量的文本介绍数字图像处理操作和算法。但是,没有一本书像这本书所做的那样强调人类视觉系统以及它与机器视觉系统之间的相互作用和相互比较。
该书包括丰富的实用材料和一个最新的宝贵参考文献列表,其中有杂誌、期刊和网站。我希望看到该书的再版中还有对应的更新列表。对教师有价值的还有她包含许多现代教材所具有的特徵,简洁的各章摘要回答了“学到了什幺?”的问题。教程圈点文字,引导学生以一个主动学习的过程来了解重要的材料。
我写这个序言不仅是因为我认为这本书很好地考虑了其所预期的图像处理读者,而且因为我看到它影响了我自己学生的思维,这些学生从物理和技术的角度对成像系统感兴趣,但他们必须理解成像系统和图像处理系统之间的联繫。
William T. RHODES是乔治理工学院电气和计算机工程荣誉退休教授。他在2005年加入了佛罗里达大西洋大学电气工程学院并成为学校成像技术中心的副主任。他是美国光学工程学会和国际光学工程协会的会员,斯普林格光学科学系列的主编和线上刊物“SPIE评论”的主编。
前言
在三十多年中,使用计算机来仿真人类视觉系统某些属性的前景一直让科学家、工程师和数学家感兴趣,使得图像处理成为套用计算机科学研究中发展最快的领域之一。在过去的15年中,图像和视频处理的领域经历了巨大的增长并变得更流行和方便。这种增长由若干个因素所驱动:广泛使用和价格相对低廉的硬体;各种图像和视频编辑、操作和处理的软体工具;网路的流行和它对视觉信息的高度重视,这是对使用过时胶片相机摄影的一次真正革命;电影工业的发展,以及人们观看、记录、分享电视节目和视频短片方式的突破性变化。
方法/方式
本书对图像和视频处理中最重要的主题提供了一个实用的介绍,并使用MATLAB(和它的图像处理工具箱)作为工具来展示相关技术和算法。“实用”一词在书名中出现并不是指覆盖了这些领域中最新的消费类电子产品;这方面的知识充其量是肤浅的且将在本书出版后不久(甚至在此之前!)被淘汰。“实用”一词应该被解读为“让读者/学生藉助从书中获得的知识来制定切实可行的项目,即工作原型”。它还有另一个含义,就是採用“刚刚足够的数学”理念,即更关注书中所描述技术的计算、算法和概念内容,而不是过度的数学形式主义。
因此,本书不仅适合其原有的目标客群作为教材使用(如计算机科学、计算机工程、电子工程和相关课程的高年级本科和低年级研究生),而且也适合使用MATLAB,具有坚实的计算和编程技能,且希望自学图像和视频处理基础的研究者和实践者。
本书主要特点
* 是将图像处理、视频处理以及面向MATLAB的对图像和视频算法和技术进行试验相结合的第一本书。
* 对图像和视频处理技术基本主题的全面、最新、技术上準确和实用的覆盖。
* 37个MATLAB教程可用来作为个人使用MATLAB探究图像和视频处理技术的逐步指南,也可用来由使用本书的教师作为课程的实验室作业。
* 为说明和总结文中描述的主要技术和概念,使用了330多幅图片和30个表格。
* 本书採用了“刚刚足够的数学”理念。许多学生害怕面对非常强调技术的数学方面的图像和视频处理书籍。本书通过在不牺牲解释的完整性条件下仅提供能完全理解一个技术所需的最少量的数学来解决这个问题。
* 本书强调并鼓励实际的实验。在介绍了一个主题后,邀请读者自己操作,从而增强和拓展他们刚学习过的东西并在相同主题下探索新的路径。
* 本书被设计来回答第一次接触这个主题的学生/读者可能提出的最基本问题。它基于我讲授图像和视频处理20年的经历/经验以及一路获得的见解/理解。
* 本书包括许多增强对其主题理解的额外特徵(并允许读者更多地学习它们),如练习题和程式设计项目、有用的网站,以及在各章结束处的详尽参考文献列表。
全书一览
本书组织成两个部分:图像处理和视频处理。
第1部分(图像处理)从对领域的介绍和概述开始(第1章),希望激励学生对其余章节的材料贡献时间和精力。第2章介绍与图像表达和图像处理操作相关的基本概念、符号和术语。第3章和第4章分别介绍MATLAB和它的图像处理工具箱,并从此开始构建一系列在其末尾以逐步教程为方式介绍实践活动的章(除第5章)。第5章讨论在图像採集和数位化中涉及的因素。第6章介绍算术和逻辑操作并介绍感兴趣区域(ROI)的处理。第7章介绍几何操作,如大小调整、旋转、剪下和扭曲。第8章~第10章致力于基于点(第8章),基于直方图(第9章)和基于邻域(第10章)的图像增强技术。第11章将图像处理操作扩展到频率域并介绍傅立叶变换和相关的频域图像滤波技术。对图像恢复问题(特别是有噪声和模糊时)的解决在第12章中讨论。第13章详细介绍了数学形态学和它在图像处理中的套用。第14章致力于边缘检测技术。第15章覆盖图像分割。第16章从灰度图像转到彩色图像,介绍有代表性的彩色图像处理技术和算法。图像压缩和编码,包括最现代和相关的标準是第17章的内容。第18章考察特徵提取和表达问题,并自然地引到第19章,所得到的特徵矢量在那里可用于分类和识别目的。
第2部分(视频处理)从介绍与模拟视频和系统以及数字视频格式和标準的主要概念和术语开始(第20章)。它接下来描述在标準之间转换而出现的技术问题(第21章)。第22章讨论运动估计和补偿技术,展示如何可滤波视频序列,并用一个使用MATLAB解决在视频序列中目标检测和跟蹤问题的简单例子来结束。
本书包括两个附录。附录A选择一些在设计图像和视频处理系统中起作用的人类视觉系统特性。附录B提供一个有关在MATLAB中如何开发图形用户界面(GUI)的教程。
教师注意事项
本书可用于一个或两个学期的高年级本科生或研究生入门的图像和视频处理课程。本书中的大多数材料已经在过去20年里很多这样的课程中检验过。下面是对採用本教材教师的建议总汇。
第1部分围绕一个典型的机器视觉系统进行组织,从图像採集到模式识别。第1部分中的所有章(除第16章和第17章)遵循一个自然的顺序,它覆盖了在图像採集、对它们预处理以消除缺陷或改进它们的性质,分割它们为感兴趣的目标,提取目标特徵,以及将目标划分到不同类型中的所有步骤。第1章的目标是提供可以用图像处理算法获得的有广度和远景的初步示例,以及构成一个机器视觉系统的系统性观点。有些教师可能希望将这些信息与第2章的材料结合起来作为在该课程早期介绍的主题。
来自第3章和第4章的材料经过细心选择以使本书自成一体,它们给学生提供了学习MATLAB和图像处理工具箱教程所有可能会需要的信息。读者在其后课程中需要与MATLAB相关的帮助还可以参考这两章。只有有限教学时间的教师可以选择仅仅简短地概述这两章,布置对应的教程,并通过让学生学习教程并回答相关问题来监控其学习进度。
第5章简洁地介绍图像感知和採集的主题。它的主要目标是用把一个三维(3-D)真实世界场景转换为一个二维(2-D)数字版本的信息来装备读者。非常强调图像捕获和採集硬体的课程教师可以用详细的参考文献(如关于在可见光谱外工作的感测器、立体视觉相机、相机校正,以及很多其他主题)补充那里的材料。
第6章~第10章很简单明了地涵盖了任何图像处理课程中的基本主题。它们还为感兴趣的讨论、实验室作业和小的项目提供了很多空间。
第11章对某些学生有点挑战,这源自与傅立叶变换相关的数学推导。教师可以使用那章介绍的MATLAB互动频域演示(fddemo),它是一个培养学生对频域滤波技术基本概念的理解信心的有价值工具。第12章构建在第10章和第11章的知识基础上,它聚焦于噪声消除和去模糊技术。有些教师可以选择淡化对噪声模型(12.1节和12.2节)的讨论,而较早地介绍在12.3节~12.5节中描述的空域和频域滤波技术的套用。
第13章自成一体,它给了教师调整层次(从完全跳过它到详细介绍它)而不会对课程中其他主题产生重要影响的灵活性。
第14章和第15章介绍了任何图像处理课程中的两个基本主题。希望在课程里较早介绍其中部分内容或以不同顺序介绍的教师应该可以方便地提取相关的节并将它们移动到不同的时间点。
第16章包含彩色图像处理的信息,且以某种形式与先前的章(特别地与那些有关增强、分割和边缘提取的章)相联繫。保持彩色于一个分离的章中而不是将彩色图像处理分布在文本的各处是一个有意识的决定。相信当读者接触到第16章时,他们将能很容易地浏览其中的内容并将注意力放在他们早期从灰度图像中学到的东西与在彩色图像中对应东西的区别上。不同意这个观点的教师可以很容易地将第16章的相应节移提前介绍。
第17章考虑图像压缩和编码,它们是非常广泛和技术上複杂的主题,有些书籍整本都介绍它们。因为本书关注的是使用MATLAB来构建实用的图像处理和机器视觉解决方案,所以将从一个较宽的角度(当今使用的标準、压缩技术的分类和它们的主要特性,等等)来考虑而不试图对这些主题进行深入讨论,因为那样有可能分散注意力而没有多少意义。从务实的角度来看,因为读者的目标是使用MATLAB来处理图像和利用它从很多格式(大多数使用某种形式的压缩)读取和写入图像的能力,所以本书关注的是如何以有意义的方式使用这些能力。教师可以根据其目标用不同的方式进行,从用更多的参考文献扩展第17章(如果图像编码和压缩是课程教学大纲的重要部分)到将整章跳过(如果课程的主要目标是对一个实际问题构建机器视觉方案,其中可能不需要这种类型的知识)。
第18章和第19章紧密联繫。它们提供了设计和实现图像处理和机器视觉方案时最关键阶段中两个方面的信息:特徵提取和模式分类。依赖于图像的种类和所设计方案的特殊需求,第18章给出了特徵提取和表达技术的广泛选择。教师可能会对第19章为所有学生所提供的从相关模式识别、数据挖掘和信息检索领域需要的基本概念感到满意而不需要另外的参考文献。如果课程不对任何这些领域有先修的要求,这点就尤为重要。在第19章结尾的教程是根据对第18章和第19章所介绍算法的选择、设计和微调来构建的。希望在学习到本书的这个位置时,学生不仅流畅掌握了MATLAB和图像处理而且获得了回过头来批判地反思什幺可以工作,什幺不能工作,以及为什幺的能力。
第2部分组织成3章,可以用在一个或两个学期(结合图像和视频处理)课程的后段或在专门涉及视频处理课程的前端。在后一种情况下,教师可以用附加的文献(如对研究生层次课程,视频处理的学术文章和相关主题)对第2部分的材料进行补充。
第20章涵盖了广泛的主题,从基本的模拟视频概念到数字视频标準和编解码器。它提供了在多个方向扩展的空间,从更深入地学习电视广播系统到更详细的分析现代视频压缩框架和标準。第21章涵盖了标準转换的主题,并讨论实现它们的最流行技术。第22章将讨论扩展到包括运动估计和补偿,以及(帧内和帧间)视频滤波技术。它以一个用MATLAB实现的实用项目结尾,该项目是由我从前的一位学生完成的:在一个用固定的相机获得且具有複杂运动背景的视频序列中进行目标检测和跟蹤的系统。将这个案例研究包括在内的目的是总结第2部分(和全书)的讨论,提醒读者在此时他们将应该具有足够的知识以完成类似的项目(教师可在课程结束项目中布置)。
在附录A中的材料与图像和视频处理系统非常相关,因为它解释了人类视觉系统特性与其在构建相似系统的设计决策中影响的联繫。教师也可考虑将它(或部分)在课程的更早阶段介绍。
附录B是一个对开发MATLAB套用GUI的实用指导。它应该能让学生在它们的MATLAB项目中开发视觉上吸引人、具有互动性和功能性的界面。
还有一个对MATLAB和章末教程的注解。使用MATLAB(和它的特性处理工具箱)十多年后,我完全同意Rudra Pratap [Pra02]所写的话,“MATLAB的易用性是它的主要特徵”。MATLAB有一个平缓的学习曲线,允许用户加入到一个互动学习的方式中,在一定程度上提升用户正确应对挑战的技能,并逐步提高。本书中所包含的MATLAB教程也是在这个理念下构思的。
网站
本书配套包含很多为学生和教师準备的补充材料:书中所有MATLAB教程的代码,所选图片的MATLAB代码,测试图像和视频序列,补充问题,教程和项目(不能製成印刷版),以及一个不断增长和经常维护的网站名单,包括图像处理会议、软体、硬体、研究团体、测试图像库以及更多内容(的连结)。
我深深地感谢许多为此项目(直接或间接)合作过的人。这本书没有他们的帮助是不可能完成的。
我希望感谢许多在图像和视频处理以及相关领域给我以指导的教授、导师和同事,特别是Maria G. Te Vaarwerk、Wim Hoeks、Bart de Greef、Eric Persoon、John Bernsen、Borko Furht和Bob Cooper。
特别感谢我的朋友和同事Hugo Vieira Neto,他在该项目中从早期规划阶段到完成都给予了极大的支持。
我深深感谢Gustavo Benvenutti Borba在创建这本书中大部分图片中的出色工作,他有见地的评论和意见、持续的鼓励,以及很多小时的时间投入是不能用仅若干行的感谢所回报的。
还要感谢Liam M. Mayron在这个项目所有步骤中的鼓励、支持和专业帮助。
这本书没有Jeremy Jacob的宝贵贡献将不能出版,他编写、修订并记录了书和教程中相关的MATLAB代码,并贡献了附录B中的内容。

相关推荐

声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:yongganaa@126.com