23887《数字图像处理(第3版)》习题解答(上传)(1) 下载本文

第 2 章 图像处理基本知识 ·················································································4

胡学龙编著

《数字图像处理(第 3 版)》 思考题与习题参考答案

目 录

第 1 章 概述 ···································································································1

第 3 章 图像的数字化与显示 ··············································································7

第 4 章 图像变换与二维数字滤波 ······································································10

第 5 章 图像编码与压缩 ··················································································16

第 6 章 图像增强 ···························································································20

第 7 章 图像复原 ···························································································25

第 8 章 图像分割 ···························································································27

第 9 章 数学形态学及其应用 ············································································31

第 10 章 彩色图像处理 ···················································································32

第1章 概述

1.1 连续图像和数字图像如何相互转换?

答:数字图像将图像看成是许多大小相同、形状一致的像素组成。这样,数字图像可以 用二维矩阵表示。将自然界的图像通过光学系统成像并由电子器件或系统转化为模拟图像 (连续图像)信号,再由模拟/数字转化器(ADC)得到原始的数字图像信号。图像的数字 化包括离散和量化两个主要步骤。在空间将连续坐标过程称为离散化,而进一步将图像的幅 度值(可能是灰度或色彩)整数化的过程称为量化。

1.2 采用数字图像处理有何优点?

答:数字图像处理与光学等模拟方式相比具有以下鲜明的特点:

1.具有数字信号处理技术共有的特点。(1)处理精度高。(2)重现性能好。(3)灵活性 高。

2.数字图像处理后的图像是供人观察和评价的,也可能作为机器视觉的预处理结果。 3.数字图像处理技术适用面宽。 4.数字图像处理技术综合性强。

1.3 数字图像处理主要包括哪些研究内容?

答:图像处理的任务是将客观世界的景象进行获取并转化为数字图像、进行增强、变换、 编码、恢复、重建、编码和压缩、分割等处理,它将一幅图像转化为另一幅具有新的意义的 图像。

1.4 说出图像、视频(video)、图形(drawing)及动画(animation)等视觉信息之间 的联系和区别。

答:图像是用成像技术形成的静态画面;视频用摄像技术获取动态连续画面,每一帧可 以看成是静态的图像。图形是人工或计算机生成的图案,而动画则是通过把人物的表情、动 作、变化等分解后画成许多动作瞬间的画幅,再用摄影机连续拍摄成一系列画面,给视觉造 成连续变化的图画。视频和动画都利用了视觉暂留原理。

1.5 如何在你的显示器上观测图像的像素?1 台笔记本的屏幕分辨率为 1366×768,长宽 比例是 4:3、16:9 还是 16:10?屏幕分辨率(以像素每英寸(DPI)为单位)是多少?选择一 个高分辨率图像、一个低分辨率图像,比较分别观察到像素时图像的放大倍数的差异。

答:可先拷屏,按照图 1.2 放大局部图像的方法观测图像。屏幕分辨率为 1366×768,表 示宽高比为 1.7786:1,而 4:3 = 1.3333:1,16:9 = 1.7778:1,16:10 = 1.6:1。可见,此屏幕的宽高 比最接近 16:9。

1.6 如何在你的计算机上查看图像文件的各种属性?

答:在 Windows 操作系统下,鼠标指针指向文件名,可看到图像文件的“项目类型”、 标 记”、“分级”、“尺寸”、“大小”和“标题”属性(图 1.6a)。右击图像文件名,单击弹出菜单 的“属性”命令,可以看到“常规”和“详细信息”两个标签,其中“常规”标签指出文件

名、存放“位置”、“时间”、文件“属性”等信息。“详细信息”指出“说明”、“来源”、“图 像”、“照相机”、“高级照片”、“文件”等信息。

1

(a)鼠标指针指向文件名

(b)常规

题 1.6 图 图像属性

(c)详细信息

1.7 讨论在你的智能手机中哪些功能应用了图像处理技术。

答:根据手机功能和智能程度的不同,有彩信、视频、相机、游戏、二维码扫描、名片

识别等。

1.8 设图 1.17 的文件名为“microscopic.jp2”或“microscopic.jpg”,尺寸为 4140×3096。 针对本图像,讨论可以进行哪些图像处理和图像分析操作?

答:处理方面:(1)对图像进行二维变换,观察图像的频谱;(2)图像增强:由于光照 不均匀,可以通过增强手段,图像暗处得到照度补偿; 3( )图像编码:可以用 DCT 编码的 JPEG 格式存放 JPEG 图像,也可用 DWT 编码存放 JPEG2000 图像;(4)图像分割:将感兴趣的目 标从背景中分割出来,以便做进一步分析处理。

图像分析:(1)对观测对象进行形状分析;(2)对不同大小的颗粒做分布分析。

1.9 讨论数字图像处理的主要应用。进一步查找资料,写一篇关于你感兴趣的应用方面 的短文。

答:图像处理的应用几乎渗透科学研究、工程技术和人类社会生活的各个领域。教师可 以分组对学生布置以下 6 个方面的课题,通过阅读参考文献、网络资源等手段写数字图像处

2

理的主要应用的短文,并安排交流机会。

1.航天和航空技术方面的应用 2.生物医学工程方面的应用 3.通信工程方面的应用

4.工业自动化和机器人视觉方面的应用 5.军事和公安方面的应用 6.生活和娱乐方面的应用

3

第 2 章 图像处理基本知识

2.1 如何表示图像中一点的彩色值?颜色模型起什么作用?

答:图像中一点的彩色值颜色三维空间中的一个点来表示,每个点有三个分量,不同的 颜色空间各分量的含义不同。

颜色模型规定了颜色的建立、描述和观察方式。颜色模型都是建立在三维空间中的,所 以与颜色空间密不可分。

2.2 色调、色饱和度和亮度的定义是什么?在表征图像中一点的颜色时,各起什么作用? 答:HSV 模型由色度(H),饱和度(S),亮度(V)三个分量组成的,与人的视觉特 性比较接近。HSV 颜色模型用 Munsell 三维空间坐标系统表示。

色调(H)表示颜色的种类,用角度来标定,用-1800~1800 或 00~3600 度量。 色饱和度(S)表示颜色的深浅,在径向方向上的用离开中心线的距离表示。用百分比 来度量,从 0%到完全饱和的 100%。

亮度(V)表示颜色的明亮程度,用垂直轴表示。也通常用百分比度量,从 0%(黑) 到 100%(白)。

2.3 按照波段的成像图像讨论图像的分类。

答:人们常见的是可见光成像,但在科学研究等领域,其他一些不同波段的电磁波成像 技术会起到可见光成像无法替代的作用。下面是电磁波谱分布情况:

1、 不可见光线:伽马射线、X 射线、紫外线; 2、 可见光线:紫、蓝、青、绿、黄、橙、红;

3、不可见光线:近红外线、中间红外线、远红外线、微波、工业电波。

按波长从短到长有:(1)伽马射线图像:伽马射线是由原子核受激产生的波长极短、能 量极高的射线。天文学上利用伽马射线获取伽马射线暴图像。 2)( X 射线图像:X 射线是由原 子受激产生的,具有很强的穿透能力,其图像在医疗、探伤、物质结构分析等方面具有重要 作用。(3)紫外线(UV)图像:红外线波长短于可见光。230-400 nm 的 UV 传感器可用于天 文学、火灾检测、细胞的医学成像等。(4)红外线图像:红外线波长长于可见光。红外遥感 器接收地物反射或自身发射的红外线而形成的图像,可以解决在夜间观察目标光强不足及对 比度差的困难。由于高于绝对零度的物体都会发出红外线,所以红外图像可以描述某个区域 的温度分布,这在遥感技术中广泛使用,在医学成像和火灾监测等方面也有实际应用。(5) 无线电波图像:波长范围很宽,从 mm 到 km。常用射频成像法。由高频发射机发射的高频电 磁波在传播过程中遇到具有不同电学性质的物体时,电磁波的传播规律将大大改变。根据无线 电波测量的结果可以绘出物体内的结构图像,

如毫米波人体安检成像技术。另一个获得重要应用的是 SAR(合成孔径雷达)成像技术。SAR 传感器波长通常在厘米级。SAR 图像则只记录了一个波段的回波信息,以二进制复数形式记 录下来。振幅信息通常对应于地面目标对雷达波的后向散射强度,与目标介质、含水量以及

粗糙程度密切相关,而相位信息则对应于传感器平台与地面目标的往返传播距离。

2.4 设有大小为 32×32 的图标,图标的每个像素有 8 种颜色,共有多少种不同的图标? 如果每 100 万个可能的图标中有一个有意义,识别一个有意义的图标需要 0.1 s,则选出所有 有意义的图标需要多长时间? 解:图标数为

832×32 = 10925 种

4

有意义的图标数 10925/106 = 10919 种 选择有意义图标的时间 10919×0.1 = 10918 s

可见随机图像的复杂度是非常高的。

2.5 讨论数字图像处理系 统的组成。列举你熟悉的图像处 理系统并分析它们的组成和功能。

答:如教材图 2.6,数字图像 处理系统是应用计算机或专用数 字设备对图像信息进行处理的信 息系统。图像处理系统包括图像 处理硬件和图像处理软件。图像 处理硬件主要由图像输入设备、 图像运算处理设备(微计算机)、 图像存储器、图像输出设备等组 成。软件系统包括操作系统、控 制软件及应用软件等。

教材图 2.6 数字图像处理系统结构图

2.6 常见的数字图像处理开发工具有哪些?各有什么特点?

答.目前图像处理系统开发的主流工具为 Visual C++(面向对象可视化集成工具)和 MATLAB 的图像处理工具箱(Image Processing Tool box)。两种开发工具各有所长且有相互 间的软件接口。

Microsoft 公司的 VC++是一种具有高度综合性能的面向对象可视化集成工具,用它开发 出来的 Win 32 程序有着运行速度快、可移植能力强等优点。VC++所提供的 Microsoft 基础 类库 MFC 对大部分与用户设计有关的 Win 32 应用程序接口 API 进行了封装,提高了代码 的可重用性,大大缩短了应用程序开发周期,降低了开发成本。由于图像格式多且复杂,为 了减轻程序员将主要精力放在特定问题的图像处理算法上,VC++ 6.0 提供的动态链接库 ImageLoad.dll 支持 BMP、JPG、TIF 等常用 6 种格式的读写功能。

MATLAB 的图像处理工具箱 MATLAB 是由 MathWorks 公司推出的用于数值计算的有 力工具,是一种第四代计算机语言,它具有相当强大的矩阵运算和操作功能,力求使人们摆 脱繁杂的程序代码。MATLAB 图像处理工具箱提供了丰富的图像处理函数,灵活运用这些 函数可以完成大部分图像处理工作,从而大大节省编写低层算法代码的时间,避免程序设计 中的重复劳动。MATLAB 图像处理工具箱涵盖了在工程实践中经常遇到的图像处理手段和 算法,如图形句柄、图像的表示、图像变换、二维滤波器、图像增强、四叉树分解域边缘检 测、二值图像处理、小波分析、分形几何、图形用户界面等。但是,MATLAB 也存在不足 之处限制了其在图像处理软件中实际应用。首先,强大的功能只能在安装有 MATLAB 系统 的机器上使用图像处理工具箱中的函数或自编的 m 文件来实现。其次,MATLAB 使用行解 释方式执行代码,执行速度很慢。第三,MATLAB 擅长矩阵运算,但对于循环处理和图形 界面的处理不及 C++等语言。为此,通应用程序接口 API 和编译器与其他高级语言(如 C、 C++、Java 等)混合编程将会发挥各种程序设计语言之长协同完成图像处理任务。API 支持 MATLAB 与外部数据与程序的交互。编译器产生独立于 MATLAB 环境的程序,从而使其他 语言的应用程序使用 MATLAB。

2.7 常见的数字图像应用软件有哪些?各有什么特点?

5

答:图像应用软件是可直接供用户使用的商品化软件。用户从使用功能出发,只要了解 软件的操作方法就可以完成图像处理的任务。对大部分用户来说,商品化的图像应用软件无 需用户进行编程,操作方便,功能齐全,已经能满足一般需求,因而得到广泛应用。常用图 像处理应用软件有以下几种:

1.PHOTOSHOP:当今世界上一流的图像设计与制作工具,其优越性能令其产品望尘 莫及。PHOTOSHOP 已成为出版界中图像处理的专业标准。高版本的 PHOTOSHOP 支持多 达 20 多种图像格式和 TWAIN 接口,接受一般扫描仪、数码相机等图像输入设备采集的图 像。PHOTOSHOP 支持多图层的工作方式,只是 PHOTOSHOP 的最大特色。使用图层功能 可以很方便地编辑和修改图像,使平面设计充满创意。利用 PHOTOSHOP 还可以方便地对 图像进行各种平面处理、绘制简单的几何图形、对文字进行艺术加工、进行图像格式和颜色 模式的转换、改变图像的尺寸和分辨率、制作网页图像等。

2.CorelDRAW:一种基于矢量绘图、功能强大的图形图像制作与设计软件。位图式图像 是由象素组成的,与其相对,矢量式图像以几何、色彩参数描述图像,其内容以线条和色块 为主。可见,采用不同的技术手段可以满足用户的设计要求。位图式图像善于表现连续、丰 富色调的自然景物,数据量较大;而矢量式图像强于表现线条、色块的图案,数据量较小。 合理的利用两种不同类型的图像表现方式,往往会收到意想不到的艺术效果。CorelDraw 是 当今流行的图像处理软件中为数不多的特点明显、功能强大的基于矢量绘图的软件包。利用 它,可以方便地制作精美的名片、贺卡、书签、图书封面、广告、宣传画等作品。

3.ACDSee:快速、高性能的看图程序,是目前最享盛名的图片浏览器。它能广泛应 用于图片的获取、管理、浏览和优化,支持 BMP、GIF、JPG、TGA、TIF 等超过 50 种常见 的图形文件格式,图片打开速度极快,可以直接查看动画 GIF,处理如 Mpeg 之类常用的视 频文件,还可以为每一个目录建立一个相册。ACDSee 可以从数码相机和扫描仪高效获取图 片,并进行便捷的查找、组织和预览。ACDSee 还是得心应手的图片编辑工具,轻松处理数 码影像,拥有去红眼、剪切图像、锐化、浮雕特效、曝光调整、旋转、镜像等功能,还能进 行批量处理。

2.8 调用函数 Cfg = cov(f, g)计算出图像 f 和图像 g 的协方差矩阵是一个 2×2 的矩阵。说 明该矩阵各个元素的含义,数值大小对图像特性的影响。

答:设 f (x,y)和 g(x,y)是大小为 M×N 的两幅图像,则两幅图像之间的协方差矩阵为 Cfg:

1 C fg???MN M??1 N??1

??[ f (x, y)?? f )][g(x, y)?? g ]

x?0 y?0

协方差矩阵 Cfg 是两幅图像之间的相关程度的一种度量。协方差矩阵为零时表明两图像之间相 互独立,反之表示两幅图像之间相互依赖。Cfg 越大,相关程度越强。Cfg 是 2×2 矩阵:

??? 2 f cov( f , g )??C fg???????????????????????????

?cov( g , f )????????????? ????????????????????????

式中,?? 2f 和?? g2 分别是图像 f 和 g 的方差,cov(f,g)和 cov(g,f) 是图像 f 和 g 的协方差。 6

第 3 章 图像的数字化与显示

3.1 光圈越大,摄取的画面是否越亮?光圈的数字越小是否代表光圈越小?2.8 的光圈与 5.6 的光圈,哪个画面更亮?光圈越小,画面是否越有立体感?

答:光圈越大,光学镜头进光量越大,摄取的画面也越亮。光圈系数(F)反映镜头的通 光量,以焦距 f 和通光孔径 D 表示。通光量与 F 值的平方成反比。所以光圈的数字越小代表 光圈越大。2.8 的光圈比 5.6 的光圈更亮。景深(depth of field)是对某景物调焦,以形成前后 清晰区域。景深与三个因素有关:光圈、焦距和物距。光圈越小,景深越深。

3.2 换一幅图像,重新演算图 3.6 中实际图像量化的运行结果。 解:以将灰度为 256 降低为 8(图 d)为例编程并运行程序。 level1 = 256; level2 = 8;

ratio = level1/level2; I1 = imread('cameraman.tif'); subplot(121);imshow(I1); S = size(I1); for m = 1: S(1)

for n = 1: S(2)

I2(m,n) = uint8(round(double(I1(m,n))/ratio)); I2(m,n) = uint8(ratio*double(I2(m,n))); end end

subplot(122);imshow(I2); imwrite(I2,'cameraman_d.tif') 程序运行结果如下:

教材图 3.6 不同量化级别对图像质量的影响

(a)原始图像(灰度级为 256)

(d)灰度级为 8

3.3 如何合理选取采样率和量化等级数?

答:一般,当限定数字图像的大小时,为了得到质量较好的图像,可采用如下原则: (1)对缓变的图像,应该细量化,粗采样,以避免出现假轮廓。

(2)对细节丰富的图像,应细采样,粗量化,以避免模糊。

7

3.4 讨论基于二维采样定理,根据图像采集设备的分辨率计算最大像素数。

答:采集设备的分辨率反映了其采集图像时的细节效果。高分辨率才采集是保证图像高 分辨率的基础。应该根据二维采样定理选择合适分辨率的采集设备,这样既能保证所需的图 像质量,又能做到物尽其用。

Nyquist 定理表明,为了正确判定信号频率,信号在一个周期内至少被采样两次。二维采 样定理应用在实际图像的采集中,意味着如果要达到一个采集设备(如数码相机或扫描仪) 最小的空间分辨率,至少需要采两个点。

3.5 验证图 3.8 一维向量量化的误差 d(X, Ci)的正确性。 解: d(X, C0) = [ (4-3)2+(2-1)2+(3-2)2+(1-3)2]/4= [1+1+1+4]/4= 7/4

d(X, C1) = (4-1)2+(2-3)2+(3-1)2+(1-4)2 = [9+1+4+9]/4 = 23/4 d(X, C2) = (4-4)2+(2-3)2+(3-4)2+(1-1)2 = [0+1+1+0]/4 = 2/4 d(X, C3) = (4-2)2+(2-1)2+(3-2)2+(1-3)2 = [4+1+1+4]/4 = 10/4

3.6 计算图 3.9 图像 X 与图 3.10 码书 C 码字的误差,验证选择码字 Y1 作为 X 的二维向 量量化编码的合理性。

解:原始图像块 X 是一个 4 灰度级的 16 维向量[1 0 0 0 1 1 0 0 2 2 1 0 3 2 1 1],如教材图 3.9 所示。码书:

Y0 = [0 2 0 0 1 2 1 1 0 3 2 0 0 3 2 1] Y2 = [1 1 2 2 2 2 1 2 3 3 1 0 1 1 0 0]

Y1 = [1 1 0 0 1 1 1 0 2 2 1 0 3 3 1 1] Y3 = [0 2 3 3 0 1 3 2 1 1 3 1 1 1 1 0]

均方误差为:d(X, Y0) = 25/16;d(X, Y1) = 3/16;d(X, Y2) = 25/16;d(X, Y3) = 47/16。

X

教材图 3.9 原始图像和灰度级

Y0

Y1

Y2

Y3

教材图 3.10 码书 C={ Y0, Y1, Y2, Y3}

如图 3.10 所示。经均方误差准则计算可以发现码字 Y1 离 X 最近,故用索引 01 进行编码。

3.7 根据“电视行(TV line)”或扫描线的概念,摄像机的清晰度常用扫描线的线数表 示。如果画面是 4:3 的,540 线的像素分辨率多少?720p 是 720 线(p 代表逐行扫描,i 是隔 行扫描),帧型为 16:9,像素分辨率为 1280×720。

解:如果画面是 4:3 的,540 线的像素分辨率是[540×4/3]×540 = 720×540

3.8 摄像机和数码相机分辨率受到哪些因素限制?是否越高越好?如何进一步提高分辨 率?

答:分辨率往往是用户最关心的指标,但其上限受到像素极限尺寸、CCD 制造工艺、设 备性价比等因素限制,并不能无限提高。人们正在研究采用信号处理的超分辨率技术力求解 决这些问题。

3.9 扫描仪的光学分辨率是 600×1200 线,一个具有 5000 个感光单元的 CCD 器件,用 于 A4 幅面扫描仪,A4 幅面的纸张宽度是 21 cm,该扫描仪的光学分辨率是多少 dpi? 解:(1)600×1200 线,其中前一个数字代表扫描仪的横向分辨率,后一数字则代表纵 向分辨率。

8

(2)dpi 是指单位面积内像素的多少,也就是扫描精度 ,目前国际上都是计算一英寸 面积内像素的多少。光学分辨率是扫描仪的光学部件在每平方英寸面积内所能捕捉到的实际 的光点数,是指扫描仪 CCD 的物理分辨率,也是扫描仪的真实分辨率,它的数值是由 CCD 的像素点除以扫描仪水平最大可扫尺寸得到的数值。

每一个感光单元对应一个像素。由于 CCD 感光单元个数为 5000,21 cm = 8.3 英寸,所 以该扫描仪的光学分辨率是 5000/8.3 = 602 dpi,规格化为 600 dpi。

9

第 4 章 图像变换与二维数字滤波

4.1 二维傅里叶变换的分离性有什么实际意义?

解:该性质表明,一个二维傅里叶变换可由连续两次一维傅里叶变换(先行变换后列变

换或反之)来实现。实现的方法如下图所示:

教材图 3.3 用两次一维 DFT 计算二维 DFT

4.2 图像处理中正交变换的目的是什么?图像变换主要用于哪些方面?

解:正交变换可以使得图像能量主要集中分布在低频率成分上,边缘和线信息反映在高 频率成分上。因此正交变换广泛应用在图像增强、图像恢复、特征提取、图像编码压缩和形 状分析等方面。

?1 1 0

?0????????????????????????????????????????????????? 2 2

0 ???1 1 0 ?0 0 ??? ,按 x 方向进行 FFT,得到列变换 F (u, y)=??1?? j 1?? j 4.3 已知 f ( x ,y ) =

0 0??????????????????????????????????????????????????? 0 0 ?0 0 0

??????????????????????????????????????????????????????

?1?? j 1?? j 0 ?0 0 0 0??

??

为什么 f(x,y)的前 2 行数值一样,但 F(u,y)的前 2 行却不一样?

4.4 证明:f (x, y)的直流成分为 F (0,0)???

M??1 N??1

1 N??1 N??1

?? ? f ( x, y) ,并说明其物理意义。 N 2 x?0 y?0

1 证明:根据 F (u, v)???MN 1 得 F (0,0)???MN

????x 0?y 0 f (x, y)e? j2π(ux / M??vy / N ) ,取(u,v)=(0,0)

M??1 N??1

????x 0?y 0 f (x, y) 。 得证。其物理意义为 f (x, y)的直流成分为图像灰度的平均值。

4.5 由 DFT 的定义直接证明 DFT 的共轭对称性。 1 证明:由于 F (u, v)???MN

M??1 N??1

????x 0?y 0 f (x, y)e? j2π(ux / M??vy / N ) , 所以

f *(x, y)???1 MN M??1 N??1 x?0 y?0

??? f *(x, y)e? j2π(ux/M??vy/ N )

10

??? 1 M??1 N??1 ??? f (x, y)e =F?? *(?u,??v) =???? MN

得证。

4.6 本章的例 2 中,在求解图像频谱的程序中为了增强显示效果,用对数对 DFT 的幅度 进行压缩,然后将频谱幅度的对数值用在 0~10 之间的值进行显示。研究:(1)对上述结果 与不进行上述处理的直接显示效果进行比较。(2)对将频谱幅度的对数值用不同范围的值进 行显示的结果进行比较。对研究的结果做出结论。

解:(1)适当修改例 2 的程序,即可得到进行对数处理(显示范围[0 10])和未进行处理 (显示范围[0 255])的显示效果:

(a)对数处理

(b)直接显示

2 π

?

(2)可见整体显示效果相差很大,特别在频谱的中心区域视觉效果有较大差别,而中心 区域集中了图像的绝大部分能量,对图像分析和处理至关重要。

4.7 对 0 到 2N – 1 的 2N 个点的离散周期序列 fc (n)做 DFT,设 W2 N?? e j 2 N ,证明 Fc (k ) =

2 N??1

??f (n)W = W2 N2 ? f (n)cos??? c

2nkN

n?0

k ??N??1

???(2n?? 1)k???? 。 n?0????????? 2N?????

-27

证明:这里是一维 DCT 问题,可参考一般的数字信号处理教材中的推导。

4.8 利用 MATLAB 函数 dct2 对一幅 8×8 的图像进行 DCT 变换和反变换,进行原始图 像和重建图像的误差比较分析。变换的参考图像为:

??63 52 55 ???62 I????????

??63 67 ??85 79

??

59 59 58 61 65 71

61 66 70 61 64 73??65 90 109 85 69 72???

68 113 144 104 66 73??68 104 126 88 68 70??71 122 154 106 70 69??64 70 59 77 55 58 65 83????60 68 58 7569 68 65 65 78 94???

??

????

??87 79 采用 Z 扫描方式(参见第 5 章 5.15)保留 20 个 DCT 变换系数进行重构图像,即将第 21 个以 后的变换系数置为 0。计算重建图像 J 与原始图像 I 的均方误差,比较两者的差异。如果保留 横向与纵向的坐标之和小于 8 的系数,比较上述结果。如果保留所有变换系数,再比较上述 结果。这时有误差存在吗?如果有误差,出现在何处?

11

?52 55

61 66 70 61 64 73?????

63 59 65 90 109 85 69 72??????

62 59 68 113 144 104 66 73????解:参考图像为:???

63 58 71 122 154 106 70 69??

???

67 61 68 104 126 88 68 70???79 65 60 70 77 68 58 75??

?????

85 71 64 59 55 58 65 83????

??87 79 69 68 65 65 78 94???

参考图 5.15,采用 Z 扫描,取前 20 个系数,其余系数为 0 重构图像。设原图像为 f,重建图像为

f) ,则均方误差计算公式:

?? 1 N??1 M??1 ) 1/2

2???ERR EMS =????? MN

?f (i, j)????? ?j 0???i 0??????????????)j,(f i????????MATLAB 程序如下: I = [52

55 61 66 70 61 64 73; 63 59 65 90 109 85 69 72; 62 59 68 113 144 104 66 73; 63 58 71 122 154 106 70 69; 67 61 68 104 126 88 68 70; 79 65 60 70 77 68 58 75; 85 71 64 59 55 61 65 83; 87

79 69 68 65 76 78 94 ]

J = dct2(I)

J(1,6) = 0; %第 21 个变换系数置于 0 for i = 1:8

for j = 1:8

if i+j>=7 J(i,j) = 0; end end end

K = round(idct2(J)) ERR = 0; for i = 1:8

for j = 1:8

ERR = ERR + pow2((K(i,j)-I(i,j))); end end

ERR = sqrt(ERR/64) 程序运行结果如下:

变换系数为 J,复原图像为 K,均方误差为 ERR: J=

609.8750 -29.2036 -61.8736 25.5055 54.8750 -19.7503 -0.7544 5.9354 -20.7026 -61.5535

8.2149

11.6753 -6.6819

-6.6150

12

1.9317 6.6052

-46.1580 -48.8798 10.8750 -9.4685 -2.6639 -1.1475

7.9021 11.7974 -7.5356 1.5432 -1.1001 -0.6300

76.7633 34.2864 -12.5196 3.3181 1.3007 -0.5400

-25.5003 -14.2811 -2.2176 -3.5345 -0.1502 -2.8307

-29.5882 -9.8957 -0.6250 -0.6440 0.7554 -0.1882

10.1202 6.2008 1.4004 0.4630 -3.4699 -0.3687

6.3007 1.3806 -4.4204 2.0384 1.9867 -0.7819

-4.8535 1.5404 1.6654 -0.1900 -2.5824 0.5206

K=

63 48 51 74 83 70 60 64 62 52 62 91 102 85 70 70 62 59 78

113 124 102 81 76

62 62 85 122 131 106 80 73 62 59 77 108 114 90 68 64 69 58 62 83 87 69 59 64 87 66 56 66 69 61 66 82 105 77 58 61 64 ERR = 74.0502

当忽略 i + j ≥ 8 的系数,这时有 29 个非 0 系数,均方误差明显减少, K=

62 51 49 68 78 60 56 79 61 57 65 95 108 83 64 74 57 58 78 118 137 107 72 68 59 60 78 119 141 113

69 64 69 98 117 97 70 68 78 66 58 70 82 70 60 70 83 71 58 60 65 58 62 83 89 80 68 67 70 65 76 102 ERR = 8.5746

对取舍的系数不加限制,由于变换、反变换、重新量化产生的误差是很小的。运算结果 如下:

J=

609.8750 -29.2036 -61.8736 5.9354 -20.7026 -61.5535 -46.1580 -48.8798 10.8750 -9.4685 -2.6639 -1.1475 K=

52 55 61 66 70 61 64 73 63 59 65 90 109 85 69 72 62 59 68 113 144 104 66 73 63 58 71 122 154 106 70 69 67 61 68 104 126 88 68 70

25.5055 54.8750 8.2149 11.6753

-9.8957 -0.6250 -0.6440 0.7554 -0.1882

-19.7503 -6.6819

-0.7544 -6.6150

1.9317 6.6052 -4.8535 1.6654 -0.1900 -2.5824 0.5206

75 66 64 79 102

7.9021 76.7633 -25.5003 -29.5882 11.7974 34.2864 -14.2811 -7.5356 -12.5196 1.5432 3.3181 -1.1001 -0.6300

1.3007 -0.5400

-2.2176 -3.5345 -0.1502 -2.8307

10.1202 6.3007 1.4004 -3.4699 -0.3687

-4.4204 1.9867 -0.7819

6.2008 1.3806 1.5404 0.4630 2.0384

13

79 65 60 70 77 68 58 85 71 64 59 55 61 87 79

69 68 65

76

65 78

75 83 94

ERR =1,可见只有 2 个加黑的高频系数有误差。

3.9 在沃尔什变换中,当 N = 8 时,如果 z = 6,求 bi(z)。 解:bi(z)代表 z 的二进制表示的第 i 位值。N = 2n,故 n = 3。

z = 6 用二进制表示为 0110,则 b0(z ) = 0,b1(z ) = 1,b2(z ) = 1,b3(z ) = 0。

4.10 离散的沃尔什变换与哈达玛变换之间有那些异同?

解:哈达玛(Hadamard)变换和沃尔什(Walsh)变换的变换核都是由 1,-1 组成的正交 方阵。它们不同的地方在于变换矩阵的行列排列次序不同。哈达玛变换每行的列率排列是没

有规则的,沃尔什变换的列率是由小到大。

4.11 求 N = 8 对应的沃尔什变换核矩阵。 解:N = 8 偏大,以 N = 4 试验之。 一维沃尔什变换的正变换核为 g(x, u)???W (u)???1 N??1 n?1

1 n?1

?(?1)bi nb)x( (i?1,则一维沃尔什变换为??N i??0

1 3 1

N ??x 0 f (x)??(?1)bi ( x)bn??1?i (u ) 。当 N = 4 时 W (u)??? 3

1 1 1 W (0)???4 i??0

N ??x 0 f (x) i??0(?1)bi ( x)b1?i (u )

? f (1)???1 4 ?1 1 1 1?g????????f (2)

??????? f (3)???

3

1 1 1

W (1)???? f (x)??(?1)bi ( x)b1?i (1)???? f (0)?? f (1)?? f (2)?? f (3)??i??0 4 4 x?0

=

??x 0 f (x) i??0(?1)bi ( x)b1?i (0)?? 4?? f (0)?? f (1)?? f (2)?? f (3)??? f (0)??

? f (0)??? f (1)???

? f (2)????????? f (3)??

3

1 1 1

W (2)???? f (x)??(?1)bi ( x)b1?i (2)???? f (0)?? f (1)?? f (2)?? f (3)??i??0 4 4 x?0

= 1 4

? f (0)??? f (1)???f (2) ??????? f (3)??

= 1 4 ?1??1??1 1?g????????1

3

1

1

W (3)???? f (x)??(?1)bi ( x)b1?i (3)???? f (0)?? f (1)?? f (2)?? f (3)??i??0 4 4 x?0

? f (0)??? f (1)???f (2) ??????? f (3)??

= 1 4 ?1??1 1??1?g????????

14

?W (0)?????1 1 1 1???? f (0)???W (1)??????1 1??1??1??? f (1)??? ??????? 1?????????????g??????即

?W (2)? 4??1??1??1 1???? f (2)????????????????????????????W (3) 1?? f1 1 ?1 ????????????????????? (3)???

1 1 变换的矩阵形式为 W???Ggf?? Ggf ,所以,变换核矩阵 G 为 N 4

G????1 1 1 1????1 1??1??1???????????????

?1??1??1 1?????????????????1??1 1 ?1??

1 ?1 1 ???1 1 ??1 1 G??????1 ?1 ???1 ?1 ?1 ?1 ???1 根据图 3.11,可以看出当 N = 8 时,变换核矩阵 G 为

??1 ?1 1 1 1 1 1????1 ?1 ?1 ?1????1 ?1 ?1 ?1 1 1??????1 ?1 1 1 ?1 ?1???1 1 1 ?1 ?1 1??????1 1 ?1 1 1 ?1??1 ?1 ?1 1 ?1 1?????1 1 1 1 ?1 1 ?1 1

4.12 已知二维数字图像矩阵为 f?????

?3 3 3

?3 3 3

?3 3 3 ??

?3 3 3 ??

?1???,求此图像的二维沃尔什变换。

解:程序为

f = [3 3 3 3; 3 3 3 3; 3 3 3 3; 3 3 3 3]; G = [1 1 1 1; 1 1 -1 -1; 1 -1 -1 1; 1 -1 1 -1]; W = (1/16)*G*f*G 运行结果为 W=

3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

4.13 小波基函数和傅里叶变换基函数有何区别?

解:小波信号的非零点是有限的。它与傅里叶变换的基函数(三角函数、指数信号)是 不同的,傅里叶变换的基函数从负无穷到正无穷都是等幅振荡的。

4.14 一维小波变换如何同时实现时间-频率分析功能?如何扩展到在二维图像的空间-频 率分析?

解:对照一维小波变换和二维图像的定义加以说明。

15

第 5 章 图像编码与压缩

5.1 从哪些方面说明数据压缩的必要性?

答:采用数字技术会使信号处理的性能大为提高,但其数据量的增加也是十分惊人的。 图像数据更是多媒体、网络通信等技术重点研究的压缩对象。不加压缩的图像数据是计算机 的处理速度、通信信道的容量等所无法承受的。

这样的数据率是与当前信息存储介质的容量、计算机的总线速度以及网络的传输率不相 匹配的。尽管人们在存储介质、总线结构和网络性能等方面不断有新的突破,但数据量的增 长速度远超过硬件设施的提高水平,以上的矛盾仍然无法缓解。

如果将上述图像信号压缩几倍、十几倍,甚至上百倍,将十分有利于图像的传输和存储。 可见,在现有硬件设施条件下,对图像信号本身进行压缩是解决上述矛盾的主要出路。

5.2 数据没有冗余度能否压缩?为什么?

答:图像数据量大,同时冗余数据也是客观存在的。一般图像中存在着以下数据冗余因 素:(1)编码冗余;(2)像素间的相关性形成的冗余;(3)视觉特性和显示设备引起的冗余。 理论上,数据没有冗余度是不压缩的,否则无法解码出原始数据。但在大部分应用场合 下采用有损压缩,数据没有冗余度也可以进行压缩。

5.3 如何衡量图像编码压缩方法的性能?

答:一般地,图像压缩应能做到压缩比大、算法简单、易于用硬件和软件实现、压缩和 解压缩实时性好、解压缩恢复的图像失真小等。但这些指标对同一压缩方法很难统一,在实 际系统中往往需要抓住主要矛盾,全面权衡。常用的图像压缩技术指标有:(1)图像熵与平 均码长;(2)图像冗余度与编码效率;(3)压缩比;(4)客观评价 SNR;(5)主观评价。图 像的主客观两种评价之间存在着密切的联系。但一般来说,客观评价高的主观评价也高,因

此在图像编码的质量评价时,首先作客观评价,以主观评价为参考。

5.5 一图像大小为 640×480,256 色。用软件工具 SEA(version 1.3)将其分别转成 24 位 色 BMP,24 位色 JPEG,GIF(只能转成 256 色)压缩格式,24 位色 TIFF 压缩格式,24 位 色 TGA 压缩格式,得到的文件大小分别为:921,654 字节;17,707 字节;177,152 字节;923,044 字节;768,136 字节。分别计算每种压缩图像的压缩比。

解:不计算较小的文件头和彩色查找表(LTU)的数据量,原始图像的数据量为:

640×480×1 byte=307,200 byte。 经转换后各种格式的压缩比如下:

24 位色 BMP 格式: 307,200/921,654=0.333(增加了冗余度) 24 位色 JPEG 格式: 307,200/17,707=17.35 GIF 压缩格式: 307,200/177,152=1.73

24 位色 TIFF 压缩格式: 307,200/923,044=0.333(增加了冗余度) 24 位色 TGA 压缩格式: 307,200/768,136=0.400(增加了冗余度)

5.6 讨论图像压缩方法的分类及其各自的特点。

答:一般数据压缩按信息损失的程度来分类。见教材图 5.2:常见数据压缩技术的分类。 无损压缩:Huffman 编码和 Shannon 编码根据概率分布特性确定码长;游程编码根据连 续灰度的游程来确定编码;算术编码随信源数据不断缩小的实数区间,然后用一个与实数对

16

应的二进制码代表被编码的信息;轮廓编码根据相同灰度的区域边界线进行编码。

有损压缩:预测编码根据相邻像素相关性来确定后继像素的预测值,若用差值进行编码 则可以压缩数据量;变换编码对原始图像进行正交变换,在变换域进行抽样达到压缩的目的; 混合编码将两种编码方法结合起来,如将预测编码与变换编码相结合,以取得更好的效果。

在现代压缩编码方法中,分形编码利用宏观与微观的相似性来压缩数据量,可以获得极 大的压缩比。该方法压缩过程的计算量较大,但解压缩很快,适用于图像数据的存储和重现。

模型基编码:一种新型压缩方法。该方法在发送端利用已知且变化慢的场景得到数据量 不大的模型参数,在接收端利用综合模型参数恢复原始图像。这一编码方法对于实时实现电 视会议等具有显著意义。

5.7 大部分视频压缩方法是有损压缩还是无损压缩?为什么?

答:视频比静态图像数据量更大,同时可压缩的冗余信息更多。大部分视频压缩方法是 以人眼感觉无明显失真为依据的,因此采用有损压缩。事实上,视频可以看成是一幅幅不同 但相关的静态图像的时间序列。因此,静态图像的压缩技术和标准可以直接应用于视频的单 帧图像。另外,利用视频帧间信息的冗余可以大大提高视频的压缩比。

5.8 若图像上任意两像素点的亮度电平值相等或者任意两时刻同一位置上的像素的亮度 电平值相等,能够说明上述两种情况下像素相关吗?为什么?

答:不能。像素的空间相关性和时间相关性是以空间和时间的相邻性为基础的。因此, 图像上任意两像素点的亮度电平值相等或者任意两时刻同一位置上的像素的亮度电平值相 等带有偶然性,不能说明两像素相关。

5.9 根据 JPEG 算法说明 JPEG 图像显示时会出现马赛克现象的原因。

答:由于 JPEG 算法将整幅图像分成若干个 8×8 的子块,解码也是以子块为单位的,所 以块间的解码误差可能反映为方块效应,在视觉上会出现马赛克现象。

5.10 讨论混合编码的优点。

答:混合编码一般指将预测编码与变换编码相结合进行编码的方法。预测编码根据相邻 像素相关性来确定后继像素的预测值,若用差值进行编码则可以压缩数据量;变换编码对原 始图像进行正交变换,在变换域进行抽样达到压缩的目的;混合编码将两种编码方法结合起 来,可以发挥两种编码方法的优点,取得更好的效果。

5.11 有了离散傅里叶及其快速算法 FFT,为什么还要提出离散余弦算法 DCT 及其快 速算法?为什么许多视频国际标准将 DCT 作为帧内编码的基本压缩算法?

答:在所有的变换编码方案中,离散 K-L 变换是最佳变换,理论价值较高,常常作为 对其他变换特性进行评价的标准。但此变换没有快速算法,在工程应用中受到限制。在次最 佳变换算法中,DFT 和 DCT 都是常用的变换编码方法,它们分别有快速算法:FFT 和 FCT。 这两种方法相比较,DFT 涉及到复数运算,而 DCT 是实数变换具有十分吸引人的一些特点: 它是一种实数变换,计算量较小,其变换矩阵的基向量很好地描述了人类视觉的相关性,且 对于大多数图像来说,该变换的压缩性能很接近离散 K-L 变换,而且其变换矩阵与图像内 容无关,另外由于它构造对称的数据序列,避免了在图像边界处的跳跃及所引起的 Gibbs 效应,并且也有快速算法,因而得到广泛的应用。作为准最佳变换,它已成为一些静态图像、 视频压缩国际标准(或建议)中的基本处理模块。JPEG 制定了基于 DCT 的有失真静止图像 压缩标准。在 MPEG 视频编码器中帧内图像(I 图像)采用 DCT 的编码方法。

17

5.12 为什么二维 DCT 可以转换成两次一维 DCT 计算?

答:参考第 3 章图像变换。二维变换可以分解成两次变换,如先进行变换,再进行列变

换,或反之。

5.13 Huffman 编码有何优缺点?

答: Huffman 编码在无失真的编码方法中效率优于其他编码方法,是一种最佳变长码, 其平均码长接近于熵值。但当信源数据成分复杂时,庞大的信源集致使 Huffman 码表较大, 码表生成的计算量增加,编译码速度相应变慢;另外不等长编码致使硬件译码电路实现困难。 上述原因致使 Huffman 编码的实际应用受到限制。

5.14 Huffman 编码是最佳编码,为什么还要研究算术编码等其他熵编码算法?

答:题 5.12 中讨论了 Huffman 编码的优缺点,其他熵编码方法可以在某些性能上克服 Huffman 编码的不足。如,虽然算术编码的硬件实现比 Huffman 编码方法复杂,但对图像的 编码测试结果表明,在信源符号概率接近的条件下,算术编码效率高于 Huffman 编码。

5.15 算术编码有何优点?举例说明其适用范围。

答:在信源符号概率接近的条件下,算术编码效率高于 Huffman 编码。因此,在扩展 的 JPEG 系统中用算术编码取代了 Huffman 编码。另外,算术编码除了常见的基于概率统计 的模式外,还有自适应模式。在这种模式下,各个符号的初始概率相同,它们依据出现的符

号而发生变化。这种模式特别适用于不便于进行符号概率统计的实际场合中。

5.16 用 JPEG 标准,对于 576 行×720 列的 CCIR601 建议分辨率的彩色图像, 其亮度 分量可分割成多少个子块, 而两个色差分量可分别分割成多少子块?

解:对于 576 行×720 列的 CCIR601 建议分辨率的彩色图像, JPEG 将其亮度分量分割 成(576/8)×(720/8)=6480 块。两个色差分量都可分割成两组:(576/8)×(360/8)=3240 块。

5.17 JPEG 为什么要进行彩色空间转换?

答:JPEG 算法处理的是单独的彩色分量图像,所以来自其他彩色空间的图像数据要以 JPEG 格式保存,需要进行彩色空间的转换,如将 RGB 空间、YCRCB 空间或转换为 YUV 空 间等。

5.18 JPEG 的量化表有何作用?

答:量化的目的是为了压缩数据,同时也是图像质量下降的主要原因。所以设计合理的 量化器十分重要。在保证图像质量的前提下,为了获得较高的压缩比,JPEG 量化器利用人 眼的空间视觉特性,相对于高频成分对低频成分采用较小的量化间隔和较少的比特数。又根 据人眼对亮度信号比色度信号敏感的原理,对图像的亮度分量和图像的色差分量使用不同的 量化表——亮度量化表和色差量化表。量化表的元素即为量化间隔。对于 CCIR 601 标准电 视图像,JPEG 标准提供了最佳的亮度和色度量化表。根据不同的应用需要,用户还可以设 计或选择其他的量化表。

5.19 JPEG 算法中 DCT 系数采用 Z 字形重排有何作用?

答:DCT 系数左上角(第 1 行第 1 列)为直流分量(DC 系数),对 8×8 子块矩阵进行

18

Z 字形编排则可将其余的交流分量(AC 系数)按“频率”从低到高排列,形成 1×64 的矢 量。这样排列可以增加“0”系数的游程长度,提高压缩效率。

19

第 6 章 图像增强

6.1 图像增强的目的是什么?它包含哪些研究内容?与图像复原有何区别?

解:图像增强是指对图像的某些特征,如边缘、轮廓、对比度等进行强调或锐化,以便 于显示、观察或进一步分析与处理。图像增强所包含的主要内容有:

1、空间域增强法:包括点操作(如灰度变换、直方图变换等)、区域操作(平滑、锐化等)。 2、频率域增强法:采用二维数字滤波器实现低通滤波(平滑)、高通滤波(锐化)等。 3、同态滤波法:结合上述方法,实现空间域非线性运算并在频域高频增强。 图像增强偏重于处理后主观效果,而图像复原偏重于成像前的客观现实。

6.2 试分别给出将灰度范围(10,100)拉伸到(0,150)和(10,200)、压缩到(50,100) 和(10,125)、平移到(110,225)的线性变换。

解:设原始图像像素灰度 f 的范围为[a, b],线性变换后图像 像素灰度 g 的范围为 [a?, b?] 。灰度 g 与灰度 f 之间的关系为 g?? a????b??? a??b?? a

[ f?? a]

这里,a = 10, b = 100。题目给出四组 a’, b’值,分别代入上述 公式即可得出 g 和 f 的线性函数关系。

教材图 4.4 线性变换

6.3 如图 4.34 所示,已知灰度图像 f (x, y)表示为如下矩阵,求经过反转变换后的图像 g(x, y)。反转变换 g = G (f )。

?200 100 160????180 185 128??????????????????????155 10 230???

(a)灰度图像矩阵

( b)反转变换曲线

图 4.34 灰度图像的反转

?0 127 0???0 0 0???????????????0 127 0??解:?????????????

6.4 试求灰度变换方程 g = G(f ),使其在范围 10 ≤ f ≤ 150 内为 ln( f )的线性函数。 解:依题意,设 g = a ln(f ) + b, 当 10 ≤ f ≤ 150 时,g1 ≤ f ≤ g2

则 g1 = a ln(10 ) + b g2 = a ln(150 ) + b 所以 a = (g2- g1)/ln(15)

b = g1 - a ln(10)

6.5 设有一幅 64×64 的离散图像,其灰度分成 8 层,灰度 nk 的值和分布情况如表 4.3 所

20

示。试绘制该图像的直方图,并求经过直方图均衡后的图像的直方图。说明为什么对数字图 像进行直方图均衡化后,通常并不能产生完全平坦的直方图。

表 4.3 一幅图像的灰度分布

K rk nk

0 0 560

1 1/7 920

2 2/7 1046

3 3/7 705

4 4/7 356

5 5/7 267

6 6/7 170

7 1 72

解:列表如下: K 0

0 rk

560 nk Pr(rk) S

k

1

1/7 920 0.22 0.36 3/7 3/7 920 0.22

2 2/7 1046 0.26 0.62 4/7 4/7 1046 0.26

3 3/7 705 0.17 0.79 6/7

4 4/7 356 0.09 0.88 6/7 6/7 1061 0.26

5 5/7 267 0.07 0.95 1

6 6/7 170 0.04 0.99 1

7 1 72 0.02 1 1 1 509 0.13

0.14 0.14 1/7 1/7 560 0.14

Sk″ Sk nks

pr(sk)

6.6 试述图像平滑的目的、采用空间域和频率域滤波的原理。 解:(1)图像平滑是主要为了消除或减轻图像噪声。

(2)空间域滤波主要通过邻域平均、中值滤波和边界保持滤波等方法达到图像平滑的目 的。

(3)空间域滤波是通过将图像变换成相应的频谱,在频域进行低通滤波,再进行反变换 实现的。

6.7 试述中值滤波的特点。为什么对一些细节多,特别是点、线、尖点细节多的图像不适 宜用这种方法?

答:中值滤波便属于这一类的非线性增强方法,在去噪的同时可以兼顾到边界信息的保留。 对消除孤立点和线段脉冲等干扰及图像扫描噪声最为有效,但对于消除高斯噪声的影响效果 不佳。

中值滤波首先选一个含有奇数点的窗口 W,将这个窗口在图像上扫描,把该窗口中所含 的像素点按灰度级的升(或降)序排列,取位于中间的灰度值,来代替该点的灰度值。

二维中值滤波的窗口形状和尺寸对滤波性能的影响较大,以适应不同的图像内容和应用 要求。由于采用窗口中灰度值排序的方法决定中值,对于一些细节较多的复杂图像排序后将 会影响正常图像的内容,所以不宜采用这种方法。

10 的点阵,求边界点保持不变、经过 3×3 窗口中值 6.8 如图 6.35 所示,设原图像为 10×

滤波的图像。

21

1 1 1 1 1 1 1 1 1 1

1 1 1 1 1 1 1 1 1 1

1 1 5 5 5 5 5 5 1 1

1 1 5 5 5 5 5 5 1 1

1 1 5 5 8 8 5 5 1 1

1 1 5 5 8 8 5 5 1 1

1 1 5 5 5 5 5 5 1 1

1 1 5 5 5 5 5 5 1 1

1 1 1 1 1 1 1 1 1 1

1 1 1 1 1 1 1 1 1 1 图 6.35 受干扰的二维图像

解:(1)采用 3×3 窗口在图像上进行扫描,窗口中心值为窗口灰度值排序的中值。

(2)采用中值滤波的程序验证结果:

I = [1 1 1 1 1 1 1 1 1 1;

1 1 1 1 1 1 1 1 1 1; 1 1 5 5 5 5 5 5 1 1; 1 1 5 5 5 5 5 5 1 1; 1 1 5 5 8 8 5 5 1 1; 1 1 5 5 8 8 5 5 1 1; 1 1 5 5 5 5 5 5 1 1; 1 1 5 5 5 5 5 5 1 1; 1 1 1 1 1 1 1 1 1 1;

1 1 1 1 1 1 1 1 1 1];

imshow(I);

J = medfilt2(I) figure, imshow(J); 运行结果为 J =

0 1 1 1 1 1 1 1 1

1 1 1 1 1 1 1 1 1 1

1 1 1 5 5 5 5 1 1 1

1 1 5 5 5 5 5 5 1 1

1 1 5 5 5 5 5 5 1 1

1 1 5 5 5 5 5 5 1 1

1 1 5 5 5 5 5 5 1 1

1 1 1 5 5 5 5 1 1 1

1 1 1 1 1 1 1 1 1 1

0 1 1 1 1 1 1 1 1 0

%二维中值滤波

0

22

6.9 设图像如图 6.36 所示,分别求经过邻域平滑和高通算子锐化的结果。其中边缘点保

?1 1 1??1??????????1 0 1 持不变,邻域平滑掩码取 3×3 矩阵,即 H??????????? ;邻域高通算子取 3×3 矩阵,即 8

1 1 1 ???????????

??1??1??1????1 8???1 H???????????????? 。

???1??1??1???

1 2 2 3 4 1 1 3 2 5 3 4 5 3 4 4 5 4 3 1 5 5 5 2 1 图 6.36 一幅 5×

5 的灰度图像矩阵

解:邻域平滑的结果:

1 2 2 3 4 1 2 2 3 4

度范围。

1 21/8 22/8 29/8 5 1 -13 2 -13 5

3 26/8 25/8 27/8 4 3 6 15 -4 4

4 35/8 32/8 25/8 1 4 5 0 -1 1

5 5 5 2 1 5 5 5 2 1

邻域高通算子滤波的结果:

对于出现的负值区间,可以通过图像增强的方法,即适当的变换映射为可观测的图像灰

6.10 为什么待锐化的图像需要有足够的信噪比?选择不同信噪比(SNR = 40 dB 和 20 dB) 的图像用 Roberts 梯度法实验说明。

解:待锐化的图像要有足够的信噪比,否则会使噪声得到比原图像更强的增强,信噪比 更加恶化。

用程序验证上述结论:(1)选择一幅图像;(2)可以对图像加椒盐噪声试验;(3)信噪 比可调节噪声强度得到;(4)用 Roberts 梯度法观测锐化后的边缘。

6.11 已知一幅如图 6.37 所示的图像。可见原图中左边暗,右边亮,中间存在着一条明显 的边界。

0 1 0 1

0 1 255 1 1 254 0 0 255 1 0 254

254 253 255 254

254 254 253 254

254 254 253 254

图 6.37 有垂直边界的一幅图像

23

试用 Sobel 算子对给定的图像进行模板操作并分析得到的结果图像。

解:程序如下:

I = [0 0 1

1 1 1 0 0 0 1 1 0

255 254 254 254; 254 253 254 254; 255 255 253 253; 254 254 254 254]

J = edge(I,'sobel',0.1);

subplot(121); imshow(I,[0 255]); subplot(122); imshow(J); 运行结果如下: J=

0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0

可见,有一条一个像素的边缘线。在图像的边界处,由于算子只能确定模板的中心值, 未能检测边缘。对于实际图像来说,目标一般在图像的内部,所以无碍于实际应用。

0

24

第 7 章 图像复原

7.1 引起图像退化的原因有哪些?

答:造成图像退化的原因很多,大致可分为以下几个方面: (1)射线辐射、大气湍流等造成的照片畸变。

(2)模拟图像数字化的过程中,由于会损失部分细节,造成图像质量下降。 (3)镜头聚焦不准产生的散焦模糊。 (4)成像系统中始终存在的噪声干扰。

(5)拍摄时,相机与景物之间的相对运动产生的运动模糊。 (6)底片感光、图像显示时会造成记录显示失真。

(7)成像系统的像差、非线性畸变、有限带宽等造成的图像失真。

(8) 携带遥感仪器的飞行器运动的不稳定,以及地球自转等因素引起的照片几何失真。

7.2 常见的图像退化模型包含哪些种类?

答: 从图像信号的产生形式来看,可将退化模型分为连续图像退化模型和连续图像退化 模型。

(1)连续图像退化的一般模型如图所示。输入图像 f(x, y)经过一个退化系统或退化算子 H(x, y)后考虑加性噪声的影响产生的退化图像 g(x, y)可以表示为:

g(x, y)= H [f(x, y)]+n(x, y)

如果噪声是乘法性噪声,可以通过对数运算转化为加性噪声的形式,通过同态滤波可 以则退化图像可恢复原来的图像。

(2)数字图像处理系统处理的图像是离散图像,所以对连续退化模型的离散化即形成 离散图像退化模型。这种模型通常用矩阵代数求解。

根据降质系统的传递函数主要有:

(1)空间非相干成像系统由于衍射限制造成的图像退化模型。 (2)照相机与被摄景物之间的相对运动造成的图像退化模型。 (3)大气湍流造成的图像退化模型。

(4)由于成像系统的非线性、飞行器的姿态、高度和速度变化等引起的不稳定与不可 预测的几何失真,造成的几何畸变模型。

7.5 用维纳滤波的方法进行图像复原,不同的 PSF 对复原效果有什么影响?

解:用维纳滤波的方法进行图像复原,不同的 PSF 参数值对复原效果影响较大。模糊 函数可能是高斯函数或运动模糊函数等。教材中以运动模糊为例,对不同的 PSF 参数值产 生的复原效果进行比较。复原结果见教材图 6.3(a)。实际应用过程中,真实的 PSF 通常是 未知的,需要根据一定的先验知识对它进行估计,再将估计值作为参数进行图像复原。图 6.3 分别显示了使用较“长”和较“陡峭”的 PSF 后所产生的复原效果,由此可见 PSF 的重要 性。

7.6 用约束最小二乘方滤波复原时,不同的噪声强度、拉氏算子的搜索范围和约束算 子对复原效果有何影响?

解:DECONVREG 函数提供了使用平滑约束最小二乘滤波算法对图像去卷积的功能。 调用格式如下:[J LAGRA] = DECONVREG(I,PSF,NP,LRANGE,REGOP)。其中,I 假设为真 实场景图像在 PSF 的作用下并附加噪声的图像,NP 为噪声强度,J 为去模糊的复原图像。

25

LRANGE(拉氏算子的搜索范围)、REGOP(约束算子)为改善复原效果的可选参数。LRANGE 指定搜索最佳拉氏算子的范围,缺省值为[10-9,109]。返回值 LAGRA 为在搜索范围的 Lagrange 乘子。如果 LRANGE 为标量,则该算法假定 LAGRA 已经给定且等于 LRANGE, 因而 NP 值可以不予考虑。REGOP 的缺省值为平滑约束 Laplacian 算子。教材例 6.2 说明采用平滑约束 的最小二乘复原的具体实现方法。不同的复原图像效果比较见图 6.6、图 6.7、图 6.8。通过这 些图像可以分析各个参数对图像复原质量的影响。实际应用中,读者可以根据这些经验来选 择最佳的参数进行图像复原。

7.7 盲去卷积方法中,如何选择一个合适的 PSF 值?

解:对具有加性噪声的模糊图像作盲图像复原的方法一般有两种:直接测量法和间接估 计法。MATLAB 提供了 DECONVBLIND 函数进行盲图像复原。该函数采用最大似然算法 对模糊图像进行去卷积处理,返回去模糊的图像和相应的点扩散函数 PSF。

26

第 8 章 图像分割

8.1 举例说明分割在图像处理中的实际应用。

答:在对图像进行分析的场合,人们可能对图像中的某些局部或特征感兴趣,其输出不 一定是一幅完整的图像。这些部分常被称为目标或对象(object),处于感兴趣的区域(Region Of Interest, ROI)。在图像分析中,输出的结果是对图像的描述、分类或其他的某种结论,而 不再像常规图像处理那样输出另一幅图像。由于这些被分割的区域在某些特性上相近,因而, 图像分割常用于模式识别与图像理解以及图像压缩与编码等应用场合。

8.2 根据 4 连通或 8 连通准则,判断图 8.28 所示图像中的目标并编写 MATLAB 程序。

1 1 1 1 0 1 1 1

1 1 1 1 1 0 1 1

1 1 0 0 0 1 1 1

0 0 0 0 0 0 0 0

0 1 1 0 0 0 0 0

0 1 1 1 0 0 1 0

0 0 0 1 1 1 1 0

0 0 0 0 0 0 0 0

图 8.28 待判断目标的图像

解:设原图像为 I,则四邻域判断语句为:L4 = bwlael(I,4)

11100000 11103300 11003300 11000330 01000030 20200030 22200330 22200000

八邻域:L8 = bwlael(I,8)

11100000 11102200 11002200 11000220 01000020 10100020 11100220 11100000

8.3 阈值分割技术适用于什么场景下的图像分割?

解:灰度阈值分割方法用一个灰度级阈值 T 进行分割,分割出目标区域与背景区域。通 常用于图像中目标和背景具有不同的灰度集合:目标灰度集合与背景灰度集合。

8.4 图像的背景亮度均值为 50,方差为 300;目标占图像像素总数的百分比为 20%,均

27

值为 150,方差为 100。求最佳分割阈值。

解:采用最小误差的方法求得的阈值为最佳阈值。假设背景的概率密度为 p1(z),感兴趣 目标的概率密度为 p2(z)。设背景像素数占图像总像素数的百分比为? =80%,目标的像素数百 分比为 (1???? ) =20%。假设背景与前景的灰度分布都是正态分布的,背景的均值和方差分别为

8.5 边缘检测的理论依据是什么?有哪些方法?各有什么特点?

解:边缘检测这是基于幅度不连续性进行的分割方法。通常采用差分、梯度、拉普拉斯 算子及各种高通滤波处理方法对图像进行边缘检测。

?1 =50和?2 1 =300 , 前 景 的 均 值 和 方 差 分 别 为??2 =150和? 2 =100 , 有 ln

?????????2

(1???? )?1 2?1 2? 2

2

80??100 (t?? 50) (t??150)2

=0.2877,求得近似值 t ? - ,则 ln 20?? 300 2?? 300 2??100

为 114。

8.6 设计一个利用 Sobel 算子、Roberts 算子、LoG 算子进行边缘检测的程序,比较各 边缘检测算子检测的视觉效果与运算量。

解:参考例 8.3。

I = imread('blood1.tif'); BW1 = edge(I,'sobel');

%进行 Sobel 算子边缘检测,门限值采用 MATLAB 默认值 BW2 = edge(I,'roberts');

%进行 Roberts 算子边缘检测,门限值采用 MATLAB 默认值 BW3 = edge(I,'log');

%进行 LoG 算子边缘检测,门限值采用 MATLAB 默认值 Subplot(221); imshow(I,[]); Subplot(222); imshow(BW1,[]); Subplot(223); imshow(BW2,[]); Subplot(223); imshow(BW3,[]);

运行结果见下页。可见,这三种检测算子中,Roberts 算子定位精度较高,但也易丢失部 分边缘,抗噪声能力差,适用于低噪声、陡峭边缘的场合。Sobel 算子首先对图像做平滑处理, 因此具有一定的抑制噪声的能力,但不能排除检测结果中的虚假边缘,易出现多像素宽度。 LoG 算子滤波提高了抗噪声的能力,但同时可能使原本比较尖锐的边缘平滑了,甚至无法检 测到。

在一定配置下测得边缘检测的时间为:Sobel 94 ms; Roberts 47 ms; LoG 125 ms。可见, Roberts 算法最快,Log 算法最费时。

8.8 为什么要进行边缘跟踪?简述光栅进行 Roberts 算子边缘检测,门限值采用 MATLAB 默认值扫描跟踪的基本步骤。

答:在一些应用场合,仅仅得到边缘点是不够的。由于噪声和光照不均等因素会使得原 本连续的边缘出现间断现象,因此,在使用边缘检测算法后,有必要采用边缘跟踪方法将间 断的边缘转换成有意义的边缘信息。

光栅进行 Roberts 算子边缘检测,门限值采用 MATLAB 默认值扫描跟踪的基本步骤大致

28

8.9 实际采用霍夫变换检测直线时,为什么不采用 y = kx + b 的表示形式?

解:使用等式 y = kx + b 表示一条直线带来的问题是,当直线接近垂直时,直线的斜率接 近无限大。解决这一难点的一种方法是使用极坐标直线方程:

ρ = xcosθ+ ysinθ

·

·

为:先对图像进行 Roberts 算子运算,再根据教材中的边缘跟踪算法作进一步的处理。

(a)原图像 (b)Sobel 算子 (c)Roberts 算子检测 (b)LoG 算子检测

无噪声边缘检测

无噪声边缘检测

29

8.10 证明:在极坐标系中的霍夫变换将图像空间 XY 的共线点映射为??? 平面上的正弦 曲线并交汇于一点。

证明:设图像空间的点(xi,yi)(i = 1,2,?,n)共线,则有 yi = a xi + b

对应的 Hough 变换为 ρ = xicosθ+ yi sinθ 将 yi = a xi + b 代入上式,得 ρ = xicosθ+ (a xi + b) sinθ

·

·

··

要使 n 条直线交于一点(ρ’

θ’ ),可得 ρ’ = xi(cosθ’ + a sinθ’)+ b sinθ’

··

要使上述 n 个等式成立,应有 cosθ’ + a sinθ’ = 0

·

θ’ = arctan(-1/ a), ρ’ = b sinθ’

可见,n 条曲线都会交会于(ρ’,

θ’。

30

)

第 9 章 数学形态学及其应用

9.1 数学形态学主要包括哪些研究内容?

答:数学态学图像处理的基本思想是利用结构元素作为“探针”在图像中不断移动,在 此过程中收集图像的信息、分析图像各部分间的相互关系,从而了解图像的结构特征。结构 元素的选择十分重要,根据探测研究图像的不同结构特点,结构元素可携带形态、大小、灰 度、色度等信息。不同点的集合形成具有不同性质的结构元素。由于不同的结构元素可以用 来检测图像不同侧面的特征,因此设计符合人的视觉特性的结构元素是分析图像的重要步 骤。用形态学算子及其组合来进行图像形状和结构的分析及处理,可以解决抑制噪声、特征 提取、边缘检测、形状识别、纹理分析、图像恢复与重建等方面的问题。

9.2 基于数学形态学的图像处理有何特点?

答:利用数学形态学进行图像处理有其独有的一些特性:

(1)它反映的是一幅图像中像素点间的逻辑关系,而不是简单的数值关系。 (2)它是一种非线性的图像处理方法,并且具有不可逆性。 (3)它可以并行实现。

(4)它可以用来描述和定义图像的各种集合参数和特征。

9.4 画出用一个半径为 r/4 的圆形结构元素腐蚀一个 r×r 的正方形的示意图。 解:根据数学形态学腐蚀的定义:集合 A 被集合 B 腐蚀为:A○—B={x:B+x.A}。 图示如下:

9.6 设计一个算子可以同时检测图像中的峰和谷。

解:根据高帽变换 WHT(f) = f — ( fg) 和低帽变换 BHT(f) = (f●g) — f,可得算法如下: 设单位阵为 I, I 与 f 同大小。定义

B = [I- Ig 则 B 为所得算子

f * B=[WHT BHT(f)] 所以算子为:[I- Ig Ig-I]

WHT 为波峰检测,而 BHT 为波谷检测。

Ig-I]

31

第 10 章 彩色图像处理

10.1 如何表示图像中一点的彩色值?颜色模型起什么作用?

答:图像中一点的彩色值颜色三维空间中的一个点来表示,每个点有三个分量,不同的 颜色空间各分量的含义不同。

颜色模型规定了颜色的建立、描述和观察方式。颜色模型都是建立在三维空间中的,所 以与颜色空间密不可分。

10.2 色调、色饱和度和亮度的定义是什么?在表征图像一点颜色时,各起什么作用? 答:HSV 模型由色度(H),饱和度(S),亮度(V)三个分量组成的,与人的视觉特 性比较接近。HSV 颜色模型用 Munsell 三维空间坐标系统表示。

色调(H)表示颜色的种类,用角度来标定,用-1800~1800 或 00~3600 度量。 色饱和度(S)表示颜色的深浅,在径向方向上的用离开中心线的距离表示。用百分比 来度量,从 0%到完全饱和的 100%。

亮度(V)表示颜色的明亮程度,用垂直轴表示。也通常用百分比度量,从 0%(黑) 到 100%(白)。

10.4 为什么有时需要将一种颜色数据表示形式转换为另一种形式?如何由 RGB 数值计 算 HSV 数值?

答:实际应用中常用的颜色空间很多,有 RGB、HSV、HSI、YUV、YIQ 等。目前常 用的颜色空间可分为两类,一类是面向硬设备的,比方说彩色显示器、打印机等,另一类面 向以彩色处理为目的的应用,面向硬设备的最常用的颜色空间是 RGB 颜色空间,而面向颜 色处理的最常用颜色空间是 HSI 颜色空间以及 HSV 颜色空间。针对不同的应用目的采用不 同的彩色空间可能更合适,因此,有时需要将一种颜色数据表示形式转换为另一种形式。

由 RGB 数值计算 HSV 数值的方法,参见教材公式(8.2)~(8.2)。

10.5 当 R = 0,G = 0,B = 1 时,在 HSI 空间求 H 和 S 值。 解:根据公式(8.8)有:

H = 2π-arccos(-1/2) = 4.189 (rad), S = 1, I= 1/3

10.6 什么是彩色的减性模型和加性模型?哪一种模型更适合用于显示和打印图片场 合?

答:由三基色混配各种颜色通常有两种方法:相加混色法和相减混色法。相加混色和相 减混色的主要区别表现在以下三个方面:

(1)相加混色是由发光体发出的光相加而产生的各种颜色,而相减混色是先有白色光, 然后从中减去某些成份(吸收)得到各种颜色。

(2)相加混色的三基色是红、绿、蓝,而相减混色的三基色是黄、青、品红。也就是 说,相加混色的补色就是相减混色的基色。

(3)相加混色和相减混色有不同的规律。

彩色电视机显示的颜色是通过相加混色产生的。而彩色电影和幻灯片等与绘画原料、打 印机打印图片等是通过相减混色产生各种颜色的。

10.7 哪个颜色空间最接近人的视觉系统的特点?

32

答:在许多实用系统中,大量应用的是 HSV 模型,这个模型是由色度(H),饱和度(S), 亮度(V)三个分量组成的,与人的视觉特性比较接近。该模型的重要性在于:一方面消除 了亮度成分 V 在图像中与颜色信息的联系,另一方面色调 H 和饱和度 S 分量与人的视觉感 受密切相关。基于人的视觉系统的颜色感觉特性,这些特征使 HSV 模型成为一个研究图像 处理的重要工具。

10.10 为什么在某些场合下要进行彩色量化?彩色图像的量化的依据是什么?

答:彩色空间的连续空间。如果对连续空间进行适当的量化后再计算,则计算量要少得 多。如在实际处理中,需要将 HSV 三个分量进行量化以减少特征值的数量。

10.12 抖动技术是如何利用只能显示较少颜色的设备重现含有丰富色彩图像的?

答:抖动法是一种利用仅能重现较少颜色种类的设备来显示含有丰富色彩图像的有效的 方法。产生抖动图像可以有多种方式,但是基本原理都是一样的:采用能直接显示其色彩的 像素模式来替换那些其色彩不能直接显示的像素。抖动技术利用了空间混色原理——人的肉 眼能将两种不同颜色的相邻像素融合成第三种颜色。

12.15 讨论伪彩色在云图绘制和显示等气象领域的应用。

解:卫星云图是地面接受到的来自气象卫星的云况图片。按气象卫星取得云况的仪器不 同,可分为可见光卫星云图和红外卫星云图。若某地上空为一片晴空区,卫星观测到的,是 从地面发向太空的红外辐射信息,表现为黑灰色;黑色越深,表示地面辐射越强,气温越高, 天气越晴好。当某地上空有云雨覆盖,卫星观测到的,则是从云顶发向太空的红外辐射信息, 表现为白色或灰白色;颜色越白,表示地面辐射越弱,气温越低,云系越厚越密实,降雨强 度也就越大。晴空区与云雨区之间的过渡区,则为深灰、灰、浅灰色云系,表明有不同厚度 的云而无明显降水。

医学图像的种类包括 X 光图像、同位素图像、核磁共振图像、超声波图像、红外线图 像以及显微图像等。对这些图像作对比度增强或伪彩色等的处理可帮助医生诊断疫病。

8.16 讨论假彩色和伪彩色的差异。

答:假彩色处理的对象是三基色描绘的自然图像或同一景物的多光谱图像。对自然图像, 假彩色的处理方法之一是将人们所关注的目标物映射为与原色不同的假彩色,即原有的彩色 图像变换成给定彩色分布的图像。而伪彩色增强是将灰度或单一波段的图像变换为彩色图 像,从而把人眼不能区分的微小的灰度差别显示为明显的色彩差异,更便于解译和提取有用 信息。彩色图像中的彩色根据黑白图像的灰度级或其他图像特征(如空间频率成分)人为给 定。

8.17 讨论彩色图像增强与灰度图像增强的关系。

答:在真彩色增强中,尽管对 R、G、B 各分量(相当于三个灰度图像)直接使用对灰度 图的增强方法可以增加图像中可视细节亮度,但得到的增强图像中的色调有可能完全没有意 义。这是因为在增强图中对应同一个像素的 R、G、B 这三个分量都发生了变化,它们的相对 数值与原来不同了,从而导致原图像颜色的较大变化,且这种变化很难控制。灰度图像增强 技术有助于研究彩色图像增强技术,但彩色图像增强特别需要注意增强后图像的色调和色饱 和度的满意度。

33