胡学龙答案 下载本文

胡学龙、许开宇编著《数字图像处理》

思考题与习题参考答案

第1章 概述

1.1 连续图像和数字图像如何相互转换?

答:数字图像将图像看成是许多大小相同、形状一致的像素组成。这样,数字图像可以用二维矩阵表示。将自然界的图像通过光学系统成像并由电子器件或系统转化为模拟图像(连续图像)信号,再由模拟/数字转化器(ADC)得到原始的数字图像信号。图像的数字化包括离散和量化两个主要步骤。在空间将连续坐标过程称为离散化,而进一步将图像的幅度值(可能是灰度或色彩)整数化的过程称为量化。

1.2 采用数字图像处理有何优点?

答:数字图像处理与光学等模拟方式相比具有以下鲜明的特点:

1.具有数字信号处理技术共有的特点。(1)处理精度高。(2)重现性能好。(3)灵活性高。

2.数字图像处理后的图像是供人观察和评价的,也可能作为机器视觉的预处理结果。 3.数字图像处理技术适用面宽。 4.数字图像处理技术综合性强。

1.3 数字图像处理主要包括哪些研究内容?

答:图像处理的任务是将客观世界的景象进行获取并转化为数字图像、进行增强、变换、编码、恢复、重建、编码和压缩、分割等处理,它将一幅图像转化为另一幅具有新的意义的图像。

1.4 讨论数字图像处理系统的组成。列举你熟悉的图像处理系统并分析它们的组成和功能。 答:如图1.8,数字图像处理系统是应用计算机或专用数字设备对图像信息进行处理的信息系统。图像处理系统包括图像处理硬件和图像处理软件。图像处理硬件主要由图像输入设备、图像运算处理设备(微计算机)、图像存储器、图像输出设备等组成。软件系统包括操作系统、控制软件及应用软件等。

图1.8 数字图像处理系统结构图 图1.8 数字图像处理系统结构图

1

1.5 常见的数字图像处理开发工具有哪些?各有什么特点?

答.目前图像处理系统开发的主流工具为Visual C++(面向对象可视化集成工具)和MATLAB的图像处理工具箱(Image Processing Tool box)。两种开发工具各有所长且有相互间的软件接口。

Microsoft公司的VC++是一种具有高度综合性能的面向对象可视化集成工具,用它开发出来的Win 32程序有着运行速度快、可移植能力强等优点。VC++所提供的Microsoft基础类库MFC对大部分与用户设计有关的Win 32应用程序接口API进行了封装,提高了代码的可重用性,大大缩短了应用程序开发周期,降低了开发成本。由于图像格式多且复杂,为了减轻程序员将主要精力放在特定问题的图像处理算法上,VC++ 6.0提供的动态链接库ImageLoad.dll支持BMP、JPG、TIF等常用6种格式的读写功能。

MATLAB的图像处理工具箱MATLAB是由MathWorks公司推出的用于数值计算的有力工具,是一种第四代计算机语言,它具有相当强大的矩阵运算和操作功能,力求使人们摆脱繁杂的程序代码。MATLAB图像处理工具箱提供了丰富的图像处理函数,灵活运用这些函数可以完成大部分图像处理工作,从而大大节省编写低层算法代码的时间,避免程序设计中的重复劳动。MATLAB图像处理工具箱涵盖了在工程实践中经常遇到的图像处理手段和算法,如图形句柄、图像的表示、图像变换、二维滤波器、图像增强、四叉树分解域边缘检测、二值图像处理、小

波分析、分形几何、图形用户界面等。但是,MATLAB也存在不足之处限制了其在图像处理软件中实际应用。首先,强大的功能只能在安装有MATLAB系统的机器上使用图像处理工具箱中的函数或自编的m文件来实现。其次,MATLAB使用行解释方式执行代码,执行速度很慢。第三,MATLAB擅长矩阵运算,但对于循环处理和图形界面的处理不及C++等语言。为此,通应用程序接口API和编译器与其他高级语言(如C、C++、Java等)混合编程将会发挥各种程序设计语言之长协同完成图像处理任务。API支持MATLAB与外部数据与程序的交互。编译器产生独立于MATLAB环境的程序,从而使其他语言的应用程序使用MATLAB。

1.6 常见的数字图像应用软件有哪些?各有什么特点?

答:图像应用软件是可直接供用户使用的商品化软件。用户从使用功能出发,只要了解软件的操作方法就可以完成图像处理的任务。对大部分用户来说,商品化的图像应用软件无需用户进行编程,操作方便,功能齐全,已经能满足一般需求,因而得到广泛应用。常用图像处理应用软件有以下几种:

1.PHOTOSHOP:当今世界上一流的图像设计与制作工具,其优越性能令其产品望尘莫及。PHOTOSHOP已成为出版界中图像处理的专业标准。高版本的PHOTOSHOP支持多达20多种图像格式和TWAIN接口,接受一般扫描仪、数码相机等图像输入设备采集的图像。PHOTOSHOP支持多图层的工作方式,只是PHOTOSHOP的最大特色。使用图层功能可以很方便地编辑和修改图像,使平面设计充满创意。利用PHOTOSHOP还可以方便地对图像进行各种平面处理、绘制简单的几何图形、对文字进行艺术加工、进行图像格式和颜色模式的转换、改变图像的尺寸和分辨率、制作网页图像等。

2.CorelDRAW:一种基于矢量绘图、功能强大的图形图像制作与设计软件。位图式图像是由象素组成的,与其相对,矢量式图像以几何、色彩参数描述图像,其内容以线条和色块为主。可见,采用不同的技术手段可以满足用户的设计要求。位图式图像善于表现连续、丰富色调的自然景物,数据量较大;而矢量式图像强于表现线条、色块的图案,数据量较小。合理的利用两种不同类型的图像表现方式,往往会收到意想不到的艺术效果。CorelDraw是当今流行的图像处理软件中为数不多的特点明显、功能强大的基于矢量绘图的软件包。利用它,可以方便地制作精美的名片、贺卡、书签、图书封面、广告、宣传画等作品。

3.ACDSee:快速、高性能的看图程序,是目前最享盛名的图片浏览器。它能广泛应用于图片的获取、管理、浏览和优化,支持BMP、GIF、JPG、TGA、TIF等超过50种常见的图形文件格式,图片打开速度极快,可以直接查看动画GIF,处理如Mpeg之类常用的视频文件,还可以为每一个目录建立一个相册。ACDSee可以从数码相机和扫描仪高效获取图片,并进行便捷的查找、组织和预览。ACDSee还是得心应手的图片编辑工具,轻松处理数码影像,拥有去红眼、剪切图像、锐化、浮雕特效、曝光调整、旋转、镜像等功能,还能进行批量处理。

1.7 讨论数字图像处理的主要应用。进一步查找资料,写一篇关于你感兴趣的应用方面的短文。

答:图像处理的应用几乎渗透科学研究、工程技术和人类社会生活的各个领域。教师可以分组对学生布置以下6个方面的课题,通过阅读参考文献、网络资源等手段写数字图像处理的主要应用的短文,并安排交流机会。

1.航天和航空技术方面的应用 2.生物医学工程方面的应用 3.通信工程方面的应用

4.工业自动化和机器人视觉方面的应用 5.军事和公安方面的应用 6.生活和娱乐方面的应用

第2章 图像的数字化与显示

2.1 设图像的大小为32×32的图标,每个像素有16种颜色,共有多少种不同的图标?如果每100万个可能的图标中有一个有意义,识别一个有意义的图标需要1秒钟,则选出所有有意义的图标需要多长时间?

解:16

32×32

/10= 16

6 1024

/10=1.044×10

61227

s

可见随机图像的复杂度是非常高的。

2.2 扫描仪的光学分辨率是600×1200线,一个具有5000个感光单元的CCD器件,用于A4幅面扫描仪,A4幅面的纸张宽度是8.3英寸,该扫描仪的光学分辨率是多少dpi?

解:(1)600×1200线,其中前一个数字代表扫描仪的横向分辨率,后一数字则代表纵向分辨率。

(2)dpi是指单位面积内像素的多少,也就是扫描精度 ,目前国际上都是计算一英寸面积内像素的多少。光学分辨率是扫描仪的光学部件在每平方英寸面积内所能捕捉到的实际的光点数,是指扫描仪CCD 的物理分辨率,也是扫描仪的真实分辨率,它的数值是由CCD的像素点除以扫描仪水平最大可扫尺寸得到的数值。

每一个感光单元对应一个像素。由于CCD感光单元个数为5000, 5000/8.3=602 (dpi)

3

第3章 图像变换

3.1 二维傅里叶变换的分离性有什么实际意义?

解:该性质表明,一个二维傅里叶变换可由连续两次一维傅里叶变换来实现。实现的方法如下图所示:

3.2 图像处理中正交变换的目的是什么?图像变换主要用于那些方面?

解:正交变换可以使得图像能量主要集中分布在低频率成分上,边缘和线信息反映在高频率成分上。因此正交变换广泛应用在图像增强、图像恢复、特征提取、图像编码压缩和形状分析等方面。

3.3 在MATLAB环境中,实现一幅图像的傅里叶变换。 解:MATLAB程序如下: A=imread('rice.tif'); imshow(A); A2=fft2(A); A2=fftshift(A2);

figure,imshow(log(abs(A2)+1),[0 10]) ;

3.4 利用MATLAB对一幅512×512的图像进行DCT变换,并保留256×256个DCT变换系数进行重构图像,比较重建图像与原始图像的差异。

解:MATLAB程序如下:

RGB = imread('pout512.bmp'); I = rgb2gray(RGB); J = dct2(I);

J(1:512,256:512) = 0; J(256:512,1:256)=0; K = idct2(J);

imshow(I), figure, imshow(K,[0 255])

3.5 离散的沃尔什变换与哈达玛变换之间有那些异同?

解:哈达玛(Hadamard)变换和沃尔什(Walsh)变换的变换核都是由1,-1组成的正交方阵。它们不同的地方在于变换矩阵的行列排列次序不同。哈达玛变换每行的列率排列是没有规则的,沃尔什变换的列率是由小到大。

3.6 求N=4对应的沃尔什变换核矩阵。

解: 1111111111111111H????????=?????????? 3.7 什么是小波?小波基函数和傅里叶变换基函数有何区别?

解:小波信号的非零点是有限的。它与傅里叶变换的基函数(三角函数、指数信号)是不同的,傅里叶变换的基函数从负无穷到正无穷都是等幅振荡的。

3.8 为何称小波变换为信号的“电子显微镜”,如何实现该功能?

解:小波变换的伸缩因子的变化,使得可以在不同尺度上观察信号,所以又称电子显微镜。实现小波变换可以应用Mallat的快速算法。

3.9 应用MATLAB设计小波变换程序,该程序能够读入一幅BMP格式的图像,显示该图像和小波变换系数。

解:由读者思考。

3.10 傅里叶变换、加窗傅里叶变换和小波变换的时间-频率特性有什么不同?

解:傅里叶变换使得时间信号变成了频域信号,加窗傅里叶变换使得时间信号变成了时频信号,但是窗口是固定的,小波变换同样变成了视频信号,但是时频的窗口是变化的。

3.11 利用MATLAB进行图像的小波变换,观察小波系数特点。 解:MATLAB程序如下:

X=imread('rice.tif');

[cA1,cH1,cV1,cD1] = dwt2(X,'bior3.7'); subplot(2,2,1); imshow( cA1,[0 900]); title('Approximation A1') subplot(2,2,2); imshow(cH1); title('Horizontal Detail H1') subplot(2,2,3); imshow(cV1); title('Vertical Detail V1') subplot(2,2,4); imshow(cD1);

第4章 图像增强

4.1 图像增强的目的是什么,它包含那些内容?

解:图像增强是指对图像的某些特征,如边缘、轮廓、对比度等进行强调或锐化,以便于显示、观察或进一步分析与处理。图像增强所包含的主要内容如书图4.1。

4.2 已知灰度图像f(x,y)为如下矩阵所示,求经过反转变换后图像g(x,y)。反转变换g=G(f)如图a所示。

图 a

解:

??????????101111101 4.3 直方图均衡,若一个64×64的离散图像,灰度分成8层,其灰度r的值和分布情况如下:

k

请绘制该图像的直方图,并求经过直方图均衡后的图像的直方图。

k 0 1 2 3 4 5 6 7 kr 0 71 72 73 74 75 76 1 kn 560 920 1046 705 356 267 170 72

解:

k k0 0 1 2 3 4 5 6 7 1 72 r 71 72 73 74 75 356 267 76 170 kn 560 920 1046 705 )(krrp 0.14 0.22 0.26 0.17 0.09 0.07 0.04 0.02 ′kS 0.14 0.36 0.62 0.79 0.88 0.95 0.99 ″kS 71 73 k1 1 1 509 0.13 74 74 76 76 76 1061 0.26 1 1 S 71 73 ksn 560 920 1046 )(krsp 0.14 0.22 0.26

4.4 分析说明为什么对数字图像进行直方图均衡化后,通常并不能产生完全平坦的直方图。

解:直方图均衡中:()()0rrsTrprdr==∫??????????

对于上式积分来讲s=1,但是在实际中,)(rpr不是连续的,所以直方图均衡并不会产生完全平坦的直方图。

4.5 设对一幅图像进行了均衡化处理,试证明第二次采用直方图均衡化处理的结果与第一次的结果相同。

解:设第二次直方图均衡后灰度用表示, kw

ΣΣ

=====kiikiskknnnnSTWi00)(

所以第二次的结果和第一次结果相同。

4.6 什么是图像平滑?试述均值滤波的基本原理。

解:为了去除或减弱图像中的噪声,可以对图像进行平滑处理,称为图像平滑。大部分的噪声都可以看作是随机信号,它们对图像的影响可以看作是孤立的。对于某一像素而言,如果它与周围像素点相比,有明显的不同,我们就认为该点被噪声感染了。基于这样的分析,我们可以用求均值的方法,来判断每一点是否含有噪声,并用适当的方法消除所发现的噪声。

4.7 设图像如下表a所示,分别求经过邻域平滑和高通算子锐化的结果。其中边缘点保持不变,邻域平滑掩码取3×3矩阵,即

??????????=11110111181H,高通算子取3×3矩阵,即: ????????

??????????=111181111H

表a

解:邻域平滑的结果:

1 1 3 4 5 2 21/8 26/8 35/8 5 2 22/8 25/8 32/8 5 3 29/8 27/8 25/8 2 4 5 4 1 1

1 1 3 4 5 2 -13 6 5 5 2 2 15 0 5 3 -13 -4 -1 2 4 5 4 1 1 4.8 什么是中值滤波,有何特点? 解:中值滤波是非线性的处理方法,在去噪的同时可以兼顾到边界信息的保留。

中值滤波首先选一个含有奇数点的窗口W,将这个窗口在图像上扫描,把该窗口中所含的像素点按灰度级的升(或降)序排列,取位于中间的灰度值,来代替该点的灰度值。

4.9 设原图像为:2 4 7 4 3 5 4 6 4 4 4,求经过中值滤波后的值,中值滤波取一维的模板如下图b所示,待处理像素的灰度取这个模板中的灰度的中值。边界点保持不变。

解:2 4 4 4 4 4 4 4 4 4

4.10 试分析中值滤波及各种差分算子滤波的计算量、优缺点和适用范围。 解:由读者思考。

4.11 应用MATLAB设计bmp文件格式的图像读取、显示和直方图统计程序。 解:由读者思考。

4.12 应用MATLAB设计图像锐化的程序。

解:由读者思考。

4.13 在MATLAB环境中,完成图像的增亮、变暗处理。 解:MATLAB程序如下:

A=imread('pout.tif'); %读入图像 imshow(A); %显示图像

figure,imhist(A); %显示图像的直方图 J1=imadjust(A,[0.3 0.7],[]); %将图像在0.3×255~0.7×255灰度之间的值通过线性变换映射到0~255之间 figure,imshow(J1); %输出图像效果图 figure,imhist(J1) %输出图像的直方图 J2=imadjust(A,[],[0 0.7]);

%使用此函数,将图像灰度通过线性变换映射到0~255×0.7之间 figure,imshow(J2); %输出图像效果图 figure,imhist(J2) %输出图像的直方图

4.14 在MATLAB环境中,对图像进行去噪处理。 解:参见例4.4

4.15 在MATLAB环境中,对图像进行直方图均衡处理,分析结果。 解:参见例4.3

第5章 图像编码与压缩

5.1 从哪些方面说明数据压缩的必要性?

答:采用数字技术会使信号处理的性能大为提高,但其数据量的增加也是十分惊人的。图像数据更是多媒体、网络通信等技术重点研究的压缩对象。不加压缩的图像数据是计算机的处理速度、通信信道的容量等所无法承受的。

这样的数据率是与当前信息存储介质的容量、计算机的总线速度以及网络的传输率不相匹配的。尽管人们在存储介质、总线结构和网络性能等方面不断有新的突破,但数据量的增长速度远超过硬件设施的提高水平,以上的矛盾仍然无法缓解。

如果将上述图像信号压缩几倍、十几倍,甚至上百倍,将十分有利于图像的传输和存储。可见,在现有硬件设施条件下,对图像信号本身进行压缩是解决上述矛盾的主要出路。

5.2 讨论图像压缩方法的分类及其各自的特点。

答:一般数据压缩按信息损失的程度来分类。见教材图5.2:常见数据压缩技术的分类。 无损压缩:Huffman编码和Shannon编码根据概率分布特性确定码长;游程编码根据连续灰度的游程来确定编码;算术编码随信源数据不断缩小的实数区间,然后用一个与实数对应的二进制码代表被编码的信息;轮廓编码根据相同灰度的区域边界线进行编码。

有损压缩:预测编码根据相邻像素相关性来确定后继像素的预测值,若用差值进行编码则可以压缩数据量;变换编码对原始图像进行正交变换,在变换域进行抽样达到压缩的目的;混合编码将两种编码方法结合起来,如将预测编码与变换编码相结合,以取得更好的效果。

在现代压缩编码方法中,分形编码利用宏观与微观的相似性来压缩数据量,可以获得极大的压缩比。该方法压缩过程的计算量较大,但解压缩很快,适用于图像数据的存储和重现。

模型基编码:一种新型压缩方法。该方法在发送端利用已知且变化慢的场景得到数据量不大的模型参数,在接收端利用综合模型参数恢复原始图像。这一编码方法对于实时实现电视会议等具有显著意义。

图5.2 常见数据压缩技术的分类

5.3 数据没有冗余度能否压缩?为什么?

答:图像数据量大,同时冗余数据也是客观存在的。一般图像中存在着以下数据冗余因素:(1)编码冗余;(2)像素间的相关性形成的冗余;(3)视觉特性和显示设备引起的冗余。

理论上,数据没有冗余度是不压缩的,否则无法解码出原始数据。但在大部分应用场合下采用有损压缩,数据没有冗余度也可以进行压缩。

5.4 如何衡量图像编码压缩方法的性能?

答:一般地,图像压缩应能做到压缩比大、算法简单、易于用硬件和软件实现、压缩和解压缩实时性好、解压缩恢复的图像失真小等。但这些指标对同一压缩方法很难统一,在实际系统中往往需要抓住主要矛盾,全面权衡。常用的图像压缩技术指标有:(1)图像熵与平均码长;(2)图像冗余度与编码效率;(3)压缩比;(4)客观评价SNR;(5)主观评价。图像的主客观两种评价之间存在着密切的联系。但一般来说,客观评价高的主观评价也高,因此在图像编码的质量评价时,首先作客观评价,以主观评价为参考。

5.5 一图像大小为640×480,256色。用软件工具SEA(version 1.3)将其分别转成24位色BMP,24位色JPEG,GIF(只能转成256色)压缩格式,24位色TIFF压缩格式,24位色TGA压缩格式,得到的文件大小分别为:921,654字节;17,707字节;177,152字节;923,044字节;768,136字节。分别计算每种压缩图像的压缩比。

解:不计算较小的文件头和彩色查找表(LTU)的数据量,原始图像的数据量为:

640×480×1 byte=307,200 byte。

经转换后各种格式的压缩比如下:

24位色BMP格式: 307,200/921,654=0.333(增加了冗余度) 24位色JPEG格式: 307,200/17,707=17.35

GIF压缩格式: 307,200/177,152=1.73

24位色TIFF压缩格式: 307,200/923,044=0.333(增加了冗余度) 24位色TGA压缩格式: 307,200/768,136=0.400(增加了冗余度) 5.6 大部分视频压缩方法是有损压缩还是无损压缩?为什么?

答:视频比静态图像数据量更大,同时可压缩的冗余信息更多。大部分视频压缩方法是以人眼感觉无明显失真为依据的,因此采用有损压缩。事实上,视频可以看成是一幅幅不同但相关的静态图像的时间序列。因此,静态图像的压缩技术和标准可以直接应用于视频的单帧图像。另外,利用视频帧间信息的冗余可以大大提高视频的压缩比。

5.7 若图像上任意两像素点的亮度电平值相等或者任意两时刻同一位置上的像素的亮度电平值相等,能够说明上述两种情况下像素相关吗?为什么?

答:不能。像素的空间相关性和时间相关性是以空间和时间的相邻性为基础的。因此,图像上任意两像素点的亮度电平值相等或者任意两时刻同一位置上的像素的亮度电平值相等带有偶然性,不能说明两像素相关。

5.8 根据JPEG算法说明JPEG图像显示时会出现马赛克现象的原因。 答:由于JPEG算法将整幅图像分成若干个8×8的子块,解码也是以子块为单位的,所以块间的解码误差可能反映为方块效应,在视觉上会出现马赛克现象。

5.9 讨论混合编码的优点。

答:混合编码一般指将预测编码与变换编码相结合进行编码的方法。预测编码根据相邻像素相关性来确定后继像素的预测值,若用差值进行编码则可以压缩数据量;变换编码对原始图像进行正交变换,在变换域进行抽样达到压缩的目的;混合编码将两种编码方法结合起来,可以发挥两种编码方法的优点,取得更好的效果。

5.10 有了离散傅里叶及其快速算法FFT,为什么还要提出离散余弦算法DCT及其快速算法?为什么许多视频国际标准将DCT作为帧内编码的基本压缩算法?

答:在所有的变换编码方案中,离散K-L变换是最佳变换,理论价值较高,常常作为对其他变换特性进行评价的标准。但此变换没有快速算法,在工程应用中受到限制。在次最佳变换算法中,DFT和DCT都是常用的变换编码方法,它们分别有快速算法:FFT和FCT。这两种方法相比较,DFT涉及到复数运算,而DCT是实数变换具有十分吸引人的一些特点:它是一种实数变换,计算量较小,其变换矩阵的基向量很好地描述了人类视觉的相关性,且对于大多数图像来说,该变换的压缩性能很接近离散K-L变换,而且其变换矩阵与图像内容无关,另外由于它构造对称的数据序列,避免了在图像边界处的跳跃及所引起的Gibbs效应,并且也有快速算法,因而得到广泛的应用。作为准最佳变换,它已成为一些静态图像、视频压缩国际标准(或建议)中的基本处理模块。JPEG制定了基于DCT的有失真静止图像压缩标准。在MPEG视频编码器中帧内图像(I图像)采用DCT的编码方法。

5.11 为什么二维DCT可以转换成两次一维DCT计算?

答:参考第3章图像变换。二维变换可以分解成两次变换,如先进行变换,再进行列变换,或反之。

5.12 Huffman编码有何优缺点?

答: Huffman编码在无失真的编码方法中效率优于其他编码方法,是一种最佳变长码,其平均码长接近于熵值。但当信源数据成分复杂时,庞大的信源集致使Huffman码表较大,码表生成的计算量增加,编译码速度相应变慢;另外不等长编码致使硬件译码电路实现困难。上述原因致使Huffman编码的实际应用受到限制。

5.13 Huffman编码是最佳编码,为什么还要研究算术编码等其他熵编码算法? 答:题5.12中讨论了Huffman编码的优缺点,其他熵编码方法可以在某些性能上克服Huffman编码的不足。如,虽然算术编码的硬件实现比Huffman编码方法复杂,但对图像的编码测试结果表明,在信源符号概率接近的条件下,算术编码效率高于Huffman编码。

5.14 算术编码有何优点?举例说明其适用范围。

答:在信源符号概率接近的条件下,算术编码效率高于Huffman编码。因此,在扩展的JPEG系统中用算术编码取代了Huffman编码。另外,算术编码除了常见的基于概率统计的模式外,还有自适应模式。在这种模式下,各个符号的初始概率相同,它们依据出现的符号而发生变化。这种模式特别适用于不便于进行符号概率统计的实际场合中。

5.15 用JPEG标准,对于576行×720列的CCIR601建议分辨率的彩色图像, 其亮度分量可分割成多少个子块, 而两个色差分量可分别分割成多少子块?

解:对于576行×720列的CCIR601建议分辨率的彩色图像, JPEG将其亮度分量分割成(576/8)×(720/8)=6480块。两个色差分量都可分割成两组:(576/8)×(360/8)=3240 块。

5.16 JPEG为什么要进行彩色空间转换?

答:JPEG算法处理的是单独的彩色分量图像,所以来自其他彩色空间的图像数据要以JPEG格式保存,需要进行彩色空间的转换,如将RGB空间、YCRCB空间或转换为YUV空间等。 5.17 JPEG的量化表有何作用?

答:量化的目的是为了压缩数据,同时也是图像质量下降的主要原因。所以设计合理的量化器十分重要。在保证图像质量的前提下,为了获得较高的压缩比,JPEG量化器利用人眼的空间视觉特性,相对于高频成分对低频成分采用较小的量化间隔和较少的比特数。又根据人眼对亮度信号比色度信号敏感的原理,对图像的亮度分量和图像的色差分量使用不同的量化表——亮度量化表和色差量化表。量化表的元素即为量化间隔。对于CCIR 601标准电视图像,JPEG标准提供了最佳的亮度和色度量化表。根据不同的应用需要,用户还可以设计或选择其他的量化表。

5.18 JPEG算法中DCT系数采用Z字形重排有何作用?

答:DCT系数左上角(第1行第1列)为直流分量(DC系数),对8×8子块矩阵进行Z字形编排则可将其余的交流分量(AC系数)按“频率”从低到高排列,形成1×64的矢量。这样排列可以增加“0”系数的游程长度,提高压缩效率。

第6章 图像复原

6.1 引起图像退化的原因有哪些?

答:造成图像退化的原因很多,大致可分为以下几个方面: (1)射线辐射、大气湍流等造成的照片畸变。

(2)模拟图像数字化的过程中,由于会损失部分细节,造成图像质量下降。 (3)镜头聚焦不准产生的散焦模糊。 (4)成像系统中始终存在的噪声干扰。

(5)拍摄时,相机与景物之间的相对运动产生的运动模糊。 (6)底片感光、图像显示时会造成记录显示失真。

(7)成像系统的像差、非线性畸变、有限带宽等造成的图像失真。 (8) 携带遥感仪器的飞行器运动的不稳定,以及地球自转等因素引起的照片几何失真。 6.2 常见的图像退化模型包含哪些种类?

答: 从图像信号的产生形式来看,可将退化模型分为连续图像退化模型和连续图像退化模型。

(1)连续图像退化的一般模型如图所示。输入图像f(x, y)经过一个退化系统或退化算子H(x, y)后考虑加性噪声的影响产生的退化图像g(x, y)可以表示为:

g(x, y)= H [f(x, y)]+n(x, y)

如果噪声是乘法性噪声,可以通过对数运算转化为加性噪声的形式,通过同态滤波可以则退化图像可恢复原来的图像。

H(x, y)f (x, y)g (x, y)n (x, y)

图 图像退化一般模型

(2)数字图像处理系统处理的图像是离散图像,所以对连续退化模型的离散化即形成离散图像退化模型。这种模型通常用矩阵代数求解。

根据降质系统的传递函数主要有:

(1)空间非相干成像系统由于衍射限制造成的图像退化模型。 (2)照相机与被摄景物之间的相对运动造成的图像退化模型。

(3)大气湍流造成的图像退化模型。

(4)由于成像系统的非线性、飞行器的姿态、高度和速度变化等引起的不稳定与不可预测的几何失真,造成的几何畸变模型。

6.3 用维纳滤波的方法进行图像复原,不同的PSF对复原效果有什么影响?

解:用维纳滤波的方法进行图像复原,不同的PSF参数值对复原效果影响较大。模糊函数可能是高斯函数或运动模糊函数等。教材中以运动模糊为例,对不同的PSF参数值产生的复原效果进行比较。复原结果见教材图6.3(a)。实际应用过程中,真实的PSF通常是未知的,需要根据一定的先验知识对它进行估计,再将估计值作为参数进行图像复原。图6.3分别显示了使用较“长”和较“陡峭”的PSF后所产生的复原效果,由此可见PSF的重要性。

6.4 用约束最小二乘方滤波复原时,不同的噪声强度、拉氏算子的搜索范围和约束算子对复原效果有何影响?

解:DECONVREG函数提供了使用平滑约束最小二乘滤波算法对图像去卷积的功能。调用格式如下:[J LAGRA] = DECONVREG(I,PSF,NP,LRANGE,REGOP)。其中,I假设为真实场景图像在PSF的作用下并附加噪声的图像,NP为噪声强度,J为去模糊的复原图像。LRANGE(拉氏算子的搜索范围)、REGOP(约束算子)为改善复原效果的可选参数。LRANGE指定搜索最佳拉氏算子的范围,缺省值为[10,10]。返回值LAGRA为在搜索范围的Lagrange乘子。如果LRANGE为标量,则该算法假定LAGRA已经给定且等于LRANGE, 因而NP值可以不予考虑。REGOP的缺省值为平滑约束Laplacian算子。教材例6.2说明采用平滑约束的最小二乘复原的具体实现方法。不同的复原图像效果比较见图6.5、图6.6、图6.7。通过这些图像可以分析各个参数对图像复原质量的影响。实际应用中,读者可以根据这些经验来选择最佳的参数进行图像复原。

6.5 盲去卷积方法中,如何选择一个合适的PSF值? 解:对具有加性噪声的模糊图像作盲图像复原的方法一般有两种:直接测量法和间接估计法。MATLAB提供了DECONVBLIND函数进行盲图像复原。该函数采用最大似然算法对模糊图像进行去卷积处理,返回去模糊的图像和相应的点扩散函数PSF。

6.6 除了本书所介绍的图像复原方法,还有哪些新兴的图像复原技术?

答:二维卡尔曼滤波图像复原、在小波变换域内实现图像的超分辨率复原、基于偏微分方程图像复原技术等。

6.7 对于一些常用的图像复原方法,如何用MATLAB去实现? 解:参见教材附录B中表B-5提供的4个图像复原函数。

-9

9

第7章 图像分割

7.1 什么是阈值分割技术?该技术适用于什么场景下的图像分割? 解:可用一个灰度级阈值T进行分割,分割出目标区域与背景区域,这种方法我们称为灰度阈值分割方法。通常用于图像中目标和背景具有不同的灰度集合:目标灰度集合与背景灰度集合。

7.2 边缘检测的理论依据是什么?有哪些方法?各有什么特点?

解:边缘检测这是基于幅度不连续性进行的分割方法。通常采用差分、梯度、拉普拉斯算子及各种高通滤波处理方法对图像进行边缘检测。

7.3 基于图像边缘的算子分割技术的理论根据是什么?

解:通过差分、梯度、拉普拉斯算子及各种高通滤波处理方法对图像边缘进行增强,然后再进行一次门限化的处理,便可以将边缘增强的方法用于边缘检测,最后根据边缘来进行图像分割。

7.4 什么是区域?什么是图像分割?

解:区域可以认为是图像中具有相互连通、一致属性的像素集合,图像分割就是指把图像分成互不重叠的区域并提取出感兴趣目标的技术。

7.5 什么是Hough变换?试述采用Hough变换检测直线的原理。

解:霍夫变换的基本思想是点-线的对偶性。图像变换前在图像空间,变换后在参数空间。在图像空间中的直线上的每一个点都会映射到参数空间中的相同参数,所以只要找到这个参数就可以找到图像空间中的直线。Hough变换就是根据这个原理检测直线的。

7.6 对下面的图像采用基于区域灰度差进行区域增长,给出灰度差值T①=1;T②

=2;T③=3三种情况下的分割图像。

1 0 4 7 5 1 0 4 7 7 0 1 5 5 5 2 0 5 6 5 2 2 5 6 4

解:

1 1 2 3 4 1 1 2 3 3 1 1 2 2 2 1 1 2 2 2 1 1 2 2 2

1 1 2 2 2 1 1 2 2 2 1 1 2 2 2 1 1 2 2 2 1 1 2 2 2

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

7.7 应用Matlab语言编写对一幅灰度图像进行边缘检测、二值化的程序(检测和二值化的方法可以根据实际图像进行选择)。

解:由读者思考。

7.8 用4连通或8连通准则,判断如下图像中的目标。

1 1 1 0 0 0 0 0 1 1 1 0 1 1 0 0 1 1 0 0 1 1 0 0

1 1 0 0 0 1 1 0 0 1 0 0 0 0 1 0 1 0 1 0 0 0 1 0 1 1 1 0 0 1 1 0 1 1 1 0 0 0 0 0

解:四邻域:L4 =

1 1 1 0 0 0 0 0 1 1 1 0 3 3 0 0 1 1 0 0 3 3 0 0 1 1 0 0 0 3 3 0 0 1 0 0 0 0 3 0 2 0 2 0 0 0 3 0 2 2 2 0 0 3 3 0 2 2 2 0 0 0 0 0

八邻域:L8 =

1 1 1 0 0 0 0 0 1 1 1 0 2 2 0 0 1 1 0 0 2 2 0 0 1 1 0 0 0 2 2 0 0 1 0 0 0 0 2 0 1 0 1 0 0 0 2 0 1 1 1 0 0 2 2 0 1 1 1 0 0 0 0 0

7.9 Hough变换检测直线时,为什么不采用y=kx+b的表示形式?

解:使用等式y=px+q表示一条直线带来的问题是,当直线接近垂直时,直线的斜率接近无限大。解决这一难点的一种方法是使用极坐标直线方程:

θθρsincosyx+=

7.10 设计一个利用Sobel算子、Roberts算子、高斯算子与形态算子进行边界检测的程序,比较各边界检测算子检测的视觉效果与运算量。

解:由读者思考。

第8章 彩色图像处理

8.1 如何表示图像中一点的彩色值?颜色模型起什么作用?

答:图像中一点的彩色值颜色三维空间中的一个点来表示,每个点有三个分量,不同的颜色空间各分量的含义不同。

颜色模型规定了颜色的建立、描述和观察方式。颜色模型都是建立在三维空间中的,所以与颜色空间密不可分。

8.2 色调、色饱和度和亮度的定义是什么?在表征图像一点颜色时,各起什么作用? 答:HSV模型由色度(H),饱和度(S),亮度(V)三个分量组成的,与人的视觉特性比较接近。HSV颜色模型用Munsell三维空间坐标系统表示。

色调(H)表示颜色的种类,用角度来标定,用-180~180或0~360度量。 色饱和度(S)表示颜色的深浅,在径向方向上的用离开中心线的距离表示。用百分比

0

0

0

0

来度量,从0%到完全饱和的100%。

亮度(V)表示颜色的明亮程度,用垂直轴表示。也通常用百分比度量,从0%(黑)到100%(白)。

8.3 为什么有时需要将一种颜色数据表示形式转换为另一种形式?如何由RGB数值计算HSV数值?

答:实际应用中常用的颜色空间很多,有RGB、HSV、HSI、YUV、YIQ等。目前常用的颜色空间可分为两类,一类是面向硬设备的,比方说彩色显示器、打印机等,另一类面向以彩色处理为目的的应用,面向硬设备的最常用的颜色空间是RGB颜色空间,而面向颜色处理的最常用颜色空间是HSI颜色空间以及HSV颜色空间。针对不同的应用目的采用不同的彩色空间可能更合适,因此,有时需要将一种颜色数据表示形式转换为另一种形式。

由RGB数值计算HSV数值的方法,参见教材公式(8.2)~(8.2)。 8.4 当R=0,G=0,B=1时,在HSI空间求H和S值。 解:根据公式(8.8)有:

12πarccos()4.189(rad)2H=??=,S=1,13I=

8.5 什么是彩色的减性模型和加性模型?哪一种模型更适合用于显示、图片和打印场合?

答:由三基色混配各种颜色通常有两种方法:相加混色法和相减混色法。相加混色和相减混色的主要区别表现在以下三个方面:

(1)相加混色是由发光体发出的光相加而产生的各种颜色,而相减混色是先有白色光,然后从中减去某些成份(吸收)得到各种颜色。

(2)相加混色的三基色是红、绿、蓝,而相减混色的三基色是黄、青、品红。也就是说,相加混色的补色就是相减混色的基色。

(3)相加混色和相减混色有不同的规律。 彩色电视机显示的颜色是通过相加混色产生的。而彩色电影和幻灯片等与绘画原料、打印机打印图片等是通过相减混色产生各种颜色的。

8.6 哪个颜色空间最接近人的视觉系统的特点? 答:在许多实用系统中,大量应用的是HSV模型,这个模型是由色度(H),饱和度(S),亮度(V)三个分量组成的,与人的视觉特性比较接近。该模型的重要性在于:一方面消除了亮度成分V在图像中与颜色信息的联系,另一方面色调H和饱和度S分量与人的视觉感受密切相关。基于人的视觉系统的颜色感觉特性,这些特征使HSV模型成为一个研究图像处理的重要工具。

8.7 为什么在某些场合下要进行彩色量化?彩色图像的量化的依据是什么?

答:彩色空间的连续空间。如果对连续空间进行适当的量化后再计算,则计算量要少得多。如在实际处理中,需要将HSV三个分量进行量化以减少特征值的数量。

8.8 抖动技术是如何利用只能显示较少颜色的设备重现含有丰富色彩图像的? 答:抖动法是一种利用仅能重现较少颜色种类的设备来显示含有丰富色彩图像的有效的方法。产生抖动图像可以有多种方式,但是基本原理都是一样的:采用能直接显示其色彩的像素模式来替换那些其色彩不能直接显示的像素。抖动技术利用了空间混色原理——人的肉眼能将两种不同颜色的相邻像素融合成第三种颜色。

8.9 讨论伪彩色在云图绘制和显示等气象领域的应用。

解:卫星云图是地面接受到的来自气象卫星的云况图片。按气象卫星取得云况的仪器不同,可分为可见光卫星云图和红外卫星云图。若某地上空为一片晴空区,卫星观测到的,是从地面发向太空的红外辐射信息,表现为黑灰色;黑色越深,表示地面辐射越强,气温越高,天气越晴好。当某地上空有云雨覆盖,卫星观测到的,则是从云顶发向太空的红外辐射信息,

表现为白色或灰白色;颜色越白,表示地面辐射越弱,气温越低,云系越厚越密实,降雨强度也就越大。晴空区与云雨区之间的过渡区,则为深灰、灰、浅灰色云系,表明有不同厚度的云而无明显降水。

医学图像的种类包括X光图像、同位素图像、核磁共振图像、超声波图像、红外线图像以及显微图像等。对这些图像作对比度增强或伪彩色等的处理可帮助医生诊断疫病。

8.11 讨论假彩色和伪彩色的差异。 答:假彩色处理的对象是三基色描绘的自然图像或同一景物的多光谱图像。对自然图像,假彩色的处理方法之一是将人们所关注的目标物映射为与原色不同的假彩色,即原有的彩色图像变换成给定彩色分布的图像。而伪彩色增强是将灰度或单一波段的图像变换为彩色图像,从而把人眼不能区分的微小的灰度差别显示为明显的色彩差异,更便于解译和提取有用信息。彩色图像中的彩色根据黑白图像的灰度级或其他图像特征(如空间频率成分)人为给定。

8.12 讨论彩色图像增强与灰度图像增强的关系。

答:在真彩色增强中,尽管对R、G、B各分量(相当于三个灰度图像)直接使用对灰度图的增强方法可以增加图像中可视细节亮度,但得到的增强图像中的色调有可能完全没有意义。这是因为在增强图中对应同一个像素的R、G、B这三个分量都发生了变化,它们的相对数值与原来不同了,从而导致原图像颜色的较大变化,且这种变化很难控制。灰度图像增强技术有助于研究彩色图像增强技术,但彩色图像增强特别需要注意增强后图像的色调和色饱和度的满意度。

第9章 数学形态学及其应用

9.1 数学形态学主要包括哪些研究内容?

答:数学态学图像处理的基本思想是利用结构元素作为“探针”在图像中不断移动,在此过程中收集图像的信息、分析图像各部分间的相互关系,从而了解图像的结构特征。结构元素的选择十分重要,根据探测研究图像的不同结构特点,结构元素可携带形态、大小、灰度、色度等信息。不同点的集合形成具有不同性质的结构元素。由于不同的结构元素可以用来检测图像不同侧面的特征,因此设计符合人的视觉特性的结构元素是分析图像的重要步骤。用形态学算子及其组合来进行图像形状和结构的分析及处理,可以解决抑制噪声、特征提取、边缘检测、形状识别、纹理分析、图像恢复与重建等方面的问题。

9.2 基于数学形态学的图像处理有何特点?

答:利用数学形态学进行图像处理有其独有的一些特性:

(1)它反映的是一幅图像中像素点间的逻辑关系,而不是简单的数值关系。 (2)它是一种非线性的图像处理方法,并且具有不可逆性。 (3)它可以并行实现。

(4)它可以用来描述和定义图像的各种集合参数和特征。 9.3 画出用一个半径为r/4的圆形结构元素腐蚀一个r×r的正方形的示意图。

解:根据数学形态学腐蚀的定义:集合A被集合B腐蚀为:A○—B={x:B+x?A}。

图示如下:

9.4 编写一个完整的程序,实现灰值图像的腐蚀、膨胀、开和闭运算,并对一幅图像进行处理,研究其结果。

解:由读者思考。

9.5 设计一个算子可以同时检测图像中的峰和谷。

解:根据高帽变换WHT(f) = f — (f○g) 和低帽变换BHT(f) = (f●g) —f,可得算法如下:

r/4 r/4

半径 为r/4

B r r A

设单位阵为I, I与f 同大小。定义 B=[I- I○g I○g-I] 则 B为所得算子 f*B=[WHT BHT(f)]

所以算子为:[I- I○g I○g-I]

WHT为波峰检测,而BHT为波谷检测。

9.6 讨论数学形态学图像处理的主要应用。进一步查找资料,写一篇关于你感兴趣的应用方面的短文。

答:参考教材10.2节:基于数学形态学的图像颗粒度分析系统。

第10章 数字图像的应用

10.1 从以下的一个专题进行讨论:图像处理在航空航天技术中的应用、图像处理在生物医学中的应用、图像处理在军事中的应用、图像处理在农业中的应用、图像处理在交通监控中的应用、图像处理在机器人技术中的应用、图像处理在虚拟现实中的应用。

解:由读者思考。

10.2 从基本功能、系统结构等方面,构思在身边需要的一种图像处理系统。 解:由读者思考。