数字图像处理技术基础知识
第二章 数字图像处理技术基础知识
数字图像处理(Digital Image Processing)又称为计算机图像处理,它是指利用计算机对图像信号进行处理的过程。数字图像处理技术起源于20世纪20年代,当时通过海底电缆从英国的伦敦到美国的纽约采用数字压缩技术传输了第一幅数字照片。此后,由于遥感等领域的应用,使数字图像处理技术逐步受到关注并得到相应的发展。第3代计算机问世后,数字图像处理技术开始得到普遍应用,其中比较突出的成就是CT的发明与应用,获得了诺贝尔奖。目前,数字图像处理科学与技术发展迅速,成为很多领域和学科的学习和研究对象。
2.1 数字图像相关概念 2.1.1数字图像
数字图像是由像素组成的二维矩阵。对于单色即灰度图像而言,每个像素的亮度用一个数值来表示,通常数值范围在0—255之间,即可以用一个字节来表示,0表示黑、255表示白,而其他表示灰度。
一般来说从客观景物得到的图像是二维的,可以用一个二维数组f(x,y)来表示,这里x与y表示二维空间中一个坐标点的位置,而f(x,y)则是代表图像在点(x,y)的某种性质的数值。为了能用计算机对图像进行加工,需要把连续的图像在坐标空间(x,y)和性质空间F都离散化,这种离散化以后的图像就是数字图像,图像中的每个基本单元叫做图像元素,简称像素。一幅图像必须在空间和灰度上都离散化才能被计算机处理,空间坐标的离散化叫做空间采样。假设用一个m×n维的数组中等距的采样来近似表示一幅连续图像f(x,y),即:
f(x,y)=
(2-1)
其中每个元素都是一个离散变量,式(2-1)等号右侧的矩阵代表数字图像,数组的每个元素即对应像素。由此可见,计算机对图像的处理实际上是对组成图像的像素进行操作。
彩色图像可以用红、绿、蓝三元组的二维矩阵来表示。通常,三元组的每个数值也是在0—255之间,0表示相应的基色在该像素中不存在,而255则代表相应的基色再改像素中取得最大值,这种情况下每个像素可用3个字节来表示。
- 5 -
数字图像处理技术基础知识
数字图像在计算机中进行存储时有多种存储格式,比较常见的有BMP、JPG、GIF、TGA、TIF等格式。其中BMP文件是windows操作系统推荐使用的图像文件格式并且被广泛使用,它是将内存或显示器的图像数据不经过压缩而直接按位存储,故而称为位图文件。从客观景物得到的图像在计算机中存储时都是默认存储为BMP格式,其它格式的图片都是将BMP文件通过压缩等变换后转化而来的,因此BMP文件被称为图像处理的基础格式文件。由于BMP文件是采用位映射方式进行存储,除了图像深度可选以外,不进行其它任何形式的压缩,因此BMP文件所占用的内存空间较大。但是这种特殊的存储方式非常有利于对图像进行各种形式的处理,所以本系统采集的图像都是以BMP格式进行存储。
BMP文件由位图文件头、位图信息和像素数据3部分组成,位图信息又是由位图信息头和调色板组成,如图2-1所示。其中,位图文件头、位图信息头是固定长度,分别为14和40字节,调色板数据的多少与图像所用的色彩数有关,它的字节数是色彩数的4倍,但真彩色图像的BMP文件中没有调色板数据。每个调色板单元的前3字节分别表示彩色的蓝、绿、红分量,第4字节备用。像素数据则存储在最后面。
位图文件头(14字节) 位图信息 位图信息头(40字节) 调色板数据(8、64或1024字节) 真彩色图像无调色板 像素数据
图2-1 BMP文件图像结构
在实际使用中,BMP文件又分为DDB格式和DIB格式两种。DDB格式,即Device Dependent Bitmap,是与设备有关的文件格式,用其存储与某个显示设备或打印设备内存兼容的不压缩图像,但由于其依赖于硬件设备,因此并不常用;DIB格式,即Device Independent Bitmap,是与设备无关的文件格式,它本身自带有颜色信息,颜色表管理非常容易,具有极强的通用性。
2.1.2图像处理
在研究图像时,首先要对获得的图像信息进行预处理,包括滤去干扰、噪声,做几何及色彩校正等,这样可以提高图像的信噪比。为了从图像中找到需要识别
- 6 -
数字图像处理技术基础知识
的东西,还得对图像进行分割,也就是进行定位和分离,以分出不同的东西。有时由于信息微弱,无法识别,还需要进行增强。增强的作用是提供一个能满足一定要求的图像,或对图像进行变换,以便人机分析。同时,为了给观察者以清晰的图像,还要对图像进行改善,即进行复原处理,它是把已经退化了的图像加以重建或恢复,以便改善图像的保真度。在实际处理中,由于图像信息量非常大,在存储及传送时,可能还需要对图像信息进行压缩。
上述这些工作必须用计算机进行,因而还要进行编码工作。编码的作用是用最少数量的编码位(亦称比特)表示单色和彩色图像,以便能更有效地传输和存储图像。
以上所叙述的都属于图像处理的范畴。概括起来,图像处理包括图像编码、图像增强、图像分割、图像复原、图像压缩等内容。对图像处理环节来说,输入的是图像,经过处理,输出的也是图像。图像处理的目的主要是在于解决两个问题:一是判断图像中有无所需要的信息;二是确定这些信息是什么。
2.1.3图像识别
图像识别是对处理后的图像进行分类,确定类别名称。它可在分割的基础上选择需要提取的特征,并对某些参数进行测量,再提取这些特征,最后根据测量结果做分类。为了更好地识别图像,还要对整个图像作结构上的分析和描述,以便对图像的主要信息得到解释和理解,并通过许多对象相互间的结构关系加深对图像的理解,以便更好地帮助识别。所以图像识别是在上述分割后的每个部分中,找出它的形状和纹理特征(即特征抽取,有时候也包括图像分割),以便对图像进行分类,并对整个图像做结构上的分析。对图像识别环节来说,输入的是图像(一般是经过上述处理后的图像),输出的是类别和图像的结构分析,而结构分析的结果则是对图像的描述,也是对图像重要信息的理解和解释。
这里要注意的是,图像分割不一定完全在图像处理是进行,对有些问题,要一面进行分割,一面进行识别。所以说,图像处理和图像识别是相互交叉的。
2.1.4图像理解
图像理解是一个总成。上述图像处理的最终目的就在于对图像作描述和解释,以便最终理解它是什么图像。图像理解是在图像处理和图像识别的基础上,再根据分类作结构语法分析,去描述图像和解释图像。因而图像理解包括图像处理、图像识别和图像结构分析等内容。
2.2图像的获取、显示与表示
图像获取是图像的数字化过程,显示则是将数字图像转化为适合人们使用的格式。
- 7 -
数字图像处理技术基础知识
2.2.1图像的获取
图像获取就是图像的数字化过程,也是将图像采集到计算机中的过程,它主要涉及成像及模数转换(A/D Converter)技术。随着计算机与微电子特别是固体城乡设备即电耦合设备CCD(Charge Coupled Devices)的快速发展,使得图像获取设备的成本显著降低,因而越来越普及,不久的将来也可能将成为高档微机的内置设备。
以CCD技术为核心,目前图像获取设备有黑白摄像机、彩色摄像机、扫描仪、数码相机等,性能与价格主要取决于CCD的规格尺寸等。除了这些常见的设备外,目前有许多厂商提供各种其他的专用设备,如显微摄像设备、红外摄像机、告诉摄像机、胶片扫描仪等。此外,遥感卫星、激光雷达等设备也能提供其他类型的数字图像。
目前,图像的数字化设备可分为两类,一类是基于图像采集卡或是图像卡将模拟制式的视频信号(RS170/CCIR黑白电视信号、PAL/NTSC彩色电视信号、S-Video视频信号等)采集到计算机,另一类是摄像机本身带有数字化部件可以直接将数字图像通过计算机端口(如并口、USB接口)或标准设备(如磁盘驱动器)传送给计算机。
图像卡仍是目前专业中常用的图像数字化设备,目前低端的图像采集卡一般不具有图像帧存体,二是直接将图像采集到计算机的内存中以供处理,高端的图像卡是集采集和处理于一身的非标准配件,具有帧存体和数字信号处理器DSP及邻域处理器NOA,用于开发高速或实时处理应用。此外,还有一类普及型的多媒体视频采集卡。最后,还应提到的是一类多媒体应用中使用的压缩卡。
近年来,数码相机及数码摄像机技术迅猛发展,由于不需要其他数字化设备的支持,且具有更高的分辨率及编辑、使用方便等特点,有望逐步取代目前模拟摄像机的地位。
下面列出图像中的若干专业术语:
1、CCD:电荷耦合器件,可看成间隔很小的MOS电容器、单片阵列构成的移位寄存器,它通过充电积累电荷。
2、A/D、采样、量化。
3、Video信号、同步、信噪比SNR。
4、电视制式、帧、场、隔行(Interlace)扫描、宽高比(Aspect Ratio)。 5、扫描仪:分辨率dip (dot per inch)。 2.2.2图像显示
图像显示是将数字图像转化为适合人们使用的形式,便于人们观察和理解。早期的图像处理设备一般都有专门的图像监视器供显示专用,目前一般直接用计
- 8 -