大学本科毕业论文(设计)
域都保留下来,对于倾斜度的正确估计十分不利。经检验,它只在文字区域集中于某一范围且水平时比较准确,使用范围狭窄。另外,一些传统的定位技术在复杂背景、图像变形、噪声污损严重的情况下,也无法准确定位。为此,一些学者们从一些数学工具着手,利用数学形态学、小波分析、遗传算法等方法对一些传统定位方法进行改进。数学形态学的基础是腐蚀和膨胀以及由此产生的开、闭运算。传统的灰度图像中敲开、闭运算具有“削峰填谷”的功能,可以将目标区域显示出来,但同时也将大量非目标区域显示出来。上海交通大学的晏建华、赵正校提出了基于属性开运算的汽车牌照区域定位算法,通过对灰度图像采用属性开运算,削去满足特定属性的峰部,确定出目标以及少量非目标区域,然后计算出图像的倾斜角及目标区域所在范围;华南理工大学的戴青云和广东工业大学的余英林提出基于小波与形态学的车牌图像分割方法,这种方法通过小波多尺度分解提取出纹理清晰,具有不同分辨率、不同方向的边缘子图像,其中水平方向低频、垂直方向高频的这一分量,主要代表车牌的目标区域。然后,用数学形态学方法对小波分解后的细节图像进行一系列的形态运算,进一步消除无用信息和噪音,以找准车牌位置;南京理工大学的是湘全等人提出了利用遗传算法对图像进行优化搜索,结合区域特征矢量构造的适应度函数,寻找到牌照区域的最佳定位参量。 以上介绍的方法是基于灰度图像的车牌定位方法,也是传统的图像处理技术与车牌特征的有机结合,然而无论是摄像机还是扫描仪,给人以全新感受的还是丰富多彩的彩色图像。人类视觉系统对彩色非常敏感,能够很好地区分出上万种不同的颜色,而且彩色图像不仅令人在视觉感受上比灰度图像舒服,更重要的是它能够提供更多的图像信息。由于牌照多具有不同的色彩,且多与牌号、车身、车辆背景不同,因此考虑基于颜色来研究车牌的分类定位应该说是车牌识别领域的一种新思路。
近年来,在这方面做出尝试的有上海交通大学的赵雪春等人,他们提出了一种采用色彩分割及多级混合集成分类器的车牌自动识别方法。这种方法的主要思想是通过三层MLPN网络将具有均匀色度空间的彩色图像进行色彩分割,再利用投影法分割出潜在的各种底色的车牌区域。浙江大学的张引、潘云鹤等人也对彩色汽车图像牌照定位方法进行了研究。提出了彩色边缘检测算子ColorPrewitt和彩色边缘检测与区域生长相结合的牌照定位算法ColorLP。这种算法简单,而
5
大学本科毕业论文(设计)
且全面作用在颜色空间三个分量上,检测出的牌照区域易于与背景剥离,因此用这种方法定位准确率高,适用于不同的光照,且具有较好的通用性。
上述各种车牌定位方法都具有一定的实用性和参考价值,然而也都具有不完善的一方面,因此有必要对车牌的定位方法进一步的研究。
2 车牌字符识别的研究
车牌字符识别实际上就是对车牌上的汉字、字母、数字进行准确确认的过程。能否准确识别车牌字符,字符识别技术是一个重要因素。字符识别的基本原理是将输入字符与各个标准字符进行模式匹配,计算类似度(或距离),将具有最大类似度(或最小距离)的标准字符作为识别结果。模式匹配是将两个模式的所有对应元素进行比较的操作,相同的模式会得到完全一致的比较结果,不同的模式将得不到完全一致的比较结果。这种基本原理对字符中的变形是很苛刻的,为此,人们通常采用如图1-1所示的包含正规化和特征提取的字符识别流程。其中正规化和特征提取是人们研究和讨论的焦点。
输入 正规化 特征抽取 模板匹配 字符输出 图1-1 字符识别流程
Fig.1-1 Character Recognition Process
在字符识别中较难处理的是汉字识别。汉字识别技术是在英文、数字识别的基础上首先由日本学者开始研究的。并于1977年完成了日本通产省制定的“图像信息处理系统”中的印刷汉字识别装置,该装置是一个庞大的硬件专用设备,可识别2000个汉字,识别速度达到100字/秒。80年代中期,日本的汉字识别技术己相当成熟,并由东芝、三洋、三菱、松下等公司的以软件为主并使用通用高档微机的产品走向市场。
我国从70年代末起步,研究汉字识别技术至今已有20多年了。70年代初,我国开始进行数字、英文、符号的识别研究。70年代末,有少数大学和研究所对汉字识别方法进行了探索,发表了一些论文,研制出少量模拟识别软件或系统。80年代中期,汉字识别技术进入了研究的高潮,印刷体汉字识别技术研究获得了丰硕的成果。有11个单位进行了14次印刷体汉字识别的成果鉴定。进入90
6
大学本科毕业论文(设计)
年代,在国家重点科研计划的支持和市场驱动下,汉字识别系统一直朝着不断改进系统功能和实用化的方向发展。今天,印刷体汉字识别己有四五个系统(例如北京信息工程学院研制的SI-OCR,清华大学研制的TH-OCR, 国家智能计算机研究开发中心研制的NC-OCR,台湾研制的丹青OCR等)近万套在国内外使用。它们能识别常用的4000多个不同体、不同号的汉字,识别率达到95~99%,使用高档微机时识别速度达到2040字/秒。大陆和台湾研制的联机手写汉字识别实用系统己有10多种(例如中国科学院自动化研究所研制的汉王笔,台湾研制的蒙恬笔等),市场销售量己超过5万套。这些系统能实时识别10000个以上的规整书写的简繁体汉字,笔顺无限制或少限制,少数常用字可以连笔,熟练使用后识别率可达90%以上。
总之,我国印刷体汉字识别和联机手写汉字识别己进入实用阶段,其技术水平和当前世界最高水平并驾齐驱。
车牌字符识别实际上是依附在车牌上的印刷体文字的识别,能否正确识别不仅是文字识别技术的问题,还要考虑其载体车牌区域的影响。车牌字符识别技术是文字识别技术与车牌图像自身因素协调兼顾的综合性技术。
由于摄像机的性能、车牌的整洁度、光照条件、拍摄时的倾斜角度及车辆运动等因素的影响使牌照中的字符可能出现比较严重的模糊、歪斜、缺损或污迹干扰,这些都给字符识别带来了难度。尽管如此,也有大量的学者从事车牌字符识别研究。现已有了一些比较成熟的方法。有基于模板匹配的车牌识别方法,只需提取字符区域特征,避免了字符的分割,能有效地完成低分辨率和模糊的车牌字符识别,但缺点是字符识别时间太长。文献提出了基于模板匹配的车牌字符识别方法,
车牌字符识别的研究在技术上己经取得了很大突破,然而离实用化要求还相差很远,许多新方法仅停留在理论和文章上或者限定在比较狭窄的约束范围内,并不能以产品的形式大范围投入使用。因而车牌字符识别的研究仍然有很长的路要走。
7
大学本科毕业论文(设计)
1绪论
1.1课题的研究背景
随着21世纪经济全球化的到来,高速度、高效率的生活节奏,使车辆普及成为必然趋势,交通管理自动化越来越成为亟待解决的问题。近年来,通信和计算机技术在交通领域的应用受到人们广泛的关注,得到了迅速的发展。我国的公路交通事业正在步入一个信息化、数字化的时代。各种各样的交通系统,如电子警察系统、事故管理系统、道路收费系统、车辆自动识别系统、全球定位系统等等都在为城市交通服务。车辆牌照识别(license plate recognition, LPR)技术成为交通管理自动化的重要手段,其任务是分析、处理汽车图像,自动识别汽车牌号。LPR系统可以广泛用于电子收费、出入控制、公路流量监控、失窃车辆查询和停车场车辆管理等需要车牌认证的重要场合;尤其在高速公路收费系统中,实现不停车收费提高公路系统的运行效率,LPR系统更具有不可替代的作用,因而从事LPR技术的研究具有及其重要的现实意义。
LPR系统中的两个关键子系统是车牌定位系统和车牌字符识别系统。 关于车牌定位系统的研究,国内外学者己经作了大量的工作,但实际效果并不是很理想,比如车牌图像的倾斜、车牌表面的污秽和磨损、光线的干扰等都是影响定位准确度的潜在因素。为此,近来不少学者针对车牌本身的特点,车辆拍摄不良的现象及背景的复杂情况,先后提出了许多有针对性的定位方法,使车牌定位在技术和方法上都有了很大的改善。然而现代交通系统不断提高的快节奏,对车牌定位的准确率和实时性提出了更高的要求,因而进一步加深车牌定位的研究是非常必要的。
车牌字符识别是在车牌准确定位的基础上,对车牌上的汉字、字母、数字进行有效确认的过程,其中汉字识别是一个难点,许多国外的LPR系统也往往是因为汉字难以识别而无法打入中国市场,因而探寻好的方法解决字符识别的问题也是至关重要的。目前己有的方法很多,但其效果与实际的要求相差得很远,难以适应现代化交通系统高速度、快节奏的要求。因而对字符识别的进一步研究也同样具有紧迫性和必要性。
车牌定位与识别的方法,总体来说是图像处理技术与车牌本身特点的有机结合,当然也包括小波分析、神经网络、数学形态学、模糊理论等数学知识的有效
8