中国50年的图像处理和模式识别发展 下载本文

中国50年的图像处理和模式识别发展

我们感知的信息超过80%来自于我们的视野。随着需求和信息可用性的日益增加,执行图像分析和理解也就更为紧迫。因此,图像识别,已演变成人工智能的一个重要分支。它涉及分析、描述、认识和解释模式,对象或嵌入图像中的行为。

在中国,图像识别研究开始在20世纪60年代(一个图像识别的历史一般概述,请参见侧栏的“一个图像识别的历史概述”)。在其早期阶段,在美国普渡大学教授国王孙富,在他的资助下发展很大。20世纪80年代,中国著名学者,如蔡资兴、戴汝为、徐光佑下工作富asvisiting学者。1981年,中国成为国际协会模式识别(IAPR)的正式成员,并举行了第一次模式识别和机器情报全国会议。1984年,中国的研究人员着手建立模式识别国家重点实验室。中国出版模式识别与人工智能的第一个问题是在1987年出版。从那时起,中国许多关于物体识别和模式分析的教科书出版,大大提高了中国人的图像识别研究。例子包括民德程图像识别、模式识别、圻扁和他的的同事们;计算机视觉与模式识别,郑南宁计算机视觉松德马云和他的的同事们。

中国研究人员赶上国际同行仍然有很长的路要走。然而,在过去的50年,中国取得了许多进展,尤其在基础研究和实际应用方面。 基础研究

图像识别的基本理论来源于模式识别。在20世纪80年代,戴汝为和石青云在中国进行了综合统计和句法模式识别方法的研究。他们的研究已经使得模式识别在中国的研究普遍起来。

在20世纪80年代中期,戴相龙介绍了人工神经网络知识和工程应用研究。运用人工神经网络的学习,模式识别、联想记忆和形象思维,他提出一个统一的模式描述和知识表示。此外,他提出了一个集成基于物理符号处理,定性物理,知识可视化,和人工神经网络的各种模型的知识系统设计。

20世纪90年代以来,中国科研人员在高维数据判别分析方面已取得显著成效,尤其是小的数据集,包括线性判别分析(LDA)和判别分析的Kullback- Leibler距离(KLDA)。与此同时,中国研究人员在立体视觉摄像机标定和立体匹配问题方面取得重要进展。此外,2DPCA(主成分分析)和2DLDA2D功能,如提取方法在中国起源于本世纪初。一些研究人员很快就适应了这些方法。在2002年,在高维空间点分布分析,提出仿生模式识别。模式不同于传统的基于数据分区的识别,仿生模式识别集中模式的理解。

应用

在图像识别的初期,中国这一领域的研究应用很少。然而,经过几十年的发展,中国的研究人员已在图像识别的应用方面取得了显著成绩。

光学字符识别

光学字符识别(OCR)程序,包括图像采集、图像预处理、版面分析、文本行分割、特征提取、字符识别和后处理(见图1)。对于任何字符识别方法,它的提取字符图像类相关的功能,最关键的是提取相关特征从字符到最大限度地相互信息。然而,这是一个挑战,由于许多因素,包括大量的字符,噪声,不同的字体,各种字符类型和复杂的文件布局。

中国首次应用字符方面的图像识别研究,然而,中文OCR的研究产生了一些相关的结果,直到20世纪60年代,中国的研究人员才开始对数字、英文字母和符号识别的初步研究。当时,胡启恒和她的同事在中国科学院院士研制出第一个实用的邮件分拣机在数字手写识别技术的基础上。

在20世纪70年代末,研究者开始对汉字字符识别。在20世纪80年代初,国荣轩和他的同事们开始了计算机视觉的开拓性的研究和中国字符识别。中文字符识别的研究始于1986年,以获得其收获。许多研究机构,如清华大学,中国科学院自动化研究所,西安交通大学,河北大学,和南开大学,相继推出了中国的OCR产品。

中国的研究人员已经几乎解决了印刷的中文字符识别相关的问题。他们已经开发出许多技术,来分析和理解扫描文档图像,涉及多国语言,不同的字体,和复杂的布局。

研究人员还提出在联机和脱机手写体汉字字符识别的进展。(网上的方法使用在识别过程中的钢笔的运动信息;离线方法没有,因此一般都比较困难)在20世纪90年代初,戴和他的同事开发HangWang笔系统,其性能相比,是毫不逊色的最先进的系统。清华大学的丁小青和她的团队在1992年,根据国内863计划,推广先进技术,开发TH-OCR系统(TH是清华大学缩写)。该系统实现了传统的中文字符99.8%的精度。此外,它还含有中文和英文文本文件。

在TH- OCR系统的基础上,2001年,由丁和吴有寿领导的中国工程院一个研究小组开发了一个高性能的认识系统,理解和重建文件的日本,韩国,和中国。它的整体性能已接近国际先进水平。清华大学与北京荣通IT,已推出了一系列先进的商业OCR软件。这些产品的例子使TH - OCR产品和文通TH - OCR数据进厂(见图2)。这些产品在国内和国外的OCR市场销售。

安全

高效,可靠的身份认证技术的安全是至关重要的。由于固有的问题如身份证,护照,和密码(例如,容易伪造身份证)进行身份验证的传统方法,生物特征识别和认证技术已引起人们的注意。图3显示了一个典型的生物认证系统框架。 广泛研究的生物特征包括指纹,虹膜,人脸,掌纹,手形,耳朵形状。这些功能通过图像采集由传感器输入识别系统。图像识别算法,在这样的系统中发挥关键作用。中国是进行相关研究的首批国家之一。

在20世纪80年代初,施和她的同事提出,指纹方向图,一套快速的指纹类型的分类和准确提取指纹中心,三角,形态和细节算法,在有效的指纹匹配算法的基础上,有或无中心的情况下,他们开发了一种先进的指纹自动识别系统(AFIS)。这样的系统,已在香港和深圳报关和监督的港口使用,并已在一些公司用来监视员工考勤。

人脸识别是人类视觉系统的最重要和最基本的职能之一,是人类沟通的基础。人脸识别作为生物特征识别的关键技术,在图像识别中的一个活跃的研究课题。中国研究人员已经实现了一系列重要成果。清华大学丁和她的同事已经开发出一种高度准确的面部识别系统,以及进行国际公开评价。斯坦Z. Li和他的同事们在中国科学院院士设计了一种基于近红外成像人脸识别系统。应对在图像采集与特征提取的照明问题,他们已经大大提高了人脸识别系统的精度和鲁棒性。 中国的许多机构已经建立大规模人脸图像数据库的人脸识别识别算法的研究和评价提供重要的数据源。图4显示了来自西安交通大学的东方脸库(www. aiar.xjtu.edu.cn/团体/面/中国/首页page.htm)的观点数据库的图像。使用的观点数据库,郑和他的同事们提出合并脸部(M面),一个统一的外观,逼真的面部建模的数学框架(见图5)。M -面可以产生情感的面部属性,在旋转的意见。

身份认证的最终解决方案可能是多式联运的生物认证技术,集成了不同的特点和识别方法。中国科学院科学自动化研究所已在这一领域进行了大量研究。其成就的范围从图像采集设备识别算法,图像处理,模式分类,并从数据资源的性能评价和应用示范。其相关的研究,特别是在人脸识别,指纹识别,虹膜识别,代表了中国在这一领域研究的最高水平。他们还通过与国内和国外公司合作推出自动化的个人识别方面的许多先进商业项目。

交通运输

智能交通系统(ITS)研究的目的是通过电脑控制,人工智能和通讯技术实现智能交通。当前ITS应用的监测和分析拍摄场景的环境和交通状况。基于图像处理和识别的方法已成为一个热门的研究课题。中国的车辆牌照,自治区车辆自动识别等领域的研究人员取得了显著成就。

任何牌照识别系统必须找到实时输入图像的许可证,以便它可以自动提取和识别的牌照号码和字符。一般来说,这个过程涉及三个密切相关的步骤:车辆牌照位置,特征提取,车牌识别。每一步都必须得到很好的落实,以确保系统的整体性能。

中国车辆牌照识别的研究始于20世纪80年代中后期。在1991年,在西安交通大学的郑和他的同事开发出一种早期的高性能机器视觉系统自动识别车辆类型和许可证。在这一领域的许多商业产品已经在中国推出,包括汉王眼,从中国科学院科学院自动化研究所,并从亚洲视觉技术公司,深圳市吉通电子公司,众志交通电子公司产品。

自主汽车在中国的研究始于20世纪80年代中后期。1989年,国防科技学者大学智能汽车的研究。在2000年,他们开发了一个结构化的环境,达到每小时75.6公里的无人驾驶汽车。西安交通大学,清华大学和浙江大学进行类似的研究。图6显示了在西安交通大学的自主汽车的制度框架。 工业

自动化可以显着提高工业生产率和效率。由于图像识别技术的许多优点,如间接接触,速度,可重复性和鲁棒性,,它已成为在工业自动化生产控制系统的关键。许多行业,如电子,汽车,纺织和印刷,使用的质量检查和测量,评价和排序的产品,环境工业机器人的感知图像识别等目的。

近几十年来,中国的研究人员已经成功地开发各种基于图像的在线质量检验和测量系统。在1999年,天津大学和南京依维柯汽车有限责任公司在863计划的支持下,开发依维柯白车身视觉三维激光检测系统(见图7)。(白车身的意思是“白色的机身”汽车的钣金焊接在一起,但没有被添加其他组件。)系统,大大提高自动车体检查,制造了第一台自动汽车制造阶段三维激光测量系统在中国的整车。

在2003年,郑和他的同事们成功开发了在线监测和精简啤酒瓶质量检验的硬件系统(见图8)。该系统可以检测所提出的字母“B”啤酒瓶上的日期,97%的精度小于0.15秒。