1、现代模式识别是在 20 世纪 40 年代电子计算机创造以后逐渐开展起来的。 在更早的时候,已有用光学和机械手段实现模式识别的例子,如在 1929 年 GustavTauschek 就在德国获得了光学字符识别专利。作为统计模式识别根底的多元统计分析和鉴别分析也在电子计算机出现之前提出来了。1957 年 IBM 的 C.K.Chow 将统计决策方法用于字符识别。然而,“模式识别这个词被广泛使用并形成一个领域是在 20 世纪 60 年代以后。模式识别问题指的是对一系列过程或事件的分类与描述,具有某些相类似的性质的过程或事件就分为一类。目前模式识别问题一般可以应用以下 4 种方法进行分析处理:统计模式
2、识别方法、句法模式识别、人工神经网络模式识别、模糊模式识别。模式识别已经在天气预报、卫星航空图片解释、工业产品检测、字符识别、语音识别、指纹识别、医学图像分析等许多方面得到了成功的应用。所有这些应用都是和问题的性质密切不可分的,至今还没有开展成统一的、有效的可应用于所有的模式识别的理论。当前的一种普遍看法是不存在对所有的模式识别问题都使用的单一模型和解决识别问题的单一技术,我们现在拥有的是一个工具袋,我们所要做的是结合具体问题把统计的和句法结构的识别方法结合起来,把统计模式识别或句法模式识别与人工智能中的启发式搜索结合起来,把人工神经元网络与各种以有技术以及人工智能中的专家系统,不确定方法结合
3、起来,深入掌握各种工具的效能和应用的可能性,互相取长补短,开创模式识别应用的新局面。2.3图像模式识别2.3.1图像模式识别的根本概念图像在人类的感知中扮演着非常重要的角色,人类随时随处都要接触图像。据统计,在人类接受的信息中,视觉信息占了 70%以上,也就是常说的“百闻不如一见 。在许多场合,图像所传递的信息比其他任何形式的信息更加丰富和真切。随着数字图像技术的开展和实际应用的需要,出现了另一类问题,就是不要求其结果输出是一幅完整的图像,而是将经过图像处理后的图像,再经过分割和描述提取有效的特征,进而加以判决分类,这就是近 20 年来开展起来的一门新兴技术科学图像识别。它以研究某些对象或过程
4、的分类与描述为主要内容,以研制能够自动处理某些信息的机器视觉系统,代替传统的人工完成分类和辨识的任务为目的。例如要从遥感图像中分割出各种农作物、森林资源和矿产资源等;根据医学图片分析发生病变的细胞形状和颜色判断是否发生癌变;从气象观测数据或气象卫星照片准确预报天气;交通管理系统中应用车牌自动识别技术管理车辆等。因此,在当今社会,图像识别技术已经在各个领域发挥着极其重要的作用。图像识别,简单地说,就是要把一种研究对象,根据其某些特征进行识别并分类。例如要识别写在卡片上的数字,判断它是 0,1,2,9 中的哪个数字,就是将数字图像分成 10 类的问题,因此可以认为,对数字图像进行区别分类其实质就是
5、对图像进行模式识别。这种识别早已存在人们的生活实践中。然而,随着实践活动的扩大、深入和社会化的需要,人们不仅需要识别分类数很多的事物,而且被识别的对象内容也越来越复杂。特别是由于科学技术水平的提高,使得各种不同的研究对象“图像化或“数字化 ,可采用某种技术把考察的对象转换成图片、波形图以及假设干数据,这些数据就可以代表所研究的对象。但是对于模式识别来说,无论是数据、信号还是平面图像或立体景物都是除掉它们的物理内容而找出它们的共性,把具有同一共性的归为一类,而具有另一种共性者归为另一类。图像模式识别是用机器对文字、 图像、 图片和景物等模式信息加以处理和识别,用以解决计算机与外部环境直接通信这一
6、重要问题。其目的就是研制采用某种仪器或设备,自动处理某些信息,代替人完成分类和辨识的任务,并且能够快速而准确地进行图形识别。一般来说,一个图像识别由图像预处理、图像特征提取和图像模式分类三个主要局部组成。前期处理一般是指把图像进行平滑、增强、恢复、边缘检测和分割等操作,其目的是把输入图像简化为分段模式。特征提取是指在满足分类识别正确率要求的条件下,提取图像的主要特征,并按某种准那么尽量选用对正确分类识别作用大得特征,使得用较少的特征就能完成分类识别任务。图像模式分类是最重要的一局部,它是依据所提取的特征,将前一局部的特征向量空间映射到类型空间,把相应图像归属的一类模式。2.3.2图像模式识别的
7、根本方法一个图像识别系统主要由三个环节组成: 图像数据获取, 数据加工和处理、 抽取特征,判断分类等,如图 2-2 所示。图 2-2 图像识别系统框图下面简单对这几个环节作以说明:1、数据获取 来自现实的模拟数据,如图片、照片、图像和景物等由一个传感器如扫描仪、 机、数字摄像机、数码相机传入,然后被转换成适合计算机处理的形式,即将物理量变成一组测量值。2、 数据处理 数据处理包括预处理、 特征抽象和特征选择。 预处理技术包括各种图像处理技术,其目的是改善图像质量,清楚图像中的噪声,减轻或消除因传感器与传输介质本身不完善而引起的退化现象,便于机器分析处理等。特征抽取就是从图像中提取一组反映图像特
8、性的根本元素或数字值。特征选择那么是从已经抽取的特征中选择能够更好地完成分类识别任务的特征来表示原图像。3、 判别分类 判别分类就是采用一定的准那么或机制建立分类规那么, 并用它们对未知图像模式进行分类识别。用于解决图像识别的方法概括起来可分为统计模式识别、 结构模式识别、模糊图像识别和智能模式识别 主要是人工神经网络模式识别 4 类, 前两类方法有久远的历史,开展较为成熟,对解决相应领域中的模式识别问题均有明显的效果,是模式识别分类的经典与根底性技术。 20 世纪 80 年代新兴的人工神经网络,作以一种广义的智能模式识别法,更以崭新的姿态,以其全局相关的特色,在模式识别领域取得了许多传统方法
9、所难到达的成就,下面分别作以介绍:1、统计图像识别:统计图像识别是以概率理论为根底的,模式用特征向量描述,找出决策函数进行模式决策分类。其根本思想是:无论输入的对象是什么,它都表示为一个数组。这数组不是任意的,而是适中选择的、对原始数据进行各种测量的结果。统计图像识别的大致过程如图 2-3 所示。图 2-3统计图像识别系统结构图图中的上半局部是识别局部, 即对未知类别的图像进行分类; 下半局部是分析局部,即由类别的训练样本求出判别函数及判别规那么,进而用来对未知类别的图像进行分类。框图右下角局部是自适应处理局部,当用训练样本根据某些规那么求出一些判别规那么后,再对这些训练样本逐个进行检测,观察
10、是否有误差。这样不断改良判别规那么,直到满足条件为止。2、结构图像识别:结构模式识别是按模式本身的结构和结构关系对物体进行识别的方法。由于它是将现代自然语言分析的形式语言理论句子分解为各种词类,如名词、动词、副词等用于模式识别,所以又称为句法模式识别。其根本思想是:一个复杂的模式可以由一个简单的模式递归地描述。换言之,对于每个复杂的模式,可以用一些较简单的子模式来描述,而每一个比拟简单的子模式再用一些更为简单的子模式来描述,最后用一些最简单的模式基元来表示。句法模式识别框图如图 2-4 所示。图中的上半局部是识别阶段, 即对未知类别的样本进行句法分析并输出分类结果,同时输出待识别样本的结构描述
11、;下半局部是分析阶段,用一些结构信息的模式样本构造出一些文法规那么,以便用这些文法对描述未知模式的句子进行句法分析。图 2-4 句法模式识别系统结构图3、模糊模式识别:模糊模式识别是模糊集理论在模式识别中的应用。人对客观事物的认识带有模糊性,如通常所说的高矮、胖瘦,青年、老年,温和和剧烈等都带有模糊性的语言,人类利用这些模糊语言进行交流,并通过大脑分析和决策。模糊数学就是研究如何利用模糊信息对确定事物进行定量分析。因此,将模糊集理论用于模式识别系统,利用模糊信息进行模式决策分析,使计算机带有接近人类的智能,这是非常重要的研究课题。模糊识别的主要方法有最大隶属原那么识别法、接近原那么识别法和模糊
12、聚类分析法。4、人工神经网络图像模式识别:人工神经网络的研究起源于对生物神经系统的研究。人工神经网络区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解,具有一定的智能化处理的特点。神经网络分类器是一种智能化模式识别系统,虽然神经网络的设计和实现依赖与经验,泛化性能不能确保最优,但是它可以增强系统的学习能力、自适应能力和容错性,具有很强的开展应用前景。神经网络在图像识别中的应用按处理数据类型大致可以分为两类:一类是基于图像像素数据的神经网络算法;另一类是基于图像特征数据的神经网络算法即特征空间的聚类识别算法。基于图像像素数据的神经网络识别技术,是用高维的原始图像数据作为神经网
13、络的训练样本。目前很多神经网络算法是基于像素进行图像识别的,其图像识别的流程图如图 2-5所示。图 2-5 基于图像特征数据的神经网络图像识别流程图基于图像特征数据的神经网络的图像识别技术是用图像的特征数据作为神经网络的训练样本。此类技术中,神经网络作为特征聚类器,有很多的神经网络别研究人员运用,如 BP 神经网络、模糊神经网络、Hopfield 神经网络、RAM 自适应神经网络、SOFM 神经网络、细胞神经网络等。其图像识别的流程图如图 2-6所示。此类技术实际上是传统方法与神经网络技术的结合,它利用人的经验来获取模式特征以及神经网络分类能力来识别目标函数。其图像识别的关键是图像的特征提取必
14、须反映整个图像的特征。图 2-6基于图像特征数据的神经网络图像识别流程图 第三章 各类算法的比拟3.1 基于模板匹配的模式识别分类算法3.1.1 模板匹配的根本概念模板就是一幅的小图像。模板匹配就是在一幅大图像中搜寻目标,该图中有要找的目标,且该目标同模板有相同的尺寸、方向和图像,通过一定的算法可以在图中找到目标,确定其坐标位置。以8位图像(其 1 个像素由 1 个字节描述)为例,模板T( H W个像素)叠放在被搜索图S( mn个像素)上平移,模板覆盖被搜索图的那块区域叫子图Sij。i,j为子图左上角在被搜索图S上的坐标。搜索范围是:1 i W M 1 j H N 通过比拟T和Sij的相似性,
15、完成模板匹配过程。注意:图像的数据是从下到上、从左到右排列的。原始图像S(H, W)和模板Tm, n如以下列图所示: 被搜索图 模板可以用下式衡量T和Sij相似性:当模板和子图完全一样时,相关系数R( i, j ) = 1。在被搜索图S中完成全部搜索后,找出R的最大值Rmax( im, jm ),其对应的子图Simjm即为匹配目标。显然,用这种公式做图像匹配计算量大、速度较慢。另一种算法是衡量T和Sij的误差,其公式为:E( i, j )为最小值处即为匹配目标。为提高计算速度,取一个误差阈值E0,当E( i, j ) E0时就停止该点的计算,继续下一点计算。3.1.2模板匹配算法的matlab实现用matlab实现模版匹配的源程序如下:clear all;close all;clc;img=imread(lena.jpg);imshow(img);img=double(img);mask=double(imcrop();m n=size(img);H W=size(mask);if mod(H,2)=1 H=H+1;endif mod(W,2)=1 W=W+1;endmask=imresize(mask,H W);HH=floor(H/2);WW=floor