1、- Page 1- 基于双目立体视觉的距离测量 摘 要 立体视觉技术是机器人技术研究中最为活泼的一个分支,是智能机 器人的重要标志。双目立体视觉是通过对同一目标的两幅图像提取、识 别、匹配和解释,重建三维环境信息的过程。主要包括:视频捕获、摄 像机定标、图像预处理和特征提取、立体匹配以及三维重建。通过对双 目立体视觉技术的进一步研究,对多目视觉具有重要的启发,为解决智 能移动机器人、工业装配机器人、家用机器人、公共效劳机器人的视觉 问题奠定良好的技术根底。 计算机立体视觉的主要研究内容是由多幅二维的平面图像恢复出 被摄物体的三维坐标,而其中基于两幅图像的双目视觉技术那么是一个研 究热点。双目立
2、体视觉的根本原理是模仿人眼与人类视觉的立体感知过 程,从两个视点观察同一景物,以获取不同视角下的感知图像,通过三 角测量原理计算图像像素间的位置偏差,以获取景物的三维信息。 一个完整的双目视觉系统通常可分为图像获取、摄像机标定、特征 提取、立体匹配、目标定位和深度图生成等六大局部。本论文主要是图 像特征提取、立体匹配这两方面的内容展开研究。首先根据选择的立体 视觉成像系统模型阐述了立体视觉测距的根本原理。其次,对图像特征 提取等预处理方法进行详尽地分析,通过实例对算法进行实验。同时, 对图像匹配问题涉及的内容包括图像匹配方式、质量控制策略等进行了 总结。最后,以特征提取与图像匹配研究为根底,针
3、对不同类型的立体 图像提出了基于图像边缘特征和图像兴趣点的匹配方法。 关键词:立体视觉摄像机定标特征提取立体匹配深度图 - Page 4- 长春理工大学硕士学位论文原创性声明 本人郑重声明:所呈交的硕士学位论文,基于双目立体视觉的距 离测量是本人在指导教师的指导下,独立进行研究工作所取得的成果。 除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经 发表或撰写过的作品成果。对本文的研究做出重要奉献的个人和集体, 均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人 承当。 作者签名:整垄三!显年王月丝日 长春理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“
4、长春理工大学硕士、博士 学位论文版权使用规定,同意长春理工大学保存并向国家有关部门或 机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授 权长春理工大学可以将本学位论文的全部或局部内容编入有关数据库 进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论文。 作者签名:垒垄丝2旺月鱼日 - Page 5- 第一章 绪论 11引言 视觉是人类观察世界、认知世界的重要功能手段,人类感知外部世 界主要通过视觉、触觉、听觉和嗅觉等感觉器官,其中80的信息是 由视觉获取的,机器视觉是人类利用计算机实现人的视觉功能一对客观 世界三维场景的感知、识别和理解,机器视觉是一个相当新而且开展迅
5、速的研究领域,机器视觉技术正广泛地应用于各个方面,许多人类无法 感知的场合,如危险场景感知等,机器视觉更突显其优越性。机器视觉 属于影像的重构技术,具有非接触性测量、实施简易的特点,具有广阔 的应用前景,是有待于进一步开发的领域。 计算机视觉被认为是计算机科学和人工智能的一个分支,计算机视 觉就是用机器代替人的眼睛和大脑,对客观世界进行感知和解释的技 术。该系统的首要目标是使计算机具有通过一幅或者多幅二维图像认知 周围的三维环境信息的能力。这种能力不仅可以使计算机能够感知三维 环境中物体的几何信息,并且能够对它们进行描述、存储并使用图像来 创立和恢复现实世界模型,从而到达认知现实世界的目的。因
6、此,自从 计算机视觉这门科学出现以来就成为计算机科学的重要研究领域之一 并且开展十分迅速。 现实世界中的物体都是三维的,人眼所获得的景物图像却是二维 的,但是人类的视觉系统能够很容易地从二维图像中感知三维世界,获 得三维世界的信息。机器人视觉的研究目标就是使机器人具有通过一幅 或多幅图像认知周围环境信息的能力。这种能力不仅使机器人能感知环 境中物体的几何信息,如其形状、位置、姿态、运动等,而且能对它们 进行描述、存储、识别与理解。机器人视觉系统的根本结构如图11所 刁隋。 图像 低层处理 位置与形状 物体描述 图11机器人视觉系统根本结构 - Page 6- 12国内外研究现状、开展趋势 12
7、1国内外研究现状 立体视觉的开创性工作是从60年代中期开始的。70年代末,Marr 创立的视觉计算理论对立体视觉的开展产生了巨大影响,现已形成了从 图像获取到最终的景物可视外表重建的完整体系,在整个计算机视觉中 已占有越来越重要的地位。 现在,国际上以计算机视觉为主题,或主要以计算机视觉为主题的 国际会议有国际计算机视觉会议(ICCV),国际模式识别会议(ICPR),国 际计算机视觉与模式识别会议(CVPR),欧洲计算机视觉会议(ECCV)与 亚洲计算机视觉会议(ACCV)。以计算机视觉为主要内容之一的国际刊物 Journal TransOn 也很多,有International ofComp
8、uter Vision,IEEE PAMI, CVGIP(Computer Vision,Graphics and Image Processing),VisualImage Computing,UPRAI(Intemational Joumal of PaUem Recognition and Artificial Intelligence),PatternRecognition等,每年的研究论文不下数千 篇,发表的论文也数以百计。在Marr理论的框架下,取得了一大批科 研成果,也包括数据结构、算法层次上的各种算法和在硬件实施方面的 一些实验系统。但这些理论、方法、算法在实际应用中并没有产生
9、能完 全取代人的视觉系统。 双目体视目Iii主要应用于四个领域:机器人导航、微操作系统的参 数检测、三维测量和虚拟现实。在国外,日本大阪大学自适应机械学院 研制了一种自适应双目视觉伺服系统,实现了对运动方式未知的目标的 自适应跟踪。日本东京大学将实时双目立体视觉和机器人整体姿态信息 集成,开发了仿真机器人动态行走导航系统。日本冈山大学使用立体显 微镜、两个CCD摄像头、微操作器等研制了使用立体显微镜控制微操作 器的视觉反响系统,用于对细胞进行操作,对钟子进行基因注射和微装 配等。麻省理工学院计算机系提出了一种新的用于智能交通工具的传感 器融合方式,由雷达系统提供目标深度的大致范围,利用双目立体
10、视觉 提供粗略的目标深度信息,结合改良的图像分割算法,能够在高速环境 下对视频图像中的目标位置进行分割。 在国内,浙江大学机械系完全利用透视成像原理,采用双目体视方 法实现了对多自由度机械装置的动态、精确位姿检测:东南大学电子工 程系基于双目立体视觉,提出了一种灰度相关多峰值视差绝对值极小化 立体匹配新方法,可对三维不规那么物体(偏转线圈)的三维空间坐标进 行非接触精密测量。哈工大采用异构双目活动视觉系统实现了全自主足 球机器人导航。火星863方案课题“人体三维尺寸的非接触测量,采 2 - Page 7- 用“双视点投影光栅三维测量原理,由双摄像机获取图像对,通过计 算机进行图像数据处理,不仅
11、可以获取服装设计所需的特征尺寸,还可 根据需要获取人体图像上任意一点的三维坐标。 122开展趋势 20世纪70年代中期以Matt、Barrow和Tenenbaum等人为代表的 一些研究者提出了一整套视觉计算的理论来描述视觉过程,其核心是从 图像恢复物体的三维形状。在视觉研究的理论下,以Marr的理论影响 最为深远,并成为这一领域的主导思想IlJ。马尔教授认为:视觉可分为 三个阶段。第一阶段是早期视觉(early vision),其目的是拍取观察者周 围景物外表的物理特性,如距离、外表方向、材料特性(反射、颜色、 。纹理)等,具体来说包括边缘检测、双目立体匹配、由阴影确定形状、 由纹理确定形状等
12、。第二阶段是二维半简图(25D sketch)或本征图像 (Intrinsic Image)。它是在以观察者为中心的坐标系中描述外表的各种特 性。根据这些描述,可以重建物体边界,按外表和体积分割景物。但在 以观察者为中心的坐标系中只能得到可见外表的描述,得不到遮挡外表 的描述,故称二维半简图。第三阶段是三维模型一视觉信息处理的最后 一个层次,是用二维半简图中得到的外表信息建立适用于视觉识别的三 维形状描述。这个描述应该与观察者的视角无关,也就是在以物体为中 心的坐标系中,以各种符号关系和几何结构描述物体的三维结构和空问 关系。 经过近三十年的开展,在马尔的理论框架下,机器人立体视觉取得 了一大
13、批成果。但随着机器人立体视觉研究的不断深入,大们发现了马 尔视觉理论的局限性,即从景物图像或系列图像求出景物精确的三维几 何场景并定量确实定景物中物体的性质时遇到了困难121。在Marr的理 论中,输入是被动的,给什么图像系统就处理什么图像,整个处理过程 根本上是“自底向上的,没有反响。处理的目的是不变的,总是要求 出场景中物体的形状和它们的空I日J位置和关系。其理论强调表示的重要 性以及从不同层次上去研究信息处理问题,在计算理论和算法实现上又 特别强调计算理论的重要性。这些理论多数是建立在对人类感知三维信 息分析的根底上。尽管这些方法在数学上是可行的,但由于各种干扰的 存在以及逆成像的问题,使得问题本身是病态的。 进入80年代中后期,随着移动式机器人立体视觉研究的开展,大 量运用空间几何的方法以及物理知识来研究双目立体视觉,其主要是完 成对道路和障碍的识别处理。这一时期引入主动视觉的研究方法,并采 3 -