1、第 卷 第 期 年 月 北京测绘 引文格式:王晓迪,马伟,陈春希,等 测绘地理信息元数据自动化检查的设计与实践 北京测绘,():,():收稿日期 基金项目 北京市科技计划()作者简介 王晓迪(),男,北京人,大学本科,工程师,从事测绘产品质量检查与验收工作。:测绘地理信息元数据自动化检查的设计与实践王晓迪 马 伟 陈春希 闫庆庆 董 帅(国家测绘产品质量检验测试中心,北京)摘 要 测绘地理信息元数据是一种描述测绘地理信息数据的数据,包含数据的表示、覆盖范围、质量、空间和时间模式、空间参考系和分发等信息,覆盖项目设计、数据生产、质量检查、项目验收全流程。作为一项重要的成果数据,其对数据的生产、说
2、明、使用和分析管理有重要的指导作用。如果元数据不精确,则使用相关数据时就会存在质量问题。测绘地理信息元数据生产中,相关标准与具体项目需求和成果需求相结合时通常会存在一定差异,因此不易实现质量检查的自动化。目前其质量检查多采用人工检查的方式,检查效率及准确度受人为影响。本文在分析其内容和特点的基础上,将其分为四类,结合四类元数据的特点提出了以模板为基础的自动化检查方法,在基础性地理国情监测、基础测绘成果、数字高程模型成果检查等项目中得到了实践应用,对提高测绘地理信息元数据检查的效率及准确率有一定意义。关键词 测绘地理信息元数据;分类;自动化检查;模板中图分类号 文献标识码 文章编号()引言元数据
3、(),即数据的数据,是关于数据和信息资源的描述性信息。测绘地理信息元数据是关于地理空间相关数据和信息资源的描述性信息。它不仅是对数据简单的描述或索引,更关系到数据成果的最终应用。生产者通过其记录测绘地理信息数据说明;使用者利用其了解测绘地理信息数据的基本特征;管理者通过其可以对测绘地理信息数据进行有效的管理和利用;检查者通过其了解生产过程,并将其与相应成果数据对照检查。测绘地理信息元数据的质量关乎数字地理信息成果的应用及共享。其生产正确、应用正确,是相应数据成果的质量保障。因此,对测绘地理信息元数据的检查至关重要。本文结合测绘地理信息元数据的内容与特点及检查要求对其内容分类。分析检查内容与方法
4、,针对每类元数据提出相应的自动化检查方案,为高效、准确地完成测绘地理信息元数据质量检查提供参考。测绘地理信息元数据内容特点与检查方法 内容测绘地理信息元数据主要包含以下内容:()记录相应数据成果的名称。项目名称、产品生产单位名称、参考资料名称等。()描述相应数据成果的属性。比例尺、数据格式、影像分辨率等。()固定相应数据成果的位置。经纬度坐标范围、图廓角点坐标、中央子午线等。第 卷 第 期王晓迪,马伟,陈春希,等 测绘地理信息元数据自动化检查的设计与实践()关联相应数据成果的精度。高程中误差、平面位置中误差等。()标示相应数据成果的进程。质量检查情况、外业调绘核查情况、完成日期等。特点测绘地理
5、信息元数据主要有以下特点:()内容不完全固定。具有一定的规律性,但其内容广泛,随相应成果数据变化而变化,因此,并非所有内容都是固定的。其在不同测区的中央子午线、参考资料名称等内容不尽相同。()贯穿全流程。生产贯穿其相应成果数据生产全流程,全面反映其相应数据历程及状况。()生产方式人机结合。有规律、重复的内容可通过软件自动化生产。存在变量的内容需要人工输入,如图名、成果数据量、平面位置中误差及高程中误差等。检查方法根据基础地理信息数字产品元数据:以及项目技术设计要求,按数字测绘成果质量检查与验收:中规定内容,检查元数据项及元数据各项内容错漏。检查内容如表 所示。表 元数据检查内容检查项检查依据检
6、查元数据组织正正确性、符合性项目技术设计检查元数据可读性及完整性生产软件检查元数据坐标系统、格式、文件命名、文件存储正确性项目 技 术 设 计 及 生 产软件检查元数据内容正确性、完整性项目技术设计测绘地理信息元数据生产人工输入易出错,同理,利用人工检查的方式也弊端凸显,效率低下且易产生人为误差。依靠软件全过程自动化检查难以实现,主要原因有以下两点:()测绘地理信息元数据的形式与内容具有多样性,常规的基础地理信息数字产品(产品)元数据内容可参考基础地理信息数字产品元数据:标准,但是难以满足不断涌现的新型数字测绘成果元数据的需求。()不同项目的需求不同,对测绘地理信息元数据也有不同的数据规定,根
7、据自身项目的特点扩展规则复杂。如地理国情监测元数据层中若只包含对地表覆盖分类数据内业采集情况的说明,不包括其他内容,则扩展元数据层名称为。测绘地理信息元数据分类测绘地理信息元数据包含多方面内容,生产方式多样,因此单一的、通用的检查方法难以满足检查者的需要,应以不同的方法分类应对。这就需要对测绘地理信息元数据内容进行分类,而相关标准 及地理信息 元数据:中未对其分类进行明确规定。相关内容中,对元数据的分级侧重于从使用者的角度需要了解元数据的详细程度;从生产者的角度对数字栅格地图、数字正射影像图、数字高程模型和数字线划图四种成果对应的测绘地理信息元数据的内容和格式进行了详细要求,未对这四类元数据各
8、自的内容进行分类。结合测绘地理信息元数据内容及相关标准,按近年来国家重大测绘地理信息项目对测绘地理信息元数据的质量要求,依据其检查方法,可分为以下四种情况:部分项中相同的、具有一定规律性的内容可与项目设计要求的固定填写内容对照;坐标值、中央子午线等内容需按公式计算后与被检元数据项比对;误差、精度等值要通过关联误差统计表来查看;质量问题描述内容依据实际检查情况整理形成。因此,从检查者的角度可将测绘地理信息元数据内容分为四类:()固定类。具有相同参数即相同内容的元数据项,如比例尺、产品生产单位名称、数据格式、项目名称等。实例如:基础性地理国情监测元数据中 层(数据生产单位)。()计算类。利用对应的
9、图号、图幅等信息进行计算得到的元数据项,如根据标准分幅图号,可以计算得到对应的经纬度坐标、图廓角点坐标、中央子午线等;依据数据计算得到的分北京测绘第 卷 第 期辨率等。实例如:基础性地理国情监测元数据中 层(平面位置中误差、高程中误差)。()关联类。从已存在的元数据项或其相应成果数据中读取并录入有关的元数据项。如数据精度、生产日期、平面位置中误差等。计算类与关联类相同之处是每个图号、景号等信息对应唯一的计算类和关联类元数据项,不同之处是计算类可以由其他元数据项(如标准分幅图号)进行计算而得到,关联类必须借助生产过程中其他的记录文件而获取。()描述类。前三类测绘地理信息元数据项填写的内容值是相对
10、确定的,可以通过程序进行计算或读取相关记录文件而得到。而描述类元数据项主要是根据元数据项定义的要求,对数据变量表达的内容用简洁明确的语言进行描述。实例如:基础性地理国情监测项目中,元数据成果中 层(外业调绘核查情况)中“问题及处理意见”一项,对外业调绘核查中遇到的问题及处理的意见进行描述,不同的问题及处理意见对应不同的描述。测绘地理信息元数据自动化检查 检查模板检查模板,是在元数据内容分类的基础上,依据不同项目设计要求进行元数据项的扩展及字段定义不同的约束条件形成的对元数据内容要求的集合(图)。具体包括,元数据项及元数据内容、类型、计算公式、枚举值、阈值、逻辑关系等。通过以检查模板为驱动的检查
11、,实现元数据完整性、正确性以及逻辑性的检查。图 基于四类检查模板的自动化检查方法()对于固定类的测绘地理信息元数据项,在检查模板中输入正确的固定类元数据项内容,读取被检查的元数据与元数据检查模板中的内容进行一致性的比对检查,内容一致为正确,反之为错误。()对于计算类的测绘地理信息元数据项,在对应的检查模板中需读取其他相关元数据项,如标准图号等,计算得到此类元数据项的正确值,与被检查的元数据值进行比对检查。()关联类的测绘地理信息元数据项在检查过程中无法读取生产过程中的记录文档来进行检查,因此,制定检查模板项时,可采用设置阈值或逻辑判断的方法。阈值检查法适用于元数据项存在限值的情况,逻辑判断法是
12、利用元数据项之间的逻辑关系来进行判读。阈值检查法通过内设阈值,与被检查的元数据项进行比对,在其阈值范围内为正确,反之为错误。如 元数据中“高程中误差”项,若比例尺为 ,且为山地,根据标准基础地理信息数字成果 数字高程模型:.中规定,高程中误差小于.即为合格成果,因此在制定此项检查模板时,需要结合“比例尺”项内容(元数据中无地形类别项),设定限值.为阈值(在无法判读地形类别情况下,按照 比例尺 最大高程中误差限值设定),与被检查项进行比较,填入的地理信息元数据项大于 且小于.为正确,反之为错误。逻辑判断法是利用多个地理信息元数据项之间的逻辑关系检查。如某项目中,“二级检查完成日期”,需用“一级检
13、查完成日期”与“验收日期”元数据项所填写的日期之间的逻辑关系判断。二级检查完成日期必定在一级检查完成日期与验收日期之间,如果填写的日期在这个范围内为正确,反之为错误。()描述类测绘地理信息元数据项存在不确定性,没有统一的标准或参考,难以通过上述方法完成检查。需设置必要关键字,利用模糊查找的方法与必要关键字进行比较,排除部分内容后再使用人机交互的方法进一步检查。如基础性地理国情监测元数据成果中 层(外业调绘核查情况)中“问题及处理意见”一项,可设置“已处理”“已修改”等必要关键词,与被检查元数据项进行模糊查找,排除无必要关键词的元数据,将筛选出的疑似正确项结合人工检查进一步判定其是否正确。检查流
14、程设计以各类元数据项对应得检查模板为基础的第 卷 第 期王晓迪,马伟,陈春希,等 测绘地理信息元数据自动化检查的设计与实践自动化检查流程,包括模板制作、元数据读写、元数据检查、结果展示四个部分。()模板制作。检查模板以相关标准为基础,兼容如、等格式。根据不同项目、不同成果类型,按照项目要求进行个性化的调整编辑、配置参数,实现模板属性项结构定义的增加、修改、删除及相关项的计算、设置阈值、关联等功能。()元数据读写。设置元数据读写端口,打开被检元数据,加载制定好的对应的模板。()元数据检查。按表 设置检查项,分为自动检查项和交互检查项。自动检查项主要涉及元数据组织、可读性、格式、命名、存储、坐标系
15、统和部分元数据内容检查。交互检查项主要涉及元数据内容检查,主观性高于自动检查项。被检元数据匹配模板对应检查项执行检查步骤。()结果展示。实现对结果的浏览、空间分析、排查操作,包括放大、缩小、属性选择、定位问题出处等功能,以便核查。检查流程如图 所示。图 检查流程 检查实例 检查概况地理国情项目,成果中含有元数据成果,为必查项。对元数据成果进行检查,采用自动化检查及人机交互的方式,对元数据项错漏及元数据项内容错漏进行检查,分析其组织、命名、个数、顺序是否正确。主要质量问题()元数据中有多种参考资料的,填写时未用“”隔开。属于固定类测绘地理信息元数据项错误,模板中按技术规定要求设置填写格式,自动化
16、检查后显示在检查结果界面,无须进一步排查。()元数据缺少图层。属于固定类测绘地理信息元数据项错误,模板中按技术规定要求设置层名,自动化检查后显示在检查结果界面,无须进一步排查。结束语测绘地理信息元数据是测绘地理信息数字产品中的一项重要成果,它全面反映了其相应成果数据生产过程、数据状况等信息。本文对测绘地理信息元数据项进行分析,总结出固定类、计算类、关联类、描述类这四类元数据项,并结合上述四类元数据项的特点,制定自动化检查的方案,实践证明本方案可行且通用,可有效提升各类元数据质检效率和成果质量。为取得更好的质量控制效果,自动化检查方案还需不断优化、扩展,例如:加入质量评价流程,对在结果展示流程核查后确保无异议的检查结果进行统计分析,输出检查记录表及评分表;在完成质量评价流程后实现元数据内容和结构的自动修复。在今后的质检工作中,还需继续深入研究,形成完整的元数据自动化检查评估体系。参考文献 黄梦龙 基于元数据的地理信息数据中心成果集成方法研究 测绘与空间地理信息,():李爽 基础测绘产品元数据及附属产品的快速自动化生产 测绘与空间地理信息,():王汉财 基础测绘元数据检查方法探析 长春工程