1、收稿日期:本文为山东省艺术科学重点课题“档案学视角下青岛茂腔的数字化保护研究”(项目编号:);青岛市哲学社会科学规划项目“数字记忆视阈下青岛非物质文化遗产保护与传承研究 以茂腔戏曲为例”(项目编号:)阶段性研究成果。作者简介:任莉新(),女,硕士,馆员,研究方向为文化遗产数字化;陈喜红,女,硕士,教授,研究方向为声乐;曲绍燕,女,本科,馆员,研究方向为档案管理。非物质文化遗产信息资源知识本体构建研究 以传统戏剧茂腔为例任莉新 陈喜红 曲绍燕(山东科技大学档案馆 山东青岛)(山东科技大学艺术学院 山东青岛)摘 要:目的 意义为解决传统戏剧资源描述语义程度低、关联深度不够等问题,提出基于本体技术的
2、资源组织方式。方法 过程通过以 语义框架为中介的 元数据集成方案,构建传统戏剧领域本体模型,确定领域概念和属性关系。结果 结论选取非遗项目“茂腔”戏剧对构建的本体模型进行实证研究,验证了模型的有效性,并证明了本体技术在资源组织、语义揭示等方面的潜力与优势。关键词:非物质文化遗产;资源组织;本体模型;元数据标准;茂腔戏剧中图分类号:文献标识码:(,)(,):,“”,:;引言非物质文化遗产是传统文化中最脆弱的部分,其无形性和活态性,使与之关联的文化记忆更容易随时间的推移而被人们忽略和遗忘。我国拥有着为数众多的非遗资源,非遗数字化保护工作已初见成效,并带动了非遗数据库、数字资源保护等研究的兴起。但非
3、遗资源的知识传承与利用,并不能仅局限于其数字化的保护与保存,需要借助有效的方法与手段对资源进行合理组织与整合,使非遗资源中的知识内容和文化精髓能够得到传承与延续。传统戏剧是一种历史悠久的综合舞台艺术样式,是我国非遗文化的重要组成部分。传统戏剧涉 年 月 情报探索 第 期(总 期)()及的资源类型多样,内容繁多且组成复杂,过去以非遗某一特征为线索对资源进行线性组织的分类方法,难以揭示资源之间丰富的知识关联,随着非遗保护工作与现代信息技术的融合,利用本体技术、知识图谱等现代理论技术对非遗资源进行组织与揭示,已经成为非遗研究与保护工作的重要内容。本文基于本体的理论和方法,对传统戏剧领域资源涉及的概念
4、应用元数据进行语义描述,选取概念参考模型对领域内概念进行整合,以期全方位揭示出领域资源的知识内容及其相互关系。国内外文献回顾在非遗保护领域,目前国际上比较通用的本体模型或元数据标准有 、等,其中 本体模型应用最为广泛,为文化遗产领域知识共享、信息交换、领域概念共同理解提供了标准化的概念架构,在此模型基础上,国内外研究学者针对不同应用领域进行了相应程度的扩展,并提出了更具针对性的数据模型和语义描述框架。国外学者针对本体及语义网的研究成果较为丰富,除了 模型等相关国际标准以外,有代表性的研究项目主要集中在数字图书馆与博物馆领域,项目实施的目的是通过语义本体技术的应用,实现数字文化资源的多维度语义融
5、合。在非遗领域,国外学者在 模型的基础上,根据不同的应用领域对其进行了扩展。例如:等为解决戏剧媒介的元数据标注问题,针对戏剧元素设计了 综合本体模型,为戏剧知识建立了一个关联的、可以自动推理的戏剧词汇集,并阐释了其语义描述机制以及利用该本体进行戏剧编码的流程;等以传统舞蹈资源为例,创建了拉邦舞本体,并开发了舞蹈信息系统以实现人机交互;学者 等使用多媒体本体语言,构建印度古典舞领域文化遗产的本体,并开发了语义导航环境和查询程序,用于印度舞蹈视频资源的收藏与服务利用。随着我国对非遗数字化保护的重视,诸多学者也尝试将语义网和本体技术应用于非遗领域资源的组织,并取得了一定的研究成果。例如,针对民俗中的
6、传统节日,郝挺雷构建了民族节日领域本体,隗昊、胡骏等构建了泼水节、天河乞讨节等民俗活动的知识本体。在传统中医药领域,本体技术和语义网的应用更为深入:学者对中医药古籍、养生知识和医案知识进行组织,建立了中医药语义网络等知识服务系统,通过语义网络提供知识检索和问答服务。在表演艺术类领域:孙传明构建了民俗舞蹈文化空间的知识本体,开展对撒叶儿嗬的数字化保护实践;翟姗姗以传统戏剧楚剧作为实证研究对象,构建了楚剧资源元数据标准及领域本体,对资源进行了规范化标注,并通过语义关联模型对楚剧领域内各类资源进行了关联数据创建与发布;黄永等以西藏“锅庄”“堆谐”两种舞蹈为例,提出了一种面向非遗保护的知识本体构建系统
7、。相对于国外,国内非物质文化遗产领域本体的研究还处在起步阶段,尤其在传统戏剧领域,目前还没有专门针对该领域的较成熟的知识本体模型,部分本体模型或缺乏对重要资源实体的概念定义,或虽然进行了定义,但组织或标注颗粒度较粗,无法全面体现传统戏剧领域的知识概念,不利于非遗戏剧资源的知识表达、有效利用和传承。传统戏剧领域非遗资源知识本体构建 本体构建原则为保证所建知识本体的规范化、合理化,需要运用科学合理的方法作为指导,因不同行业及领域资源特点的差异性,目前国内外尚未形成统一的操作标准,比较具有代表性的是 提出的五个准则,即清晰性、一致性、可扩展性、最小本体承诺、编码偏好程度最小原则。本文综合考量传统戏剧
8、领域资源特征及现有本体建立的标准,在传统戏剧领域知识本体构建时充分参考上述五个准则,如表 所示。表 提出的五个准则准则意义清晰性知识本体应用自然语言对传统戏剧领域所有的术语都给出明确、客观的语义定义,并能对术语所涉及的内容加以清晰明确的说明一致性知识本体所定义的概念、得出的推论与传统戏剧领域术语本身的含义应该一致可扩展性知识本体构建要能够具有不断修正和逐步改进的特点,本体中添加通用或专用的术语时,不需要修改己有的概念体系,保证知识的同步更新最小本体承诺知识本体对建模对象给出尽可能少的约束,降低本体构建的工作量,在资源整合时,提高互操作的灵活性编码偏好程度最小在本体构建过程中尽可能独立于某种编码
9、语言,要采用不同的知识表示方法,最终实现领域概念的共享 年 月任莉新等:非物质文化遗产信息资源知识本体构建研究第 期(总 期)本体构建方法与流程随着本体研究的不断深入,构建方法也在不断完善,目前使用较多的领域本体构建方法有 法、法、骨架法、法、循环获取法及七步法,上述方法都有各自支持的领域,结合传统戏剧领域文化遗产特点,以及领域本体构建方法在相关技术、应用成熟度及方法细节上比较,本文采用七步法构建传统戏剧领域非遗资源本体并进行实证分析,如图 所示。图 传统戏剧领域本体构建流程 确定本体的专业领域与范畴本文所构建的知识本体,是针对非物质文化遗产中的中国传统戏剧领域,中国传统戏剧领域涉及大量的专业
10、词汇与术语,在构建领域知识本体时,需要对领域相关知识进行分析,确定共同认可的核心概念,并从不同层次上对这些概念以及概念之间的关系进行形式化定义。同时,该领域知识本体的特点是多种艺术形式以一种标准进行聚合,在共同具有的性质中体现各自的特性,如不同剧种之间关于行当的划分基本一致,但唱腔、曲牌结构和唱词格式差别很大,因此在构建本体时,既要考虑戏剧类的通用性质,又要结合不同剧种的特性,使构建的本体能够充分展示领域的知识体系,完整地反映传统戏剧所涉及的知识内容。考察已有本体的可复用性综合分析现有概念参考模型中有关类及属性的声明,应用于传统戏剧领域时,每个模型均存在一定的局限性,不可以直接单一复用,需要综
11、合多个概念模型自定义传统戏剧领域的知识本体。本文在 概念参考模型框架下,对 本体、本体以及 核心元数据中的元素进行复用,并借鉴 人物关系词汇表中的关系词汇对人物关系进行定义。本文参考并复用的本体模型与标准词汇如表 所示。表 传统戏剧资源本体模型引用的标准词汇列表前缀()命名空间()词汇表名称():概念参考模型:社会关系:事件模型:都柏林核心元数据:元数据术语:人物关系词汇表 年 月情报探索第 期(总 期)获取领域概念构建传统戏剧领域知识本体的目的,就是要构建概念之间的网络知识体系。在构建知识本体之前,需要厘清领域内所涉及的专业术语,确保领域概念选择准确、全面,这直接影响本体结构的复杂程度和使用
12、便利性。本文从以下几个途径收集领域术语:第一,借鉴中国图书馆分类法中国分类主题词表对中国传统戏剧领域的词汇进行归纳;第二,通过 进行相关文献检索,从中抽取关键词;第三,搜索“中国戏曲网”“百科”等相关网络资源,收集领域术语;第四,实地调研本地非物质文化遗产专业研究机构、艺术博物馆,对因时代、地域等因素影响,在流传过程中消逝的、同义的术语进行统计,通过以上几种途径建立起传统戏剧领域原始概念集合,如表 所示。表 中国传统戏剧领域部分概念剧种京剧、豫剧、评剧、昆剧、越剧、黄梅戏、河北梆子、粤剧剧目角色、剧幕、场景音乐乐器胡琴、二胡、月琴、弦子、笛子、笙、唢呐、海笛、板、单皮鼓、堂鼓、大锣、小锣等声乐
13、唱腔、念白(韵白、方言白)行当生老生、小生、武生旦正旦、花旦、武旦、老旦、彩旦净正净、副净、武净丑文丑、武丑舞台美术脸谱谱式(整脸谱式、局部谱式)、谱色(红、黑、白、绿、蓝、黄、紫、金、银)服饰戏衣、盔帽、鞋靴、髯口 定义核心类和层级关系在定义适用于传统戏剧领域知识本体的核心类之前,首先需要确定领域的核心概念,然后根据核心概念迭代扩展出其他领域概念。在对中国传统戏剧领域内各方面知识有了系统了解后,本文选取剧种、剧目、舞台美术、音乐、声腔、行当、演出事件、人员、角色、机构、服饰、技例、装置砌末等作为构成本体的核心概念。概念模型规定领域内的核心概念要被映射到模型中的事件()、地点()、行动者()、
14、万物()等类实体,所以定义核心类的过程就是对提取的核心概念按照复用的概念模型进行分门别类、划分等级的过程。根据 概念模型中类实体的定义,本文把核心概念抽象为剧种、剧目、舞台美术、音乐、行当、机构、事件、人员、数字资源 个一级核心类,然后根据核心类属性从语法粒度角度逐级定义其子类,最终形成传统戏剧领域核心概念之间的结构层级体系,见图。图 传统戏剧类非遗信息资源本体概念层级关系(部分)年 月任莉新等:非物质文化遗产信息资源知识本体构建研究第 期(总 期)概念之间的逻辑关系除层级关系外还包含非层级关系,非层级关系比较复杂,考虑到本体结构的复杂程度和使用便利性,本文在设计概念模型时将非层级关系按照主体
15、对象划分为三类,即人与人之间的关系、人与事件 对象之间的关系以及对象与对象之间的关系。上述非层级关系可通过复用的概念模型中丰富的实体与属性定义,将概念间的层级结构转化为携带语义的网络结构。定义核心类的属性和关系构建好传统戏剧领域概念层级关系之后,就要依据本体模型确定概念的属性,属性分为对象属性和数据属性,属性的定义直接影响领域概念语义关系的表达。对象属性的定义能够体现领域实体之间显性或隐形的关系,值为相关的另一实体;数据属性表示实体自身的属性,值为()的数据类型。本文利用 和 模型中有关人物的属性定义和实体关系,分别定义人物类资源的属性:如人员根据职能不同有角色分类关系,与非遗项目之间有参与关
16、系,与机构之间有所属关系;同时对人员类填充实例时,实例本身的数据属性如姓名、性别、出生年月等也需要明确作出定义,如图 所示。图 人员类属性定义方法 定义属性的分面属性的分面指与属性有关的取值特征,包括属性的取值类型、取值范围和取值频次等,对属性的分面进行定义,其作用是对每个属性做出详细的解释与说明。以行当为例,其属性的取值类型为“”,允许取值的类型包括生、旦、净、丑等,取值个数为多个;在剧目中对角色类型进行属性定义时,取值类型为实例,允许取值的类型为行当,这样就把行当与具体的剧目关联起来。创建本体模型本文对传统戏剧领域 个一级核心类进行属性定义时,复用 模型中实物类及其子类的相关定义,同时参考其丰富的实体间属性关系;人员 机构类、事件类与其他核心类的对象属性关系部分参考 本体和 本体模型以及 人物关系词汇表,最后构建出传统戏剧领域知识本体模型,如图 所示。该本体模型针对一级核心类共定义了 个对象属性,这些属性由隶属于类的实例无条件继承。本文选择 软件作为传统戏剧领域本体构建工具,它为用户提供了一个整合的本体开发环境,它支持本体开发生命周期中的大多数活动,并且因为都是基于组件的结构,很容