1、 解放军外国语学院学报 第 46 卷 第 1 期 70 Journal of PLA University of Foreign Languages 2023 年 1 月 面向自动语音识别的阿拉伯语动词语音特点研究*潘基宏,黄 娴,张克亮(信息工程大学洛阳校区,河南 洛阳 471003)摘 要:阿拉伯语的自动语音识别是未来的发展趋势,从语言学的角度对阿拉伯语的语音特点进行规则描述,有助于提升自动语音识别的准确率。本文在借鉴传统标音法和三层分析法的基础上,对阿拉伯语的核心动词的语音特点进行研究,提出以“时式、态、人称”三类语法范畴为目标,以“词根层、辅音层、CV 音层、元音层”4 个层次为路径,
2、以“核心部分、词缀部分”两大模块为内容的分析方法,并以阿拉伯语三母动词的过去式为例进行分析,总结出“词根CV模板元音类型词缀模板”的语音特点的形式化规则。关键词:自动语音识别;阿拉伯语;动词;语音特点;语法范畴 中图分类号:H371 文献标识码:A 文章编号:1002-722X(2023)01-0070-08 0.引言 阿拉伯语是 22 个阿拉伯国家的官方语言,随着“一带一路”倡议的推进,中国与阿拉伯国家之间的交往日益频繁,提升中国国内对阿拉伯语的翻译能力具有迫切的需求。在信息化时代,面对巨大的语言数据,翻译能力的建设不仅需要培养精通外语的翻译人才,更需要推动语言的智能化处理,而自动语音识别就
3、是实现后者的关键技术之一。ASR 旨在让机器听懂人类的语音,并将人类的语音信息转化为可读的文字信息。“作为一个典型的交叉学科任务,ASR 不仅涉及模式识别、信号处理、物理声学、计算机科学、生理学、心理学,还与语言学密切相关”(颜永红,等 2013:232),因为计算机对语言的准确处理基于对语言语音特点的清晰认识。国外有学者在进行阿拉伯语的 ASR 研究时就指出,“我们的实验证明,在缺少语言的专业知识时,只采用数据驱动的方式无法有效地降低阿拉伯语语音识别的错误率”(Enshassi 2016:81)。作为一种“派生语言”,阿拉伯语的语言体系以动词为核心,但动词的语音具有复杂的特点,对阿拉伯语的
4、ASR 构成重要挑战。鉴于此,本文以 ASR 为目的,从语言学视角对阿拉伯语动词的语音特点进行研究。1.阿拉伯语动词语音特点的传统研究思路 阿拉伯语作为一门古老的语言,对其动词语音特点的研究由来已久。虽然学界传统的研收稿日期:2020-11-23;作者修订:2022-12-07;本刊修订:2022-12-08 基金项目:国家自然科学基金重大项目“多语言言语数据的获取、标注和分析研究”(11590771);河南省哲学社会科学规划项目“面向自动语音识别的阿拉伯语动词的音系特征和形态特征研究”(2018CYY031)作者信息:潘基宏(1992-),男,江西宜春人,讲师,硕士,研究方向为计算语言学和阿
5、拉伯语语言学,E-mail:;黄 娴(1984-),女,江西分宜人,讲师,博士,研究方向为计算语言学和自然语言处理,E-mail:;张克亮(1964-),男,河南洛阳人,教授,博士,博士生导师,研究方向为计算语言学和自然语言处理,E-mail:。第 1 期 潘基宏,黄 娴,张克亮 面向自动语音识别的阿拉伯语动词语音特点研究 71 究思路及其成果不能直接运用于 ASR 中,但都揭示了阿拉伯语动词具有代表性的语音特点,为本文的研究提供了借鉴,主要有以下两个方面。1.1 标音法与隐形元音 由于大部分学者并非阿拉伯语习得者,为了开展相关研究只能用音标来标注阿拉伯语动词的语音,音标参照的是现行的国际音标
6、,这就是标音法。受语言特点的影响,标音法在阿拉伯语动词上的运用经历了从直接标音到完整标音的转变。直接标音,就是对构成动词的阿拉伯字母的语音进行标注。例如,“3”“”“”个阿拉伯字母的语音可以分别用 d、r、s 来标注,那么它们构成的动词“”所对应的语音就是“drs”。但是如果对阿拉伯语动词采取直接标音,那么它只是对应了阿拉伯语的辅音,而不能体现阿拉伯语的隐形元音,会导致动词语音信息的缺失。由于直接标音存在的不足,阿拉伯语的研究者对其进行了完善,开始对阿拉伯语动词采取完整标音,即不仅标注显性辅音,还标注隐形元音,以便完整地体现阿拉伯语动词的语音信息。1.2 三层分析法与非串联构词 通过完整标音,
7、阿拉伯语动词的音素按照线性顺序从左到右依次排列,研究者们开始借鉴英语等语言的线性分析法对阿拉伯语动词的语音进行研究,但是未能取得理想的成果。例如,英语动词 decentralize 可以按照线性顺序分解为 de-centr-al-ize,其中 de-来自拉丁语介词形式 de、基本词义是“从离开”,centr-相当于 center、来源于希腊语、词义为“中心”,-al 表形容词、一般缀于名词后、词义为“的”,-ize 是动词后缀、一般缀于形容词后、属于美式英语常用表达、英式英语中为-ise。但是,阿拉伯语动词“(”darasa)如果按照线性顺序分解,无论是以单个辅音、元音的形式 d、a、r、a、
8、s、a 或者辅音与元音相结合的形式 da、ra、sa 都没有实质的意义。这与英语、阿拉伯语的构词方式不同有关。英语音素的分布具有连续性和串联型的特点,而阿拉伯语音素的分布呈现穿插性和非串联型的特点。作为闪语系的重要分支,阿拉伯语继承了闪语系语言特有的构词方式“词根与模型”(root-and-pattern)构词,也称为“非串联”(non-concatenative)构词。为了解决阿拉伯语构词方式带来的困难,研究者们进行了诸多尝试,其中带来突破性进展的是 McCarthy。McCarthy(1979)提出对阿拉伯语词的研究要采用非线性的自主音段分析方法,把辅音与元音从所在位置上分离出来,置于独立
9、的音层进行分析。同时,他将 CV 韵律模板从形态学引入语音领域,提出了 CV 模板的概念,即阿拉伯语词辅音和元音的排列遵循一些特定的模板,C 为辅音、V 为元音。McCarthy 的观点在 Clements&Keyser(1983)等学者的完善下逐步形成了 CV 音系学,为阿拉伯语的研究带来了理论指导。CV 音系学中最重要的概念是 CV 音层。C 和 V 单位都是音节的直接成分,每个 C 或 V 单位被称为“空位”(slot),与其对应的辅音或元音,抑或语音特点相对应,C 或者 V 发音的时间长短、先后顺序也已经被确定。由此,对阿拉伯语动词语音特点的研究开始从线性走向非线性、从单层走向多层,最
10、终形成了三层分析法。即 CV 音层、辅音层和元音层,其中 CV 音层是核心层。三层分析法充分适应了阿拉伯语动词非串联构词的特点,从 CV 音层分离出辅音、元音等音素,便于对阿拉伯语动词语音特点开展深入研究。72 解放军外国语学院学报 2023 年 2.面向 ASR 的阿拉伯语动词语音特点分析方法探究 隐形元音和非串联构词是较为特殊的语言现象,是阿拉伯语动词 ASR 的难点,标音法的完善和三层分析法的提出促进了相关问题的解决。为了实现阿拉伯语动词的 ASR,本节从目标、路径和内容 3 个方面对阿拉伯语动词语音特点的分析方法进行探究。2.1 目标:三类语法范畴 阿拉伯语一般被视为屈折语,动词通过形
11、态变化来表示语法意义。阿拉伯语动词的形态具有多种变化,而形态特点的不同又直接决定了其语音的相异,这也是阿拉伯语被公认为难学的重要原因。阿拉伯语学界周烈教授(1995:125-128)曾对阿拉伯语动词的语法进行过系统论述,他认为阿拉伯语动词的语法包含“式”“时”“体”“态”和“人称”5 个方面。与传统研究不同,以 ASR 为目的的阿拉伯语动词研究追求“准确但精简”的原则。从阿拉伯语动词的形态和语音变化来看,5 类语法范畴中的“式”“时”和“体”具有很大的共通性:一方面,动词在“时”中的过去时和现在时与“式”中的过去式、现在式完全一样,将来时也只是在现在式动词前加入了一个表示将来的、没有形态与发音
12、变化的虚词“(”sawfa)或者词缀“(”sa)来体现;另一方面,“体”中的完成体由过去式动词来体现,未完成体由现在式动词来体现。鉴于此,在分析过程中可以将“时”“体”与“式”进行融合,在“式”中增加“时”的将来时形态,简称“时式”,它将包含过去式动词、现在式动词、将来式动词和命令式动词 4 种。通过这种方法,阿拉伯语动词语音变化涉及的语法范畴由五类缩减为三类,在保证结果准确的基础上简化了分析目标。2.2 路径:4 个层次 三层分析法提出要从 CV 音层、元音层和辅音层对阿拉伯语动词进行分析,但这主要是针对某个具体动词而言。在阿拉伯语动词的传统研究中,词根被视为研究的关键。因为它是动词派生的起
13、点,具有强大的派生能力。同一词汇族群受同一词根的影响,其语音特点会存在部分共性,不同的词汇族群受相同的词根派生规则的影响,它们的语音特点也会存在部分共性。此外,词根还决定了动词的基本词义。鉴于词根的重要性,同时也为了便于对不同词根或相同词根动词的语音特点开展比较研究,词根也应作为要考虑的层次。国外有学者指出,“阿拉伯语动词的表层只表示辅音字母,其他成分隐藏于表层之下,它们应包含 CV 骨架、元音和词根 3 个部分”(Boudelaa&Marslen-Wilson 2004:271)。因此,本文在 CV 音层、元音层和辅音层的基础上增加了词根层,构成阿拉伯语动词语音特点的四层分析路径,进一步拓展
14、了对阿拉伯语动词的非线性研究(如图 1)。图 1.阿拉伯语动词语音特点的分析路径 2.3 内容:两大模块 阿拉伯语动词从其构成的字母是否都是基本字母(亦称为“根字母”),可以分为简式动词和复式动词。简式动词的字母都是根字母,而复式动词还包含除根字母外的其他字母,包第 1 期 潘基宏,黄 娴,张克亮 面向自动语音识别的阿拉伯语动词语音特点研究 73 括增加的与根字母相同的字母(简称“增加的根字母”)和非根字母。其中,根字母的数量分为三母和四母两种,据此阿拉伯语动词可以分为三母简式动词、四母简式动词、三母复式动词和四母复式动词 4 种。在阿拉伯语中,根字母的组合被称为词根,一般用“(”f)、“”(
15、,即 ayn)、“”(l)3 个字母表示。因此,三母动词和四母动词的词根可以分别表示为“”(fl)、“(”fll)。在“时式”范畴,任何一个阿拉伯语词根都可以派生出不同词型的过去式动词,这种派生规则就是 McCarthy 提出的 CV 模板,位于 CV 音层。在此基础上,阿拉伯语的每种过去式动词根据固定规则又可以生成对应的现在式动词、将来式动词和命令式动词。在“态”范畴,阿拉伯语动词的主动态和被动态由元音的排列规则决定,体现于 CV 模板中 V 的排列规律,位于元音层。在“人称”范畴,阿拉伯语动词的人称变化体现于动词的词缀,每种人称都有其对应的词缀模板,它附加于动词核心部分之前或之后,即 CV
16、 模板的前后。“阿拉伯语的形态变化主要体现于音段的非串联,即动词的核心部分,但也体现于词缀。”(赵忠德、马秋武 2011:268)动词的语音特点会受到形态变化的直接影响,而阿拉伯语动词核心部分和词缀部分的形态变化规则不一致。因此,对阿拉伯语动词的分析内容可以拆分为核心部分和词缀部分两大模块。前者对应“时式”“态”两类语法范畴,主要采取四层分析法,后者对应“人称”语法范畴,关键在于确定词缀模板(如表 1 所示)。表 1.阿拉伯语动词语音特点的分析内容 模块一:核心部分模块一:核心部分 模块二:词缀部分模块二:词缀部分 时式 态 人称 命令式动词 主动 语态 被动 语态 第一、第二、第三人称 单数、双数、复数 阴性、阳性 将来式动词 现在式动词 过去式动词“(”fl)三母 “(”fll)四母 CV 模板 增加的 C及其位置 V 的排列规则 词缀模板 词根层词根层 辅音层辅音层 CV 音层音层 元音层元音层 4 个层次 综上,面向 ASR 的阿拉伯语动词语音特点的分析方法可以“时式、态、人称”三类语法范畴为目标,以“词根层、辅音层、CV 音层、元音层”4 个层次为路径,以“核心部分、词缀部分