1、当代修辞学 2023 年第 2 期(总 236 期)怎样构建面向事实性表达研究的法律专题语料库?*袁毓林1、2崔玉珍3孙竞3游豪2(1 澳门大学人文学院中国语言文学系,澳门;2 北京大学中文系/中国语言学研究中心/计算语言学教育部重点实验室,北京 100871;3 中国政法大学人文学院中文系,北京 100088)提要本文讨论怎样以真实的法庭审判语料为基础,构建面向事实性表达研究的专题语料库。文章指出,这种语料库的标注应该聚焦于事实性构式的三种基本信息:事实、非事实和反事实,并从构式、语段、词汇三个层次挖掘跟事实性信息相关的形式特征,最终形成了完整的标注体系和标注规范;进而采用 BMES 四元序
2、列标注法,对这种语料进行事实性信息的标注。文章最后通过实例,展示了面向事实性信息的专题语料库的进一步应用的可能性。关键词事实性专题语料库法律语料库反事实论辩研究一、事实性构式事实性(facticity)是指语句及其构成成分所表示的意义跟实际情况是否相同这样一种语义学性质(袁毓林 2020)。事实性表达和语义推理有着密切关系。袁毓林(2020)提出:“制导语义推理的许多机制就内置于语言的具体的词项或构式之中;或者说,隐含在词项和构式中的某种语义成分及其背后的概念结构中;有时甚至还有其外在的形式标记或线索,它们透露了说话人在命题的事实性或主观态度上的倾向性。”因此,一些特定的句式“就为语言推理规定
3、了方向和设定了轨道,从而成为方便人们语言生成和理解的导航机制”。其中,事实性表达具有特定的语义预设和蕴涵,是语言推理的一种导航机制。反事实条件句是一种典型的事实性表达,也是反事实思维最典型的语言表达形式。从语言形式上看,反事实思维通常用条件复句表达:前件是条件小句,表示一个跟实际情况相反的命题;后件是结果小句,表示在这种前提下所产生的后果(袁毓林 2015)。但是,并非所有的条61*本课题的研究得到教育部人文社会科学研究规划基金项目“法庭立场表达与身份构建的互动研究”(项目编号:21YJA740005)和澳门大学讲座教授研究与发展基金(项目编号:CPG2022-00032-FAH)和启动研究基
4、金(项目编号:SG2022-00011-FAH)的资助,谨此致谢。本文曾在 2022 年12 月3 日由上海外国语大学语料库研究院与复旦大学 当代修辞学 编辑部举办的“语料库运用与修辞研究发展前沿理论工作坊”上宣读。DOI:10.16027/31-2043/h.2023.02.009件句都能表达反事实意义;并且,不同类型的条件句表达反事实的能力也并不相同。比如,Wang(2012)指出,汉语违实句(即反事实句)常常发生在条件句框架内,并根据违实生成能力将假设连词分成了三类:违实义假设连词(“要不是、若非、如果不是、若不是”),可能产生违实义的假设连词(“如果、要是、假如、假使、假设、倘若、如果
5、、设若”)和不能产生违实义的假设连词(“万一”)(转引自雍茜 2015)。李思玮(2019)也提到“如果 P,就 Q”既可以表达反事实,也可以表达非反事实;但是如果加上副词“早”(“如果 P,早就 Q”)就只能表示反事实。章敏(2016a)探讨了“本来”的反事实语义,指出“本来”有三种可能的语义关系:正向关系(递进)、零向关系和反向关系(转折)。零向关系中,“本来”需要借助情态动词的帮助,形成“本来+就+情态动词”结构,才能产生反事实语义。并且,不同的情态动词会影响反事实解读。比如,道义情态在这个结构中出现的可能性最大,频率最高,可以产生反事实解读;而认识情态和动力情态,则不容易产生反事实解读
6、。张莹、陈振宇(2020)则将条件句的标记分为三类:反事实标记、非事实标记和中性标记。其中,“要不是”是典型的反事实标记,“只要”是典型的非事实标记,“如果”则是典型的中性标记。除了以上的反事实标记以外,白新杰(2021)指出,话语标记“早知道”也可以作为反事实虚拟标记,并且,“早知道+S”可以构成反事实虚拟句。有的学者还从跨语言的角度,对反事实条件句进行了考察。比如,鞠晨、吉田泰谦、袁毓林(2022)比较了汉语和日语反事实愿望句的表达策略,指出汉日都可以通过相关情感表达传递反事实意义,并且反事实意义都倾向于使用条件句来表达。此外,也有学者考察了汉语方言中反事实思维的表达方式。比如,朱华平(2
7、012)认为安徽庐江话的“照讲”也是反事实传信标记。袁毓林、张琳莉(2018)考察了苏州话中的反事实条件句,并总结出了六种常见的格式:假设连词+VP、否定性连词+VP、V1仔 O1+V2O2、副词+VP、否定词+VP、VP1+末+VP2。张恒君(2019)指出河南孟州方言的“忘了”具有表达反事实意义的作用,并对“忘了”的句法分布、对句子所在主语的人称限制,以及由“忘了”引导的反事实句的语用功能进行了考察。就汉语普通话而言,有的句式虽然可以表达反事实,但也可以表达非事实。它们在表达反事实时,我们往往会结合一些其他因素来进行判断。比如,Feng Yi(2006:1283)在对汉语反事实标记的心理学
8、实验研究中证明,含有“要不是”而被母语者认定为反事实条件句的比例高达 91%,仅次于“原来应该”(转引自章敏 2016b)。也就是说,即使是大家公认的反事实标记“要不是”也不能完全保证该标记所在的条件句一定为反事实条件句。因此,有的学者对汉语中是否存在反事实标记提出了质疑。比如,蒋严(2000:264-277)认为汉语没有统一的或强制性的反事实标记,反事实更多的是一个语用解释问题,通过上下文、语境以及日常知识来判断。雍茜(2015)认为汉语中没有形成成熟的 CF 标记(CounterfactualMaker,反事实标记),汉语中的违实句主要通过 HE 标记(Hypothetical Enhan
9、cing Marker,假设增强标记)来实现。她指出,违实句是指传达与主观事实相反意义的语句,只有说话者能够确定句子的违实性,听话者需要通过各种词汇语法特征或词汇线索推测出违实义。这些语法特征或词汇线索的使用具有增强句子假设度的功能,故能引发高假设度的违实解,这种标记被称为 HE 标记。HE 标记通过贡献自身语义增强句子的假设度,当假设度增高到一定程度才可以激发违实义。类似于其他 HE 标记语言,汉语违实义的表达没有固定的语法词汇形式,而且部分依赖于语用。那么真正影响我们将条件句解读为反事实的因素是什么呢?张莹、陈振宇(2020)对小说文本以及科技文本中的条件句进行了统计,认为汉语条件句的事实
10、性是一个有梯度、有序列的71连续统。根据假设连接词所在条件句的反事实比例,他们把假设连接词大致分为三类,发现它们大致呈现连续统的分布。此外,他们还总结了一些影响反事实倾向的语用因素,包括:时间制约、情感制约、频率制约、数量制约和人称制约。具体结果如下图所示:反事实中性非事实连接词小说文本要不是/早知道纵使假如要是就算假若如果若是假使倘若就是哪怕即使纵然只要万一/一旦/只有/倘使科技公文类文本要不是假如假若倘若要是若是如果只有/只要/即使/一旦/哪怕/万一/就是特征标记小说文本就好了后件 早 X前件 不是 早X后件时间词没有我/我们了后件第三人称反问后件真/真的不你/你们/您了2前件科技公文类文
11、本就好了后件时间词早 X不是反问后件没有真/真的我/我们了2 后件第三人称你/你们/您不了2前件表 1连接词与特征标记梯度(转引自张莹、陈振宇 2020)张莹、陈振宇(2020)所总结的影响因素实际跟雍茜(2015)所提出的 HE 标记相似。雍茜(2015)认为,汉语中的 HE 标记包括时制特征(主要是过去时)以及语气范畴(汉语中的语气助词“了”)、否定、客观与临近度等;这些因素都可以增强违实表达效果,而不能排他性地标记违实因素。但是,如果同一个句子中拥有两个或两个以上的 HE 标记,那么将这个句子视为违实句的几率会大大增加。根据她的调查,在条件框架下,否定和第一人称同时出现时,违实义的引发概
12、率几近 100%。章敏(2016a)主要对反事实句中的情态进行了分析,指出在不同的反事实句中,情态动词的不同小类可能影响反事实语义的解读以及反事实语义的强度。比如,认识情态动词最容易与反事实共现,同时所参与构建的反事实语义强度高,不易消除;而动力情态和道义情态所参与构建的反事实语义强度低,且可以通过语法手段消除。此外,即使是与反事实语义最容易共现的认识情态类型,也可能会由于其内部可能性的高低对反事实语义的解读造成影响。鞠晨、袁毓林(2021)通过对真实文本语料的考察,指出感叹副词能推动或加强愿望句的反事实意义,通过削弱句子的信息,从而使听话人通过语用推理得到反事实解读。综上所述,我们在观察反事
13、实条件句的时候,不仅要考虑到有关连词对事实性的影响,而且要考虑其他语用因素(比如,时间、情感、频率、人称等)对于人们识别反事实的作用。二、法律话语中的事实性构式事实性表达作为一种语言推理的导航机制,对话语理解、信息抽取、论辩挖掘等研究和实践领域都有着重要作用。特别是法律领域的研究和实践表明,事实性表达可以指引人们对话语中有关事件或事实之间的关联程度做出判断;事实关联程度的不同,可以反映事件或事实之间的因果关联的强弱。在法律领域,这就为法律因果关系判断提供了重要的基础。法律领域的因果关系(causation)有着非常重要的作用,这是认定行为人是否需要承担法律责任的一个81重要考虑因素。但不同事物
14、、行为或事件之间是否存在真正的因果关系,往往难以判断。法学界对原因和结果之间的链接(link)关系有很多讨论,出现了条件说、原因说、相当因果关系说、合法则的条件说、客观规则论等不同的因果关系判断理论。法律工作者试图通过自然法则、经验法则或社会法则等规则,来判断或建构不同行为之间的因果关联。但无论是哪一种理论,法律领域的因果关系判断在本质上都是对事件的事实性的探寻,都是对下面这些核心问题的回答:不同事件之间的事实性关联构成了何种程度的因果关联?是否形成了具有法律意义的因果关系?由于事实性构式指引不同事件之间事实性关联的判断,即不同事件在因果关系上的关联程度;而事实因果关联又影响法律因果关系,进而
15、影响法律审判结果;因而事实性构式在法律领域经常被使用,说话人力图通过不同的事实性构式的语义特性,来表达己方对不同事件之间的事实性关联的意见,并影响听者的语义推理,竭力实现己方的案件事实主张。比如下例:(1)辩方辩方:通过视频和法庭调查可以看到,这个案件实际是王国立在倒卖卡,自己行使违法行为,自己无事生非,自己攻击别人。由于自己的身体原因,我们不能说他是气死的,而是由于他自己的身体原因造成的。一直都是他自己的原因。他自己的原因却让别人承担责任,我认为是不公平的。鉴定中的 1%20%只是说明冲突这一事件对血压升高存在 1%20%的诱因关系,但不能说是直接的因果关系。身体不舒服了,如果他能早点就医检
16、查,可能就不会发生死亡后果了。从视频可以看到,中间两个小时的时间他一直到处转悠,还去买了烟。说明他自己都认为没有什么问题。这个更是和别人毫无关系。别人没法预料到,也不可能存在过错。如果及时就医可能就不会发生后面的后果。没有及时就医是他更重要的过错。上例来自一个排队纠纷案,当事人王国立、牛筝在排队过程中发生言语冲突和肢体接触,后来当事人王国立死亡。该当事人被证实患有高血压,发生纠纷到死亡期间并无就医的想法或行动。王国立的家属提起控诉,指控另一当事人牛筝和王国立的冲突引起王国立血压升高、身体不舒服,最终导致了王国立的死亡。即控方建立三个事件之间的链式因果关联:冲突血压升高、身体不舒服死亡。这个指控实质上就是把“冲突”行为和“死亡”结果进行了因果关联。在论辩过程中,辩方巧妙地利用了反事实表达(见例中划线部分)建立新的事件关联,并打断了控方提出的因果关联。当事人王国立在“身体不舒服”之后,并没有实施“就医”这一行为。辩方以这一事实为基础进行反事实表达 “如果他能早点就医检查,可能就不会发生死亡后果了”“如果及时就医可能就不会发生后面的后果”,通过反事实表达将“及时就医”行为和“不会死亡”后果进