基于语料库的汉语二语写作篇章组构模式比较研究

资源描述

1、2023 年 04 月汉语学习Apr.，2023第 2 期Chinese Language LearningNo.283基于语料库的基于语料库的汉语二语汉语二语写作写作篇章篇章组构模式比较研究组构模式比较研究姜有顺刘豪妍（西南大学国际学院，重庆 400715）摘要本研究选取母语为英语的汉语二语中高级学习者参加高等汉语水平考试的议论文作文为语料，根据官方阅卷人的作文评分，抽选高分组作文（HS）和低分组作文（LS），进而对比考察两组作文使用的篇章组构模式（DOP）的频率、密度及其分布特征。结果发现：（1）HS 更均衡地使用多种 DOP，LS 则过度使用了跳跃型；（2）链接型是 HS 最常用、LS

2、次常用的DOP；（3）HS 对话题同一型的习得水平高于 LS；（4）HS 和 LS 均最少使用交叉型。结论可以从 3 个角度进行解读：（1）特定 DOP 自身的编码复杂程度或使用难度；（2）高水平和低水平二语写作者在组篇能力、文体意识等方面的差距；（3）母语者阅卷人对特定 DOP 的偏好。关键词汉语二语写作；篇章组构模式；话题链中图分类号 H195.1文献标识码 A文章编号 1003-7365（2023）02-0083-10零、引言二语学习者组构篇章的模式与母语者惯用的模式存在差异，导致母语者阅读时产生文脉壅塞佶屈的失谐感。基于认知语言学和语篇分析的双重视角，组构篇章的前提是维持句子陈述之间

3、必要的主题相关性，即以若干相邻话题为主线串联话题链，再将若干话题链以特定的逻辑层级和线性序列构建为篇章。因此，“话题话题链篇章”的典型组构模式是二语写作者需要掌握的关键资源。本研究选取母语为英语的汉语二语学习者参加高等汉语水平考试现场完成的议论文作文为语料，根据官方阅卷人的作文评分，在相同题目下抽选出高分组和低分组，对比考察两组作文的篇章组构模式的分布特征。高分作文常用的篇章组构模式可以作为汉语二语中高级阶段读写教学的重点项目。本文基于认知语言学视域。由于国内外关于篇章组构的研究多数是由系统功能语言学者完成的，综述部分将引用该派研究，并从认知的角度进行解读。认知语言学将句子的信息结构分为话题（

4、topic）和述题（comment），相邻的句子在篇章层面形成话题链（topic chain）。基金项目本文受2020年度国家社科基金后期资助项目“汉族语作为第二语言的把字句语义及语用习得研究”（项目编号：20FYYB033）、2021年重庆市语言文字科研项目一般项目“来华留学生心理健康教育专门用途汉语课程开发与教材编写的多学科协同研究”（项目编号：YYK21225）、西南大学2022年中央高校基本科研业务费人文社会科学项目能力提升项目“二语语用学视域下来华留学生对汉语学术话语的习得研究”（项目编号：SWU2209234）资助。2023 年 04 月Apr.，2023第 2 期No.2基于语料

5、库的汉语二语写作篇章组构模式比较研究84系统功能语言学将句子的信息结构分为主位（theme）和述位（rheme），相邻的句子在篇章层面构成主位推进（thematic progression）。这两套概念具有相当程度的内涵同构性。每个句子都具有自身的话题述题结构。话题是话语的起点，通常位于句首，承载交际双方的已知信息也即旧信息。述题是话语的目标，通常位于话题之后，承载交际双方的未知信息也即新信息。话题的信息负荷小于述题，它的主要功能是衔接和推进篇章，发挥信息锚点的作用，标记篇章的逻辑层次组织，为小句提供定位和导向。一个篇章可以看作是多个话题和述题的领属层级以及相邻话题递次推进的序列组织。人们建构

6、篇章时，一般使用具有同指关系（名词性回指、代词性回指、零形回指等）的话题作为引领，将两个以上的小句以某种逻辑层级和线性序列组构为一个宏观信息流。“篇章句”内部的话题和述题不是孤立自治的，前句的述题和后句的话题相辅相生、递次推进，已知信息引出未知信息，未知信息又不断转化为已知信息，以此实现篇章的扩展。认知学者称之为话题链（Tsao 1979，孙坤 2015，屈承熹 2018），系统功能学者称之为主位推进（Dane 1974，Halliday 1985）。概括话题链的共性特征并归类，即得到篇章组构模式（discourse organization pattern），系统功能语言学称之为主位推进模式

7、，本文简称 DOP。Dane（1974）从功能视角最早提出简单线性型、持续型、派生型、分裂述位型和跳跃型 5 类模式。此后，国内外学者陆续提出了十余种分类方案，多数分类由系统功能学者提出（徐盛桓 1982，黄衍 1985，黄国文 1988，Fries 1994，朱永生 1995，郑贵友 2002，王丽、刘颖 2015，Hawes 2015），侧重刻画汉语篇章组构体现的跨语言普遍性，各家一般以 Dane的分类为基础。少数分类由认知学者提出，侧重刻画汉语篇章组构不同于印欧语的区别特征（孙坤 2013、2015，田然 2016）。实际上，两派学者对 DOP 的分类和定义存在许多异曲同工之处，可以跨越

8、学派隔阂，融通互鉴。2.2节将兼取众长，提出汉语 DOP 的分类和标注框架。以往关于二语篇章组构的研究基本均以系统功能语言学为理论视角，采取语料库检索或诱导产出任务收集书面语语料，对比考察不同母语的英语二语学习者和英语母语者使用的DOP 及其分布特征。研究发现，由于受到母语迁移、二语水平、交际策略、学科背景等因素的影响，英语二语学习者的 DOP 主要表现出两个特点：第一，学习者与母语者在一些 DOP的使用频率上存在显著差异。第二，学习者倾向于过度使用一些非话题链形态的衔接手段，比如语篇衔接词、关联词、副词等。这可能是一种降低词汇提取难度、赢取加工时间的写作策略，但降低了 DOP 的密度，弱化了

9、话题链，从而偏离了本族语者模式（Belmonte&McCabe-Hidalgo 1998，赵璞 1998，马静 2001，Hasselgrd 2009，Qian et al 2007，Wang 2007，Herriman 2011，Rrvik 2012，Soleymanzadeh&Gholami 2014，Wei2016，杨莉芳、王文斌2017）。鉴于此，以往研究的缺憾可概况如下：第一，尽管存在许多对象为英语的研究，但结论可能不适用于汉语母语者和汉语二语学习者产出的篇章。因为不同类型语言的 DOP 存在较大差异，特定的 DOP 在英语议论文中占话题链的概念有狭义和广义之分。狭义的话题链指的是由

10、多个语句组成、共享同一个话题的语段，并且该话题在第二个及以后的语句中以零形式出现（Li&Thompson 1981）。本研究采用广义的话题链概念，即第二个及以后的小句的话题所构成的意义联系不局限于零形回指，可以是名词性回指、代词性回指；不局限于同指关系，也可以是上位话题与下位话题形成的共指关系，包括总分关系、种属关系、主从关系等。2023 年 04 月汉语学习Apr.，2023第 2 期Chinese Language LearningNo.285据优势，但在汉语议论文中较少使用。遗憾的是，专题探讨汉语 DOP 的研究数量很少（郑贵友 2002，屈承熹 2006、2010），并且往往通过非量化

11、的举例论证提出结论，尚需实证检验；更少有研究考察汉语二语学习者产出的 DOP（黄秀坤 2015，王丽、刘颖 2015），从汉语二语读写教学的实用性角度来说，教师尚不知晓哪些 DOP 值得优先或重点教授。第二，二语写作者以较高密度使用多种 DOP，有利于使读者产生论证细密、观点详实的阅读体验。在限时写作任务条件下，母语者、高水平二语写作者使用 DOP 的密度可能高于低水平二语写作者，后者可能倾向使用非话题链形态的衔接手段，从而进一步降低 DOP的使用密度。遗憾的是，以往研究仅考察 DOP 的频率，极少考察 DOP 的密度（Leong 2016，Leong et al 2018）。第三，以往研究的

12、方法设计未能周密控制干扰变量。（1）多数研究收集的学习者语料是在非测试条件下完成的作文。学习者可能长时间反复地构思、修改，使用智能翻译（如谷歌翻译）、语法纠正和校对工具（如 Grammarly）、对话机器人（如 ChatGPT）自动生成篇章，或者得到母语者的修改润色，但学习者一般不会主动申明这些操作。因此，非测试条件下的篇章难以客观反映学习者的真实组篇能力。（2）一些研究以母语者的同题写作篇章作为比较基准来考察二语学习者。王丽、刘颖（2015）从 HSK 动态作文语料库中选取了汉语高级水平的成人英语母语者所作的题为“父母是孩子的第一任老师”的命题作文，又收集了扬州某中学高一学生限时完成的同题作

13、文，进而比较两组作文的篇章组构模式。但该文选择的母语者和学习者在人口学属性、写作心理、任务条件上差异较大，导致两组篇章的可比性或同质性不佳。一、研究问题与研究设计2.1 研究问题由于以往同主题研究的匮乏，本研究侧重探索性，不设置方向性的假设，提出 3 个研究问题：（1）在 DOP 的使用频率上，汉语二语高水平学习者与低水平学习者作文的组内与组间差异如何？（2）在 DOP 的使用密度上，汉语二语高水平学习者与低水平学习者作文的组内与组间差异如何？（3）上述差异为汉语二语读写教学带来怎样的启示？2.2 研究设计本研究选取母语为英语的汉语二语学习者在高等汉语水平考试（下文简称“HSK 高等”）考场完

14、成的议论文为语料，根据官方阅卷人对作文的评分，在相同题目下抽选出高分作文（下文简称 HS）和低分作文（下文简称 LS），对比考察两组作文的 DOP 的分布特征。本研究在变量控制上的优化体现在：（1）语料采用HSK高等考试的真题作文，规定写作时间是30 分钟，考生不借助外力而独立完成写作，避免了学习者深思细改、使用智能写作工具或请他人润色。（2）区分高水平和低水平作文的依据是官方阅卷人的评分。作为国际标准化考试，HSK 研发了科学、详细和可操作的作文评分标准，培训了专业化的阅卷人群体。2.2.1 语料选取2023 年 04 月Apr.，2023第 2 期No.2基于语料库的汉语二语写作篇章组构模

15、式比较研究86语料取自“北京语言大学 HSK 动态作文语料库”。该库收集了 1992 至 2005 年间部分母语非汉语的外国考生参加 HSK 高等考试的作文答卷。语料总数为 11569 篇，共计 424 万字。参加 HSK 高等考试的多数考生已经达到中高级汉语水平。收集与筛选语料的程序如下。（1）检索。使用语料库的全篇检索功能，将考生国籍分别设置为英、美、加、澳、新西兰 5 国。其他 4 个参项（作文题目、证书级别、作文分数、考试时间）均设置为不限。检索返回结果共 433 篇，包含作文编码、考生国籍、性别、考试时间、作文题目、作文分数、综合分数、考试总分、证书级别以及作文全文文本等信息。（2）

16、筛选。剔除零分作文 5 篇。剔除非议论文的题目 6 个，作文 39 篇。（3）匹配。为了保证语料的可比性，HS 和 LS 在同一题目上的作文篇数应匹配为相等。此时作文总体（n=389）的评分均值为 74.036，中位数为 75，标准差为 12.441。由于阅卷人评分以 5 分为递进区间，不存在 74 分的打分，故以 75 分划线，在同一题目下匹配 HS 和 LS的篇数。由此剔除了篇数无法实现组间匹配的题目 7 个及其作文 23 篇。（4）抽样。完成同题作文的篇数的组间匹配后，剩余题目 13 个、篇数 366 篇。此时作文总体（n=366）的评分均值为 73.743，中位数为 75，标准差为 12.596。采取分层随机抽样，将 HS 和 LS 的抽样范围设置为距离 75 分 1 个标准差之外，即 HS 抽样大于等于 90 分，LS抽样小于等于 60 分。首先对 HS 抽样，在 90 分及以上的 62 篇作文中随机抽选 43 篇，这 43篇 HS 分属于 12 个题目。然后对 LS 抽样，在这 12 个题目下分别随机抽选与 HS 数量相等的、60 分及以下的作文，共得到 43 篇。2.2.

展开阅读全文

基于语料库的汉语二语写作篇章组构模式比较研究_姜有顺.pdf