1、 心理学报 2023,Vol.55,No.2,159-176 2023中国心理学会 Acta Psychologica Sinica https:/doi.org/10.3724/SP.J.1041.2023.00159 收稿日期:2022-02-16*国家自然科学基金项目(32271119,81771823);天津市研究生科研创新项目(2019YJSB128)。通信作者:王敬欣,E-mail: 159 词素位置概率在中文阅读中的作用:词汇判断和眼动研究*曹海波1,2 兰泽波3 高 峰1,4 于海涛1 李 鹏1 王敬欣1(1天津师范大学心理学部,天津 300387)(2河北北方学院艺术学院,张
2、家口 075000)(3福建医科大学健康学院,福州 350122)(4燕山大学心理健康教育服务中心,河北 秦皇岛 066000)摘 要 中文词切分的认知机制一直是心理语言学关注的焦点问题之一,研究发现中文读者可使用词素位置概率等语言学线索帮助词切分,而首、尾词素位置概率的重要程度以往研究观点并不一致。本研究通过词汇判断和眼动实验,考察中文读者对首、尾词素位置概率的利用情况。实验 1a 和 1b 采用词汇判断任务,考察在不同词频条件下词首与词尾词素位置概率对词汇识别的影响。在错误率和反应时指标上,高频词条件下词首与词尾词素位置概率效应不显著;低频词条件下词首词素位置概率效应显著,词尾词素位置概率
3、效应不显著。实验 2a 和 2b 采用句子阅读任务,考察在自然阅读情境中被试对词素位置概率的运用。在凝视时间、回视路径时间和总注视时间指标上,低频词条件下词首词素位置概率效应显著,词尾词素位置概率效应不显著。高频词条件下词首与词尾词素位置概率效应均不显著。词汇判断和眼动证据共同表明,词素位置概率信息是中文读者重要的语言词切分线索,且与词尾词素位置概率相比,词首词素位置概率在词汇切分与识别过程中发挥的作用更大。同时,词素位置概率线索的运用会受到词频的影响,研究结果支持复合词加工的混合通达表征模型。关键词 词切分,词素位置概率,中文阅读,眼动 分类号 B842 1 引言 阅读过程中读者对词素位置信
4、息的加工是词汇识别不可或缺的步骤,一般而言,词汇识别包含两类编码,即身份信息编码和位置信息编码。身份信息编码是指哪些字符构成了词汇,而位置信息编码是指字符在词汇中的相对顺序(滑慧敏 等,2017)。字符的位置信息在词汇识别中有重要作用,英文中读者区分相同字母组成的单词时便依据字母的位置差异,如causal和casual。同样,中文读者也由词素位置信息识别变位词,譬如“上海”和“海上”,二者身份信息相同,通过词素位置区分语义。若词素位置判断能力不足则会干扰正常阅读,一部分阅读障碍儿童对汉字位置出现判断困难,测试成绩显著低于控制组儿童(田晓梅 等,2006)。词素位置信息的加工是通往词汇识别和更高
5、语言水平加工的重要途径,离不开视觉和认知加工系统的相互作用。据此,研究者对拼音文字的字母位置信息 进 行 了 深 入 探 究,发 现 了 字 母 的 换 位 效 应(transposition-letter effect,TL effect),即人们在阅读一个内有字母换位的非词时,倾向于将其识别为与之对应的真词,并且这种倾向比将内有替换字母的非词当作真词的概率要高(Perea&Carreiras,2006)。后续研究更进一步,探究了词首与词尾位置之于词汇识别的重要程度,研究认为比起词内部的换位,发生在词首、词尾的换位会对词汇识别起到更大的破坏作用(Yakup et al.,2014)。Scho
6、tter等人(2012)发现词首的字母或者词首的字更重要。综上160 心 理 学 报 第55卷 所述,词素位置信息的加工是词汇识别的重要环节,且词素处于不同的位置对词汇识别所起的作用不同。对词素位置与整词词汇识别关系的深入思考,将有助于我们认识汉字水平自下而上的加工对词切分及阅读认知机制的理解。中文阅读同样重视词素位置的作用,也发现了字母转置效应(Gu et al.,2015),且发现词边界信息影响汉字位置的加工(顾俊娟 等,2020)。彭聃龄等人(1999)发现词素换位也能达到正常语义启动的效果,卞迁等人(2010)应用眼动技术探究词素换位对词素识别的影响,发现含高频词素换位的词汇识别要快于
7、低频词素换位的词汇。需指出的是,中文的字序编码区别于位置编码,字形编码发生在阅读的早期阶段,而位置信息的编码则具有一定灵活性(Gu et al.,2015)。徐迩嘉和隋雪(2018)应用启动范式,比较了不同启动时间下首字替换词与尾字替换词的启动条件,发现首字替换词对目标词的启动效果最小,说明首字的替换对词汇识别的破坏性更大,证实了词首在词汇加工中的重要性。总体来看,词素位置信息的加工是词汇加工的重要环节,且值得思考的是,词素的特定位置(如词首)能影响词汇加工,那么词素位置概率又是怎样作用于词汇识别的呢?具体而言,词素位置概率指的是汉字出现在词首或词尾时双字词的次数占该汉字组成的所有双字词(无论
8、出现在首字还是尾字)的比重(Yen et al.,2012)。例如,在语料库中“消”可组成39个双字词,其出现在词首可组成33个词,如“消炎”、“消息”、“消失”等,为此,其词首词素位置概率为0.85。可见,“消”常居于双字词词首,这为读者提供了较清晰的词边界信息。连坤予等人(2021)发现被试在低词素位置概率条件下的凝视时间显著长于高概率条件,表现出明显的词素位置概率效应。而且读者对词素位置概率的利用表现出发展上的差异性,即大学生运用词素位置概率帮助词切分的能力强于小学生(Liang et al.,2015)。词素位置概率现象是中文词汇的显著特点,中文以汉字为书写单元,汉字携带一定意义且是汉
9、语最小的语言单位,而词素是指具有独立形态和意义的最小语言单位(张玲燕 等,2013),同时,汉语书写系统中大多数词是双字词,词素位置信息相对明确(赵思敏 等,2017)。据统计,约20%的汉字出现在多字词的固定位置,其中8.2%惯常居于词首,7.5%惯常居于词尾,2.1%以单字词形式呈现(白学军,闫国利,2017),词素位置的这一特性为中文读者提供了词与词之间隐含的边界,为中文词汇的切分提供了可用线索。因为中文词汇的识别与切分区别于拼音文字,拼音文字中的空格为读者提供了明确的单词首尾部分的物理空间边界信息,帮助计划下一次眼跳,促进单词的识别(Perea&Acha,2009;Rayner,199
10、8)。而中文无词间空格标示词边界,邻近的汉字可组成双字词、三字词及四字词,并且中文组词的模糊性也加大了词切分难度(Gao et al.,2005),但中文读者并未遭遇特殊阅读困难,其阅读速度可与拼音文字读者保持一致(Liversedge et al.,2016),那么中文读者如何进行词切分就成为汉语阅读的一个独特问题,其必定借助某些隐含线索协助词切分。此时,词素位置概率信息可作为一种隐含的语言线索帮助词切分,由于词素经常出现在双字词的某一特定位置(词首或词尾),一定程度上标示出了词与词之间的隐藏边界,据此,研究者们开展了一系列研究。梁菲菲(2013)用新词习得的方式探讨了中文读者对词素位置概率
11、线索的使用,研究操纵首、尾词素的位置概率,创设三种类型的假词作为新词,发现在词素位置概率一致条件下的注视时间和注视次数显著低于不一致条件。Yen等人(2012)采用边界范式的研究表明,中文读者能够利用词尾词素位置概率指导词汇识别和眼跳控制。高淇(2018)以儿童和成人为研究对象,对词首、尾词素位置概率的关系进行了推论,即词首词素位置概率的高低对儿童和成人的阅读行为没有影响,但词尾词素位置概率显著影响了儿童和成人的阅读表现,研究结果进一步肯定了词尾词素位置概率的词切分作用。然而一项后续研究提供了不同的实验证据,即儿童和成人均能利用词首和词尾词素位置概率指导阅读活动(连坤予 等,2021)。可见,
12、词首与词尾词素位置概率在阅读过程中的作用还未取得较为统一的观点,是词尾词素位置概率发挥了主要作用,还是词首与词尾同等重要?这一问题的解决有待开展后续研究深入考察与澄清。值得一提的是,有研究指出低频词倾向于词素通达,而高频词可能经由整词路径通达(高淇,2018)。换言之,在心理词典中低频词倾向于以单个字的形式进行表征,而高频词常以整体形式表征(白学军 等,2015)。事实上,中文复合词的表征方式一直存有争议,在识别复合词时,是通过整词表征亦或经由分解的词素表征,以及二者发挥作用的程度如何,一直是心理语言学研究的热点问题。研究者基于不同的研究材料、范式及技术手段给予了第2期 曹海波 等:词素位置概
13、率在中文阅读中的作用:词汇判断和眼动研究 161 不同程度的回答,既往研究证据提示词频会影响词汇加工,高频词的注视时间显著低于低频词(Wei et al.,2013),从高频中央凹词到副中央凹词的眼跳长度显著长于从低频词跳出的眼跳长度(王永胜 等,2018),对不同词频的使用会影响真词与换位假词的判断(Vergara-Martnez et al.,2013)。相关研究指出词素特征是词汇识别的重要影响因素,并且在低频词加工中表现的更加明显(彭聃龄 等,1999)。与词素位置颠倒的高频词相比,读者对词素位置颠倒的低频词识别较慢(卞迁 等,2010)。可见,整词的词频对词汇的加工具有潜在影响。研究者
14、还关注到,在中文的词汇识别过程中,首词素与尾词素对整词识别的贡献不同,且词频的变化会带来阅读行为的改变,这使得词频对词素位置概率线索的作用成为一个新问题。不同词频条件下词素位置概率还能否发挥作用,词首与词尾词素位置概率的作用差异如何?探查既往研究发现其未对词频做出具体区分,这是否成为词首与词尾词素位置概率作用不同的潜在影响因素?另外,根据经典的词汇识别模型,如McClelland和Rumelhart(1981)的交互激活模型、Davis(2001)的自我组织词汇习得与识别模型、Taft(2004)的多层激活模型,词频是进入词汇通达的重要因素,其可能会影响到汉语词素位置概率对词汇识别的加工呈现出
15、不同的模式。Li和Pollatsek(2020)提出的中文阅读的整合模型也指出词频是影响词汇识别的重要因素,词频直接影响词汇节点的输入,并成功预测了词频对眼跳长度的影响。鉴于此,有必要在探究首、尾词素位置概率认知机制的基础上,进一步明确整词词频的内在影响,探究中文复合词的加工方式,即复合词的表征究竟是基于词素、整词,亦或是混合通达?据此,对上述问题的考察便体现出一定的新意和价值。第一,对复合词认知加工的组件词素作用的研究,可加深对复合词通达表征网络的理解。第二,当前汉语词素位置信息加工机制的研究尚浅,持续探讨词素位置概率之于词切分的作用,有助于回答中文读者如何确定词边界的问题,为仍处于探索中的
16、汉字位置编码机制提供新视角。研究设计了4个实验,实验1a和1b采用词汇判断任务,创设不同的首、尾词素位置概率条件,同时操纵目标词词频。另外,由于汉语中高、低频词汇难以平衡词首和词尾的词素位置概率,故未采用2(词频:高、低)2(词首词素位置概率:高、低)2(词尾词素位置概率:高、低)的实验设计,而是采用2(词首词素位置概率:高、低)2(词尾词素位置概率:高、低)的两因素被试内重复测量实验设计,分开考察词频因素的影响便于更清晰地考察不同词频条件下词素位置概率的重要程度。词素位置信息的加工是词汇加工的重要阶段,词首与词尾在词汇识别过程中发挥着不同作用,词首作用较为积极,研究假设:词素位置概率信息是中文词汇识别的语言线索,且与词尾词素位置概率相比,词首词素位置概率在词汇识别中的促进作用更大。实验2a和2b采用句子阅读任务,记录被试在句子阅读过程中的眼动特征,进一步考察处于生态效度更高的自然阅读情景下词素位置概率效应是否存在,以及作用发挥在加工的哪一阶段。研究假设:读者能利用词素位置概率线索帮助词切分,词首词素位置概率的优势更为明显,同时词频会影响这一作用的发挥,即低频词条件下读者能够运用词素位