1、第 25 卷 第 2 期 宁波教育学院学报 Vol.25 No.2 2023 年 4 月 JOURNAL OF NINGBO INSTITUTE OF EDUCATION Apr.2023 收稿日期:2022-01-28 基金项目:四川省教育厅人文社会科学重点研究基地四川学前教育发展研究中心课题:学前儿童科学素养影响因素的实证研究(CECER-2019-C04)第一作者简介:张入川(1986-),男,四川内江人,讲师,研究方向:教育基本理论与实践。PISA 阅读素养研究文献综述 基于 CNKI 数据库的可视化分析 张入川,方 磊(四川幼儿师范高等专科学校,四川 绵阳 621709)摘要:选取国
2、际学生评估项目(PISA)中的阅读素养测评维度,通过 Citespace 软件对基于 CNKI 数据库20022021 年有关 PISA 阅读素养的研究成果进行数据输出,绘制成知识图谱,并对数据结果进行可视化分析。研究结果表明:阅读能力、阅读教学、非连续性文本等为高频次与高中心性关键词;非连续性文本的研究以及数字化阅读素养这类新型研究视角开始出现。关键词:PISA;阅读素养;CNKI;Citespace;文献综述 中图分类号:G201 文献标识码:A 文章编号:1009-2560(2023)02-0121-06 阅读被联合国教科文组织确定为人类生存与终身学习的重要技能,阅读素养的好坏对于学生能
3、否有效适应学习、政治、经历、文化、生活都具有显著影响。学生的阅读能力是学生学科学习的一项基础性能力,良好的阅读素养不仅是学生开展学科学习的基础,更是参与未来社会政治、经济文化生活的重要前提。PISA 是经济合作与发展组织(OECD)对 15 岁学生在阅读、数学、科学能力方面进行测评研究的国际项目,因参与国家(地区)之多、国际影响力之大,被人们称为教育界的“奥林匹克”,阅读素养维度在每次 PISA 中都是重点测评内容。Citespace 是一款可视化文献分析软件,通过识别重要的文献,绘制并形成关联图形,能挖掘、分析和显示学科或知识领域的发展态势,有助于了解和预测科学前沿和动态。本文借助 Cite
4、 Space(5.7.R2)对 PISA 阅读素养研究文献进行可视化分析,通过呈现知识图谱,探究PISA 阅读素养的研究动态、热点与演进趋势,以厘清该领域发展脉络。一、研究数据 以中国知网数据库(CNKI)为数据依据,用高级检索功能进行检索,设置检索主题为“PISA”AND“阅读素养”,设定条件为“中 英 文 扩 展”,发 文 时 间 范 围 为“2002.1.1-2021.12.31”。输出结果显示,共检索到相关文献624篇,剔除广告、资讯、简讯、传真、通知、会议、报纸等不属于完整研究范式的文献 56 篇,最后得到符合条件且可分析的文献共计 568 篇。二、研究方法 本研究综合利用基于 CN
5、KI 的数据知识图谱可视化工具以及陈超美教授开发的基于JAVA 的可视化分析软件 CiteSpace,通过连线、节点、标签、数量等单位将相关文献以DOI:10.13970/ki.nbjyxyxb.2023.02.011122 宁波教育学院学报 2023 refworks 文本形式导入 citespace input,形成download 文本,时间跨度选定为 2002 年 1 月 1日到 2021 年 12 月 31 日,时间切片(years per slice 设定为“1”,阈值设定为“top 50 perslice”,将数据导入并进行数据格式转换后呈现知识图谱,进行可视化分析,分析内容包括
6、:发文作者、发文机构、关键词共现等。三、关键词共现分析 利用分析文献关键词共现的方法,可确定某一学科领域的研究热点1。关键词共现表达了某一学科或某一领域研究主题或研究方向术语呈现度,一个年轮代表一个节点,关键词频次由年轮大小决定,字体大小与频次高低呈正相关。运用CiteSpace5.7.R2软件对关键词进行共现分析,“time slicing”选择从“2002.1-2021.12”,“Node Types”网络节点选择为选择“Keyord”,每个时间切片选为“Top50”(每单位为 1 年的时间切片中排名前 50 关键词)的数据对象,阈值选择分别设置为“(2,2,20)”“(4,3,20)”“
7、(4,3,20)”,网络裁剪使用“Pathfinder、pruning sliced networks”,对文献进行分析。采用最小成树算法,绘制出近 PISA 阅读素养关键词共现图谱(图 1),得到了 461 个节点即 461 个关键词,897 条连线代表了关键词之间的共现关系。对文献做进一步共现分析,绘制出 PISA阅读素养研究高频次与高中心性关键词数据 图 1 关键词共现图谱 表 1 高频次与高中心性关键词数据 序号 关键词 频次 中心性 初现年 序号 关键词 频次 中心性 初现年 1 PISA 156 0.75 2005 7 PISA2018 19 0.05 2017 2 阅读素养 14
8、9 0.41 2003 8 启示 13 0.01 2008 3 reading literacy 38 0.56 2004 9 数学素养 13 0.02 2008 4 阅读教学 31 0.17 2013 10 阅读能力 13 0.03 2008 5 非连续性文本 30 0.04 2014 11 测评框架 12 0.03 2012 6 pirl 25 0.12 2005 12 阅读 10 0.01 2014 第 2 期 张入川等:PISA 阅读素养研究文献综述 123(表 1),显示了该领域关键词共现情况。关键词是文章的高度概括,其频次值越高,研究者对其重视程度也越高。关键词频次排名前 10 依
9、次为:PISA;阅读素养;reading literacy;阅读教学;非连续性文本;pirl;PISA2018;启示;数学素养;阅读能力。这些关键词属于高频数词,也代表了该领域研究热点。Betweenness centrality 表示中介中心性,在 CiteSpace 软件中,中介中心性超过 0.1 的节点被称为关键节点,中介中心性代表的是节点在共词图谱中重要性的衡量指标,关键词中心性表示对其他关键词中介作用的大小。一般认为关键词中心性0.1,说明这些关键词在某些时期受到了研究者较高的共同关注。中心性为 0.75 的“PISA”以及其他中心性较高的关键词,如“阅读素养”“reading li
10、teracy”“阅读教学”“非连续性文本”“pirl”“PISA2018”等关键词的中介中心性较高,说明这些词与其他关键词的节点连线多,这些中介中心性较高的关键节点在很大程度上也会影响聚类标签的提取。四、关键词聚类分析 对关键词进行聚类分析,绘制出关键词聚类可视化图谱(图 2),通过 Cluster view(聚类视图)进行分析。Modularity 表示聚类模块值(Q值),一般认为Q0.3 意味着聚类结构显著,关键词聚类可视化图谱显示 Q=0.768,意味着聚类结构呈现显著特征。如图2所示,得到聚类结果有 17 类,数字越小,聚类中包含的关键词越多,每个聚类是多个紧密相关的词组成的,具体的关
11、键词可以通过导出的报告得到详细信息。按照数字由小到大的聚类结果前 10 包括:“阅读素养”“非连续性文本”“reading literacy”“pisa”“数字化阅读素养”“equivalence”“pisa reading literacy”“Social inequality”“pirls”“diagnostic self-evaluation”等。同时,这些聚类标签的“size”值都大于 10,说明这些聚类都是“PISA 阅读素养”相关研究的重点内容。根据对关键词聚类图谱及相关文献进行进一步 图 2 关键词聚类图谱 124 宁波教育学院学报 2023 的分析,得出“PISA 阅读素养”主
12、题文献的热点范围:一是对非连续性文本的探讨,它是由逻辑、语感不严密的段落层次构成的阅读文本形式,由于非连续性文本在结构和语言上不具有完整的故事性,因此它比叙事性文本更能够直观地表达编者传递的基本信息,具有概括性强、醒目、简洁等特点。二是数字化阅读素养是该领域研究的新型视角,数字阅读有两层含义:第一层含义是阅读对象的数字化,也就是阅读的内容是以数字化的方式呈现;第二层含义是阅读方式的数字化,就是阅读的载体、终端不是平面的纸张,而是带屏幕显示的电子仪器,数字化阅读日益受到各国年轻人的欢迎和追捧。三是对“equivalence”(等效性)研究区域的探索,如对建立基于纸本和计算机评估的 PISA阅读理
13、解等效性研究等。对关键词做聚类分析,可得到 Cluster labeling(聚类标签),并自动聚类提取出 7 个标签词,绘制出关键词聚类表(表 2)。Silhouette 表示聚类平均轮廓值(S值),一般认为S0.5 聚类结构为合理性的,S0.7 意味着聚类结构是令人信服的,可视化图谱显示S=0.9346,意味着聚类结构呈现令人信服特征。各聚类标签平均轮廓值均范围浮动在0.861,0.99,都大于 0.7,意味着聚类结构是可信的。各聚类标签也包含了高频词汇,如“非连续性文本”“reading literacy”“pisa”“数字化阅读素养”“equivalence”“pisa reading
14、 literacy”等,平均年份是关键词首次出现所在年份,反映了相关研究历程的演进与研究趋势的预测。(一)阅读形式研究 在 PISA 阅读素养中,非连续性文本作为阅读形式的一种,并没有明确规定与连续文本的形式不同,非连续性文本不是以句子为最小单位,其需要不同于连续文本的阅读策略文本2。非连续性文本作为一种常用的文本形式,张年东、荣维东将非连续性文本分为两类:一类是以图文结合方式呈现的非连续性文本;另一类则是为了更清楚地说明某一主题,而选自不同材料的纯文本信息组合3。数字化阅读素养已成为学生发展所必备的一项关键素养,PISA 对数字化阅读素养内涵进表 2 主要关键词聚类 序号 聚类标签 容量 值
15、 主要关键词 平均 年份 0 阅读素养 57 0.956 科学素养;数学素养;非连续性文本;物理规律;欧洲学生终身学习;pirls 项目;阅读程序;图书馆 2012 1 非连续性文本 53 0.861 阅读;教学策略;文本信息;中考语文;文本类型;阅读测试;有效策略 2016 2 reading literacy 49 0.957 reading engagement;reading education;random forest;pisa 2018;metacognitive strategy 2013 3 pisa 45 0.943 测评;OECD;education policy;dig
16、ital reading;cultural capital;阅读情境 2013 4 数字化阅读素养 28 0.894 阅读;素养;影响因素;小学生;核心素养;数字化阅读;数字化阅读素养 2015 5 equivalence 23 0.875 difficulty level;problem-solving strategy;reading;translation;academic achievement;student teachers;problem solving 2014 6 pisa reading literacy 23 0.975 heat maps;cognitive predictor;eye-tracking;reading comprehension;longitudinal study;development;family-risk for dyslexia;strategies of reading;pisa;阅读素养 2015 7 Social inequality 23 0.943 school performance;educational transit