收藏 分享(赏)

多维度个人学术轨迹绘制与分析_谢珍.pdf

上传人:哎呦****中 文档编号:2370069 上传时间:2023-05-10 格式:PDF 页数:12 大小:3.13MB
下载 相关 举报
多维度个人学术轨迹绘制与分析_谢珍.pdf_第1页
第1页 / 共12页
多维度个人学术轨迹绘制与分析_谢珍.pdf_第2页
第2页 / 共12页
多维度个人学术轨迹绘制与分析_谢珍.pdf_第3页
第3页 / 共12页
亲,该文档总共12页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、总第 74 期 2023 年 第 2 期Data Analysis and Knowledge Discovery多维度个人学术轨迹绘制与分析*谢珍1,2,3 马建霞1,2 胡文静1,21(中国科学院西北生态环境资源研究院 兰州 730000)2(中国科学院大学经济与管理学院信息资源管理系 北京 100190)3(西安翻译学院图书馆 西安 710127)摘要:【目的】提出一种多维度个人学术轨迹绘制框架,探索个人学术轨迹绘制和可视化呈现方法。【方法】以时间序列为引线,从研究产出、研究主题、研究脉络、内容演进4个维度,综合运用统计分析、语义技术和可视化分析工具,多维度呈现学者的学术轨迹。【结果】以

2、冰冻圈科学领域两位学者为例,绘制个人学术轨迹。与现有工具相比,本文方法能拓展数据分析维度,丰富可视化呈现形式。【局限】数据源主要是论文数据,还需进一步整合专利、项目等其他形式的学术成果数据;绘制过程需要分别使用多个工具软件,还需要更多的工作实现这些工具的集成和平台化整合。【结论】本文方法可用于学术画像、学者评价、代表作遴选等工作实践中,也能为个人学术成果集成和分析平台提供借鉴。关键词:学术轨迹 可视化 主题聚类 自引网络 关键词演进分类号:G353DOI:10.11925/infotech.2096-3467.2022.0329引用本文:谢珍,马建霞,胡文静.多维度个人学术轨迹绘制与分析 J.

3、数据分析与知识发现,2023,7(2):129-140.(Xie Zhen,Ma Jianxia,Hu Wenjing.Mapping and Analyzing Personal Academic Trajectory from Multiple DimensionsJ.Data Analysis and Knowledge Discovery,2023,7(2):129-140.)1 引 言学术轨迹是指科学研究在时间序列上的发展演变过程。梳理和回顾某学科1、重要理论2、学派2、研究主题3、期刊4的学术轨迹,能够展现学术研究的发展历程,把握未来研究态势。个人学术成果亦具有连续性和不平衡性5,

4、不同阶段、不同主题的学术成果是学者研究特点的具体体现;单项学术成果在学者学术生涯中的重要性也是不同的。绘制学者的个人学术轨迹,能够把握学者的研究全貌,了解其研究的来龙去脉,凸显研究的关键节点,在学术画像、学者评价、代表作遴选等工作中有良好的应用前景。对学术成果进行统计分析和内容挖掘,了解学者的研究主题、凸显研究贡献、评价研究水平是个人学术轨迹绘制的重要方面6-9;一些学术成果集成平台10-12也利用文献计量和文本挖掘等方法呈现学者的学术状况和研究主题。但个人学术轨迹绘制要能够呈现学者的研究全貌,而不是反映学者研究的某个侧面;要深入挖掘学术成果的主题内容和沿袭关系,而不是简单地统计分析;要细致描

5、绘研究的动态发展过程,而不是静态描述研究主题或文献数量。因此,需要构建一个系统的学术轨迹绘制框架,拓展数据分析维度,改进数据分析方法,丰富可视化呈现形式,探索全面深入、具有较好适用性的个人学术轨迹绘制方法。本文提出一种多维度个人学术轨迹绘制框架与通讯作者(Corresponding author):马建霞(Ma Jianxia),ORCID:0000-0002-5401-9992,E-mail:。*本文系中国科学院文献情报能力建设专项(项目编号:Y8ZG071)的研究成果之一。The work is supported by the Literature and Information Cap

6、acity Building Project of Chinese Academy of Sciences(Grant No.Y8ZG071).129研究论文数据分析与知识发现分析方法。从不同维度构建一个较为全面系统的学术轨迹绘制框架,并通过丰富的可视化形式呈现,能够完整、直观地展现学者的学术轨迹,全面深入剖析学者的研究内容和特点,凸显学者学术生涯中的主要贡献。2 研究综述现有个人学术轨迹相关研究主要分为两个方向:一是以叙述方式为主,对学者的研究历程和贡献进行总结概括。例如,通过学术大家的学术轨迹反映某研究主题的发展历程13-14;对重要学者的学术成果进行评述,肯定其学术贡献15-16;自传式

7、总结回顾个人的学术生涯 17-18。此类研究通常以学术大家、名家为对象,高度概括并凸显学者的学术成就。该方法对普通学者适用性不够且以归纳总结为主,分析的主观性较强。二是通过文献计量和文本挖掘方法从研究主题、引用关系或影响力角度呈现学者的学术轨迹。例如,文献 6 利用LDA主题模型对以遗传学家谈家桢为核心的学术谱系进行研究,探索其研究主题的变化及知识传承的规律。文献 8利用 Pajek、VOSviewer 和 Nvivo 等工具对 Hope A.Olson的学术论文进行深入分析,构建以学者为中心的被引作者网络、施引作者网络、合著者网络、语义网络,分析其在知识组织领域的学术工作和贡献。文献 19

8、提出学术迹指标,绘制学术矩阵评价学者的综合性学术影响力。文献 7 基于上海交通大学特藏资源,对李政道教授的多类型成果进行标引并分析其研究轨迹和学术影响力。还有一些研究落脚于学者的学术生涯研究或重要文献发现,例如,文献9 将自引网络与内容分析相结合,利用NodeXL工具,挖掘学者的研究主题并根据点入中心度等指标发现重要文献。文献 20 基于学者合作网络和论文相似网络的双层网络模型,分析学者的学术发展阶段及研究主题。已经有一些工具和平台能够实现以学者为中心的个人学术成果数据分析和呈现。White21提出一种学者特征自动生成和在线编辑方法,以学者为中心组织并分析书目数据,映射学者的研究主题。一些机构

9、知识库12也嵌入了个人学术成果统计和可视化呈现功能,通过对出版物书目数据的分析展示学者的学术轨迹;Rexplore22是以语义构建为特色的学术数据整合分析工具,亦可以个人为中心进行学术成果数据分析;AMiner10,23实现了多源学术数据整合,通过统计分析、语义技术和可视化呈现技术绘制学者的学术轨迹。综上,对学术成果进行统计分析和内容挖掘是个人学术轨迹绘制的重要方法,并在实践中得到了应用。但现有个人学术轨迹分析维度还比较分散,缺乏一个完整的绘制框架,对研究全貌展现不足;学术数据的分析层次较浅,对主题内容的结构及沿袭关系的挖掘还不够深入;分析工具各有侧重,数据分析和可视化呈现形式还比较单一。本文

10、构建多维度个人学术轨迹绘制框架,综合运用统计分析、语义挖掘和可视化技术,从不同维度深入分析并呈现学者的研究特征,全面、动态、深入地绘制个人学术轨迹,拓展个人学术成果分析维度,丰富可视化呈现形式。3 学术轨迹绘制框架设计与数据准备3.1框架设计轨迹是指动点在空间的位置随时间连续变化而形成的曲线。个人学术轨迹以时间序列为引线,以学术成果为切入点,描绘学者研究的时空演变过程。本文从宏观和微观两个层面构建学术轨迹绘制框架。宏观层面主要关注学者的学术全貌,呈现研究发展过程,包括研究产出和研究主题两个维度。一般来讲,产出论文的数量越多,表明该学者的研究工作越活跃;以第一作者或通讯作者身份发表的论文越多,表

11、明该学者在研究中的主导性越强。本文从研究的活跃度和主导性描述学者的研究状态,通过研究状态分布图直观呈现不同时间段学者的研究状态。研究主题是描述学者研究的重要特征维度。首先通过主题建模从全局角度描述文本特征,提取学者研究主题内容;再挖掘文档间潜在语义联系,将单篇论文聚合到相应的主题中;进而绘制具有时序特征的研究主题聚类图。不仅能整体把握学者研究的主题内容,挖掘研究重点,还能从研究的持续性、产出率、主导性等方面对各主题进行分析,识别重点主题。微观层面旨在从不同维度建立知识单元间的联130总第 74 期 2023 年 第 2 期Data Analysis and Knowledge Discover

12、y系,呈现知识流动过程和研究的内部结构,凸显重要研究节点,包括研究脉络发展和内容演进两个维度。一方面,以引用关系为切入点,建立论文间的相互联系,绘制自引时序网络图。自引时序网络图能刻画学者学术研究的沿袭发展过程,展现研究脉络发展;此外,对自引网络结构的分析亦能体现学者的研究特点,发现重要文献。另一方面,关键词可以细粒度观察学者的研究内容及其变化,也在一定程度上弥补了自引时序网络的不足。通过关键词聚类和共现,建立研究内容间的联系,绘制关键词热力分布图,呈现研究的知识内容及演化过程。本文从宏观全貌和微观结构、时间序列和空间演变、统计分析和主题聚合、引用关系和内容演进等多层次、多角度绘制学者的学术轨

13、迹,展现学者的研究发展历程,剖析并凸显重要主题和关键节点。具体分析框架如图1所示。3.2数据准备以冰冻圈科学领域A和B两位学者为例,展示个人学术轨迹绘制方法和流程,呈现可视化效果并进行分析验证。两位学者研究持续时间长,论文数量多,有较完整的基础数据;研究学科相近又各有侧重,可以进行适当的对比分析。为尽可能完整地收集到学者的论文数据,从Web of Science数据库获取英文期刊和会议论文数据,从CSCD数据库获取中文期刊论文数据,从CNKI会议获取中文会议论文数据,除去人物传记、卷首语、书评及重复数据等,共获得学者A的论文517篇,学者B的论文528篇。数据收集时间为2021年12月。4 个

14、人学术轨迹绘制与分析4.1基于研究产出的研究状态分布(1)研究状态四象限划分依据生命周期理论24,科研人员的学术生命周期可分为初创期、发展期、成熟期和衰退期。研究产出数量能够反映学者研究的活跃程度,是学术生命周期划分的重要依据25,也能够反映学者的成长阶段及研究特征26,是个人学术轨迹的基础指标。但学者的研究生涯既遵循一定的顺序性,又具有阶段性和个性化的特点,仅从线性时间序列对研究阶段进行划分具有局限性。考虑到在代表作评价、职称评审、人才选拔等工作中大都只认可第一作者或通讯作者论文,本文在研究活跃度的基础上引入研究主导性维度,将学者的第一作者和通讯作者论文称为“主导论文”,通过主导论文数量占比

15、反映研究过程中学者的主导性。将研究活跃度和主导性相结合,能够呈现学者研究的非线性发展过程,观察不同时间段学者的研究状态。结合学术生命周期理论和研究的阶段性特点,将学者的研究状态分为积累状态、上升状态、巅峰状态和稳定状态,如图2所示。图1个人学术轨迹绘制框架Fig.1The Mapping Framework of Personal Academic Trajectory图2研究状态四象限划分Fig.2Four Quadrants of Research Status131研究论文数据分析与知识发现积累状态是指研究活跃度和主导性都比较低,通常处于研究的积累、休整或衰退阶段。上升状态是指学者以独立

16、或自主研究为主,研究主导性高;但由于科研合作较少等原因,研究成果的产出量不如稳定状态和巅峰状态。稳定状态是指研究活跃度高但主导性低,学者论文产出数量较多但多以非主导地位参与研究;或者因为广泛的科研合作,论文产出量大,导致主导论文占比下降。巅峰状态是指研究活跃度和研究主导性都很高,既是研究的主导者又有广泛的科研合作,处于研究的巅峰期。从整个研究生涯来看,积累状态-上升状态-巅峰/稳定状态交替的发展反映了学者从科研新人逐渐成长为成熟研究者的过程;就个人而言,现阶段所处的研究状态、每种状态持续时间的长短、不同研究状态间的过度和转换体现了学者的研究特点和发展态势。(2)实证与分析绘制学者A和B的研究状态分布,如图3所示。横轴为论文数量,纵轴为主导论文占比,横坐标轴值为所有年份主导论文占比的中位数,纵坐标轴值为所有年份论文产出数量的中位数,点代表该年学者的研究状态。从研究状态的阶段性来看,学者 A 在 1979 年-1984年、1988年-1993年主要处于研究上升状态,1994年-1998年处于研究积累状态,1999年-2015年主要处于研究的稳定和巅峰状态。其中,2000年、2004 年-2

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 专业资料 > 其它

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2