1、袁东彤等:金融科技的知识图谱分析基于大数据与文献计量的视角 153 金融科技金融科技的知识图谱分析的知识图谱分析 基于大数据与文献计量的视角 袁东彤 张桥云 顾瑞涛 曾建光*摘 要:金融科技促进了金融产品市场的不断发展,探寻金融科技的现状及研究路径是金融科技研究领域的一个突出重点。为了解金融科技的研究现状,厘清金融科技的研究路径和未来走向,本研究首先运用文献计量法,以 Web of Science 数据库(19822020 年)中关于金融科技的文献为分析对象,使用 Cite Space 可视化软件分析了 39 年间金融科技的研究领域和核心内容,并通过分析文献的引用频次,评估了金融科技的研究热点
2、,预测了金融科技研究的发展趋势。研究结果表明,自 1982 年之后,金融科技的研究数量呈指数级增长;研究成果主要发表在计算机和能源类期刊,传统经济类期刊发文量较少,金融科技的跨学科和多学科的研究较为薄弱,研究成果的质量有待提高;计算机成为金融科技研究的主要工具,计算机科学的发展影响并促进金融产品市场的发展、引领金融时代的走向,以计算机应用为特征的金融科技研究目前仍处于热点研究阶段,未来的金融科技具有人工智能特征,低成本和高效率的运作模式,将极大改善传统的金融行业运行。关键词:金融科技;文献计量分析;Cite Space;大数据;可视化分析 一、引 言 金融科技(financial techno
3、logy,fintech)是金融产品市场的重要工具,其内容主要包括新出现的经济模型、新技术、新产品服务、大数据和人工智能等。寻找和分析金融科技研究路径以实现经济的快速和稳定增长是当前世界经济由增量发展转向质量发展阶段的重要课题。早在 1986 年,Sloan 和 Adam(1986)就已经提出,金融科技在宏观领域和微观领域中都十分重要。经过 30 多年的发展,金融科技已经形成了一个较为规范的研究体系。随着全球经济增长速度下滑,金融产品市场竞争日益激烈,金融科技需应对市场进行变革。在这样的背景下,国家、银行及其他金融机构和个人应该合理地运用金融科技手段来预测经济危机和信用风险(陈红等,2020;
4、金洪飞等,2020;姚婷和宋良荣,2020)。在金融科技的实际运用中,大量的方法用来改善金融科技的技术水平,例如 Graphics Processing Unit(GPU)、并行计算和神经网络处理(NPU)等(Rainer 等,2018),其中 GPU 被认为是提升金融科技的重要手段(Leong 等,2017),是收集和分析金融市场数据的硬件基础(Arner 等,2020)。文献分析是研究探索金融科技发展的重要手段,是了解金融科技研究前沿的工具,通过文献可了解金融科技领域的研究现状,预测未来的发展趋势,探索和发展相关领域。在文献研究中,各种文献涌现或者减少,其原因总是与该领域取得的重大突破或者
5、相关领域出现的较大事件有关。譬如*袁东彤,西南财经大学金融学院博士研究生;张桥云,西南财经大学金融学院教授,博士生导师;顾瑞涛,西南财经大学金融学院博士研究生;曾建光(通信作者),重庆大学经济与工商管理学院教授,博士生导师。E-mail:。作者感谢重庆市留学人员回国创业创新支持计划项目(cx2019154,cx2020119)、重庆市社会科学规划项目(2020YBGL80)和重庆大学教学改革研究项目(2019Y04)的资助。DOI:10.19313/10-1223/f.2022.06.006产业经济评论 2022 年第 6 期 154 2008 年出现的全球性金融危机,直接促使经济学领域出现了
6、大量的与经济危机预防和处理方案相关的研究,研究成果层出不穷。同样,2020 年爆发的新冠肺炎疫情也促进了医学、政府监管、经济管理等领域的研究,与有效疫情防控和经济复苏措施有关的研究大量涌现。从疫情的发展来看,除个别国家和地区外,疫情均得到了有效控制,这与科研工作者的持续研究密切相关,同时,与之相关的研究文献大量涌现。随着后疫情时代的到来,相关文献将会逐步减少。这些现象充分说明,文献分析可以很好地捕捉科学研究领域的热点问题,并能提供解决当前问题的有效途径。在应用经济学研究领域中,金融学是将科学理论和实际运用结合的重要学科,金融科技是金融学中重要的研究领域,与传统应用经济学研究不同的是,金融科技更
7、加依赖于计算机领域的发展。面对海量的对称信息和不对称信息,金融科技可通过高效、便捷的方式进行处理,并基于信息处理,对各种经济问题进行分析,能为政府、机构和个人降低风险与提升收益提供最优决策。文献计量是一种科学的文献分析方法,它可以全面地综合分析某研究领域的研究热点,并进行分类和总结(Calma 和 Davies,2015;Calma 和 Davies,2016;Chen 等,2014),还可以将分析对象进行分类和综合,并刻画出专业的研究分布图(Cobo 等,2015)。文献计量可以识别和捕捉研究领域的起点和发展变化。首先,文献计量的时间线索(time line)图可以清晰地呈现某一研究领域的产
8、生和发展过程,并以时间交叉图的形式表现出来,还可以很好地解释某一类文献集聚的现象,即某一新理论出现后,短时间内大量出现的对该理论的应用或者修正和补充的文献。其次,文献计量通过时间脉络和合作共引图识别并预测某领域的研究趋势。例如,通过扫描算法和统计模型对相应关键词进行分析来预测趋势。此外,文献计量通过三维可视化方式来分析科学领域的研究衍化过程,并进行突发性检测和核心文献提取,便于科研工作者把握研究发展路径。由于计算机和互联网的快速发展,文献计量学也有了长足发展,并已广泛运用于经济、金融、管理学、数学、统计学等学科领域(Chen,2006;Chen 等,2008;Du 和 Teixeira,201
9、2)。王孝宁等(2004)选用文献计量学指标,利用改进后的期刊影响因子等级区域赋值方法,同时引入不同排序著者的贡献率指标,建立了科技论文定量评价的数学模型,为科研管理工作提供了一种新的评价方法,可与同行评议互为补充;任红娟和张志强(2009)综合研究了科学知识图谱领域的发展状况,以定量和定性研究相结合的方法对科学知识图谱研究领域进行了全面的描述;李雪蓉等(2016)采用文献计量的方法对商业模式研究的发展进行了梳理与剖析,通过对文献样本进行基本统计和共引网络分析,发现商业模式研究的最新热点集中在商业模式的分析诊断和创新设计,并以文献计量学的途径很好地展示了商业模式研究的特点;陈元志和吉超(201
10、9)、陈悦等(2019)、耿献辉等(2020)等都运用不断更新的文献计量学知识对各个领域进行了分析。这充分说明,文献计量学是一门不断发展、广受学者们欢迎的文献分析方法。文献计量不仅可用于分析文献主题、研究热点等,还可用于研究期刊,例如,Chen 等(2008)的主要电子商务期刊研究的文献计量和可视化分析。Chan 等(2009)搜集了 19952008 年的数据,使用 Cite Space 软件,研究分析了欧洲的金融管理;Zhang 等(2021)以全球氮循环及其基本过程为研究对象,在 Web of Science 核心收藏集中进行了文献搜索,然后使用 Cite Space 文献计量可视化软件
11、研究了 19622020 年该研究领域的发展,并以可视化的方式呈现了该研究领域的发展状况及其内部关系,发现自 1990 年后,该研究方向呈井喷式增长。本文通过对金融科技相关文献的可视化分析,试图解决如下四个问题:分析金融科技相关领域的作者、机构、期刊的分布情况;分析金融科技相关领域的标志性文献及其影响;分析金融科技领袁东彤等:金融科技的知识图谱分析基于大数据与文献计量的视角 155 域的阶段性特点和热点关键词;厘清金融科技领域的研究脉络和发展趋势,为今后的相关研究奠定基础。二、数据来源与研究方法(一)数据来源 本文所有数据都来源于 Web of Science(SCI-E 和 SSCI)核心合
12、集,从数据平台上获取的数据主要包括与金融科技相关的论文的摘要、关键词、引用、作者、研究机构、国家和地区,以及下载记录。需要特别指出的是,本文在下载数据和分析的时候,所下载的中国香港和台湾地区的数据并没有和中国内地的进行合并分析,而是分类进行了数据分析。下载数据共计 5 627 条,数据获取时间点是 2020 年 10 月 6 日。金融科技与企业盈利能力的相关关系实证所需数据主要收集于 CSMAR和 Wind 数据库。(二)研究方法 本文基于文献计量学方法,主要运用美国 Drexel 大学陈超美教授开发的 Cite Space 文献数据可视化软件进行分析,并根据 Merig 等(2015)的方式
13、构建了本研究的具体分析方法,如下:主题:“finance technology”,时间:“all year”,数据资源:Web of Science。Cite Space 的关系强度的算法主要有 Cosine 算法、Jaccard 算法和 Dice 算法。如下所示:Cosine 算法:(,)ijijijijcCosine c s ss s=Jaccard 算法:(,)ijijijijijcJaccard cs sssc=+-Dice 算法:2(,)ijijijijcDice cs sss=+研究通常采用的是 Cosine 算法,将数值标准化在 01 之间,cij为i和j出现的次数,si为i出现
14、的次数,sj为j出现的次数,在广义相似性指数(Eck 等,2009)基础上可以表示为:2(,)(,1)(,)(,)1ijijGijijijijijijJaccard cs sscs sDice cs sJaccard cs s=+本文运用 Cite Space 软件来实现这些相似性算法,用时间切片间和时间切片内进行计算分析。三、金融科技研究成果的描述性统计 通过 Web of Science 数据集汇聚成金融科技论文出版数量(19822020)的时间线索图,见图 1。从图 1 中可以看出,金融科技研究的第一篇文章出现在 1982 年,在过去的 39 年中,关于金融科技的论文数量从 1982 年
15、的 1 篇增加到 2019 年的 716 篇。2003 年以前,研究成果有上升和下降的波动,但总体呈稳步上升趋势,而 2006 年以后,论文数量向下波动次数较少,上升幅度较大,尤其是 20132014 年和 20172020 年的上升幅度甚至是前面增加量的几倍。这很可能与经济周期波动、计算机技术的发展和研究逐步成熟有关。总体而言,论文的数量稳步上升,这样的现象很好地产业经济评论 2022 年第 6 期 156 解释了金融科技的相关研究受到国内外学者的广泛关注。此外,从研究的增量和增速看,在未来的一段时间内,金融科技的相关研究成果数量仍将巨大。图 1 金融科技论文出版篇数(19822020 年)
16、利用 Web of Science 提供的金融科技相关研究的引用数据绘出金融科技文献被引用的数量图,见图 2。图 2 展示了每年金融科技相关研究被引用的记录。最早的引用记录刚出现的 20 世纪 90 年代,引用数量较少。从 2000 年以后,引用记录从增量和增速上都急剧上升。引用数量与论文数量都保持一致的上升趋势,引用记录晚于论文数量开始的时间,可能由于引用滞后的原因,而其增长趋势呈对数型增长,引用记录并没有任何下降的时间段。从引用数量图来看,金融科技的研究热点更加突出,相关研究数量更多。结合论文数量和引用数量来看,二者都展示了金融科技在当前的科学研究中的重要性,科研工作者对其重视度越来越高,这其中,离不开市场经济对金融理论和实践运用迫切的需求。根据 Web of Science 的引用报告绘制了数据金融科技相关文献类型图(19822020 年),见图3。金融科技相关文献的类型有 11 种,每种类型文献及其引用数量如下:笔记(2),注释(3),新闻项(11),会议摘要(11),书章(15),书评(32),社论材料(115),学术报告(132),工作论文(293),评论(348)和论文(