1、2023 年 2 月 25 日第 7 卷第 4 期现代信息科技Modern Information Technology Feb.2023 Vol.7 No.41251252023.022023.02收稿日期:2022-10-18基金项目:国家社会科学基金青年项目(20CTQ028)基于 CiteSpace 的网络问答社区研究的可视化分析及启示迟秀铭1,房旭辉2,郭顺利2(1.莱山区图书馆,山东 烟台 264003;2.曲阜师范大学 传媒学院,山东 日照 276826)摘 要:梳理中外网络问答社区的研究热点及其发展脉络,总结国内外网络问答社区研究的异同,以期为我国网络问答社区研究提供新思路和指
2、导。以 Web of Science 和 CNKI 为文献来源,运用 CiteSpace 软件对国内外网络问答社区研究热点进行可视化比较分析。我国未来网络问答社区研究需要深化完善已有的研究领域,扩大研究范围,创新研究方法,增强创新意识,将研究成果应用到网络问答社区运营管理实践中。关键词:问答社区;CiteSpace;比较分析;科学知识图谱中图分类号:TP391 文献标识码:A 文章编号:2096-4706(2023)04-0125-05Visual Analysis and Enlightenment of the Research on Network Q&A Community Based
3、 on CiteSpaceCHI Xiuming1,FANG Xuhui2,GUO ShunLi2(1.Laishan Library,Yantai 264003,China;2.School of Communication,Qufu Normal University,Rizhao 276826,China)Abstract:This paper sorts out the research hotspots and development context of the network Q&A community at home and abroad,and summarizes the
4、similarities and differences of the research of the network Q&A community at home and abroad,with a view to providing new ideas and guidance for the research of the network Q&A community in China.It takes Web of Science and CNKI as the source of literature,and uses CiteSpace software to visually com
5、pare and analyze the research hotspots of network Q&A community at home and abroad.In the future,Chinas network Q&A community research needs to deepen and improve the existing research fields,expand the research scope,innovate research methods,enhance innovation awareness,and apply the research resu
6、lts to the operation and management of network Q&A community.Keywords:Q&A community;CiteSpace;comparative analysis;scientific knowledge graph0 引 言网络问答社区作为 Web 2.0 模式下“用户驱动”的典型代表,成了互联网用户获取相关信息与知识的主要途径1。根据 2021 年新知青年大会的数据,网络问答社区代表知乎的年访问人次超过 30 亿,成为网民获取知识的主要途径之一。网络问答社区的发展和兴起,成为学术界关注的热点和研究对象。国内外许多学者从不同的
7、角度和维度对网络问答社区开展了研究,涌现出大量有价值的研究。已有学者对相关成果进行了梳理分析。例如:Gazan 对网络问答社区的研究文献进行了回顾和分析2;姜雯梳理了网络问答社区信息质量评价方面的相关研究3等。综上所述,从内容上看,国内外已有对于问答社区的综述类研究都偏向于某一方面文献的梳理,鲜有学者关注国内外网络问答社区研究的差异性,缺乏系统性的比较分析。就方法而言,以主观的内容解读为主,运用科学计量工具的客观分析不多,而基于知识图谱视DOI:10.19850/ki.2096-4706.2023.04.032角的量化研究则可以更为客观地反映某一领域的研究热点及趋势。全面把握、对比剖析中外网络
8、问答社区的研究热点及其发展脉络,对于促进国内网络问答社区方面的理论研究及实践创新具有重大意义。鉴于此,本文采用文献计量学方法,运用 CiteSpace 可视化工具,对国内外网络问答社区研究领域的文献进行可视化的对比分析。综合共词分析、聚类分析等方法,对比分析国内外网络问答社区的研究热点。以期为我国网络问答社区研究提供新思路和指导。1 数据来源与检索策略为保证所收集数据的权威性和科学性,国外文献选自Web of Science 数据库下的 Web of Science 核心合集,国内文献源于中国知网(CNKI)的期刊数据库。在 Web of Science核心合集数据库中,采用主题检索,以“TS
9、=(Community Question Answer)OR TS=(Social Question Answer)OR TS=(Online Question Answer)”为检索式,文献类型为 Articles、时间跨度为所有年份进行检索。在中国知网使用高级检索,以“主题=问答社区 OR 问答网站 OR 问答平台”进行检索,检索范围为学术期刊,不设置时间跨度。检索时间为 2022 年 4 月1261262023.022023.02第 4 期现代信息科技15 日。筛选检索后的文献,剔除关联较小的文献,最终将421 篇国外文献和 451 篇国内文献纳入分析样本。2 国内外网络问答社区研究的发
10、展脉络国内外网络问答社区年发文量如图 1 所示。根据图 1 可以将国内外网络问答社区研究的发展脉络划分为以下三个时期。国内国外2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022100806040200发文量(篇)年份图 1 国内外网络问答社区年发文趋势2.1 萌芽时期(2007 年2012 年)这一时期,国内外对于网络问答社区研究处于起步阶段,发文量均比较少。该阶段随着用户需求的增长和互联网的发展,社会化问答网站应运而生。国内外互联网企业陆续上线了一些问答服务产品和平台。学者们对于这种新
11、兴的知识获取获取方式开展了初步的研究。国内学者们多是对这些国内外的问答平台进行比较分析,找出不足并提出改进建议。国外学者多是分析网络问答社区的运作机制,探索网络问答社区的未来发展模式。2.2 发展时期(2013 年2018 年)这一时期随着移动通信技术、智能终端技术以及 Web技术的飞速发展,发文数量逐渐增多,吸引了大规模的用户群体。国内外的年发文量持续增长,引起了多个领域学者广泛关注,涉及了用户、问题、答案及网络问答社区建设等多个方面。新技术和方法被应用于网络问答社区的知识管理和服务方面。理论和技术研究推动了网络问答社区实践的发展,从而使得网络问答社区相关研究也持续向前发展。2.3 稳定时期
12、(2019 年至今)这一时期国内外网络问答社区研究年发文量均保持在了一个较高水平,是一个相对稳定时期。在这一时期,网络问答社区用户规模激增,网络上用户生成内容呈现指数性增长。随着深度学习、大数据、文本挖掘等技术的广泛应用,国内外学者们对网络问答社区的研究更加深入。在未来几年,随着新技术的不断进步及相关理论方法的不断丰富,国内外网络问答社区的研究将继续稳定下去,并迎来飞跃式的发展。3 国内外网络问答社区研究热点比较分析3.1 国内网络问答社区研究热点分析通过 CiteSpace 软件生成国内网络问答社区研究的关键词聚类图谱,如图 2 所示。关键词聚类图谱共生成 12 个聚类主题,除检索词外,可以
13、将剩余的 11 个聚类主题归纳为五大热点主题,如表 1 所示。分别为网络问答社区用户的需求及行为研究、网络问答社区的知识内容质量及专家研究、网络问答社区知识付费研究、网络问答社区内容传播研究、网络问答社区内容组织及挖掘研究。图 2 国内网络问答社区研究关键词聚类图谱表 1 国内网络问答社区研究关键词聚类结果编号聚类主题主要关键词1#1 用户需求 需求分析、需求聚合、演化分析#3 用户行为影响因素、用户画像、激励机制、实证研究2#4 专家发现 专家推荐、推荐算法、专家识别#7 质量评价 内容质量、评价标准、质量预测3#2 知识付费付费意愿、付费围观、悬赏机制、感知价值4#9 知识传播 社交媒体、
14、传播网络、健康传播#10 意见领袖 舆论、突发事件、网络意见、情感识别5#5 问题分类 问题聚类、信息检索、检索推荐#6 主题模型机器学习、数据分析、语义相似度、文本摘要#8 索引服务 多标签分类、标签特征、知识抽取#11 知识推荐 知识图谱、文本挖掘、深度学习3.1.1 网络问答社区用户的需求及行为研究该主题包含的聚类有#1 用户需求、#3 用户行为,包含的主要关键词有影响因素、需求分析、需求聚合、演化分析、激励机制、实证研究等。网络问答社区用户需求研究主要集中在对用户需求的分析、演化、聚合等方面。在用户需求分析方面,学者们多采用文本挖掘技术分析用户需求4,5。周国韬等6则通过 LDA模型分
15、析网络问答社区用户健康信息需求的演进趋势。用户需求聚合研究方面,郭顺利等7提出了融合GMM和K-Means聚类算法的用户信息需求聚合方法。对于用户行为的研究主要集中在知识采纳、知识分享、知识共享、知识贡献、知识隐藏、持续使用意愿、激励机制及对策等方面。学者们多从社会交换理论、自我决定理论、社会认知等理论视角出发,运用结构方程模型、扎根理论等实证分析方法分析用户行为。3.1.2 网络问答社区的知识内容质量及专家研究该主题包含的聚类有#4 专家发现、#7 质量评价,包含1271272023.022023.02第 4 期的主要关键词有专家推荐、推荐算法、内容质量、评价标准、质量预测等。网络问答社区中
16、内容的质量评价及预测多集中于答案的评价、排序及预测。学者们对于答案评价研究多是利用各种方法理论构建答案质量评价体系或答案质量评价模型8。在答案排序方面,学者们通常在构建答案质量排序体系后,采用机器学习、系统工程等技术方法实现对答案的排序9。网络问答社区专家发现方面,学者们多是应用自然语言处理、机器学习、深度学习等技术领域的算法来实现网络问答社区中的专家发现或专家推荐。例如:高逸飞10基于 Meta LDA的改进算法实现了网络问答社区中各领域内专家用户的发现。黄辉等11提出了一种基于用户-标签异构网络的专家发现方法。3.1.3 网络问答社区知识付费研究网络问答社区知识付费方面研究包含的聚类有#2 知识付费,包含的主要关键词有付费意愿、付费围观、悬赏机制等。在网络问答社区知识付费研究中,学者们多是对影响用户知识付费行为、知识付费产品、知识付费运营模式等方面开展研究。例如:卢恒等12在理性与偏差视角下,构建影响用户知识付费意愿的潜在变量,运用模糊集的定性比较分析方法分析变量间的因果关系,探讨知识付费意愿的构型。赵菲菲等13通过文献调研,构建了用户知识付费意愿影响因素模型。3.1.4 网络问答