1、知识管理论坛 ISSN 2095-5472 CN11-6036/C Knowledge Management ForumE-mail:http:/638【面向全社会的知识服务新兴模式专辑】国内外信息茧房、回音室和过滤气泡的研究进展基于文献计量的可视化对比分析丁绪武1,2 吴忠1 夏志杰21.上海理工大学管理学院 上海 2000932.上海工程技术大学管理学院 上海 201620摘要:目的/意义 将信息茧房、回音室和过滤气泡三者进行结合研究,重点分析各自研究领域的不同和联系。方法/过程 采用可视化的文献计量研究方法,广泛收集 2006-2021 年的国内外有关研究文献,对信息茧房、回音室和过滤气
2、泡的研究脉络进行了梳理与对比分析,并设置群体极化作为辅助研究对象进行补充。结果/结论 研究结果发现:国内外学者普遍认为信息茧房、回音室和过滤气泡都会导致群体极化的产生,其中以信息茧房最为明显;发文量方面国内多与国外,国内外相关研究可分为 4 个研究主题,且在具体细分领域二者之间有明显区别;国内研究多集中于概念的界定以及带来的不良后果分析,研究方法多以定性研究为主,而国外研究则侧重于对以上三者产生的机理研究,研究方法多以定量研究为主;国内外相关研究的未来发展趋势一致,即将情绪维度作为研究以上三者产生机理的一个重要研究对象。关键词:信息茧房 回音室 过滤气泡 可视化 文献计量分类号:G203引用格
3、式:丁绪武,吴忠,夏志杰.国内外信息茧房、回音室和过滤气泡的研究进展:基于文献计量的可视化对比分析 J/OL.知识管理论坛,2022,7(6):638-651 引用日期.http:/ 发表日期:2022-12-01 本文责任编辑:刘远颖1 引言互联网时代,推荐算法的成熟实现了用户和信息快速而有效的匹配,避免了用户陷入“信息过载”的怪圈之中。社会学的相关研究发现,在现实生活中人们往往会被自己感兴趣的消息或者观点相似的人所吸引,但会主动忽略甚至抵触不感兴趣的消息或者意见向左的人。上述现象已经引起了学术界的关注,信息茧房、过滤气泡以及回音室等现象正在成为用户信息行为领域的研究热点。美国学者桑斯坦于
4、2006 年首次提出了信息茧房和回音室的概念1。桑斯639坦认为,人们对信息的主观过滤性会导致信息茧房的出现,信息茧房是一种具有鲜明特点的信息世界,身处其中的人接触到的信息大概率都是自己感兴趣的,而接触到异质信息的概率极小。而对于回音室2,桑斯坦认为这是一种社交圈的固化现象,即人们只愿意与自己观点相近的人沟通交流,久而久之,便会陷入到相对封闭的怪圈之中,即回音室,它会导致内部同质化信息泛滥,容易滋生极端主义和网络暴力事件。过滤气泡的概念由 E.Pariser 于 2011 年在 The Filter Bubble:What the Internet Is Hiding from You 一书中
5、首次提出3,他以 Google 的PageRank 算法为研究对象,认为目前的个性化推荐算法盲目追求定位用户兴趣的准确度,为用户提供个性化的服务,而忽略了用户获取信息的丰富度。个性化推荐算法在新闻、购物以及社交媒体等领域的广泛使用,会使每个人都身处一个独有的信息世界,即过滤气泡,阻碍人们偶遇异质信息。基于此背景,为了更加全面了解和把握国内外关于信息茧房、回音室和过滤气泡的研究现状和热点,并将群体极化4作为辅助研究对象(因为以上三者产生的主要后果就是群体极化现象)。利用文献计量和知识图谱方法,对相关文献进行可视化的定量分析,明确发展趋势,为我国用户信息行为领域的相关研究方向提供一定参考依据。2
6、研究的数据来源与研究方法2.1 研究数据来源本研究数据来源于 CNKI 数据库和 Web of Science 核心集,其中国内论文以主题进行检索(SU=信息茧房+回音室+过滤气泡 +群体极化),时间跨度为 2006-2021 年,共获取相关论文 1 229 篇,随后对检索的论文进行清洗(包括合并重复论文、剔除征稿启事和主题不相关的论文),最终得到 1 217 篇文献作为国内研究的样本。国外论文的检索利用设定的主题检索式进行(TS=(“information cocoons”OR“echo chambers”OR“filter bubble”OR“selective exposure”OR“g
7、roup polarization”)),时间跨度同样为 2006-2021 年,共检索出论文 514 篇,因本研究的分析主要是以作者、作者关键词、期刊和国家为关键字段,经过文献清洗后,最终得到 505 篇文献作为国外研究的样本。2.2 研究方法一篇文献中给出的若干个关键词一定存在着某种关联,而这种关联可以用共同出现(共现)的次数进行量化。共现分析方法就是利用文献集中词汇之间的共现关系,来确定该文献集所代表学科或者研究领域中各主题之间的关系。通过统计一组文献的关键词两两之间在同一篇文献出现的频率,并在此基础上利用聚类算法进行聚类分析,可以反映出这些关键词之间的强弱关系,进而归纳总结出其所代表的
8、研究主题和学科的研究趋势。本研究主要运用 COOC对关键词进行分析,然后利用 VOSviewer 进行知识图谱的可视化构建。3 研究结果对比分析3.1 发文量与发文趋势分析一个研究领域发文量的变化能够反映其发展状况和不同的发展阶段,信息茧房、回音室、过滤气泡和群体极化的研究内容多有交叉,按照时间的分布绘制它们发文量的折线图(如图 1和图 2 所示),能够帮助我们快速地梳理出不同的研究阶段。在本文第一节的论述中已提到相比于过滤气泡,信息茧房和回音室的概念提出的时间更早(虽然群体极化的概念早在 1961年就提出,但它是一个由于用户信息行为导致的结果,而本文的研究重点是用户信息行为的过程),因此本文
9、将 2006 年作为文献研究的起始年份。分析图 1 和图 2 可知,从发文量来看,国内外关于信息茧房、回音室、过滤气泡和群体极化的研究呈逐年上升趋势。而在发文总量方面,虽然国内的发文数量相比于国外较多,但是主要集中于概念的界定、文献综述等方面的研究,鲜有深度的研究。而国外的发文数量DOI:10.13266/j.issn.2095-5472.2022.051知识管理论坛,2022(6):638-651知识管理论坛2022 年 第 6 期(总第 42 期)640 萌芽期 发展期 图 1 国内文献年代分布图与文献年代累积分布 萌芽期 发展期 图 2 国外文献年代分布图与文献年代累积分布3882302
10、2413012805010015020025030035040045012345引用次数论文排名国内图 3 国内排名前五位的论文引用次数虽较少,主要集中于应用领域,如信息茧房在民主推进中扮演的角色、回音室和群体极化对社交媒体发展的影响、过滤气泡对用户信息检索带来的利弊等。而且通过对高被引频次的对比分析(见图 3 和图 4)发现,国外的论文高被引次数远远高于国内,这也进一步说明了有关信息茧房、回音室等的研究,国内还需进一步的提升研究质量和水平。64199368437635431302004006008001 0001 2001 2 3 4 5引用次数论文排名国外图 4 国外排名前五位的论文引用次
11、数进一步对发文趋势进行分析,发现国内和国外有关信息茧房、过滤气泡、回音室和群体极化的研究趋势基本一致,分为两个阶段:第一阶段为 2006-2010 年。由于桑斯坦在 2006 年首次提出了信息茧房和回音室的概念,该阶段主要是以概念性的研究为主,即针对信息茧房、回音室等效应是否真实存在、概念如何界定等问题进行研究。第二阶段为 2011-至今。随着过滤气泡概念的提出,这一阶段国内和国外的年发文量呈稳步上升趋势。3.2 词频统计分析关键词是一篇文章主要研究内容的概括性体现,通过对历年关键词词频的统计分析,能够快速了解某一研究领域的热点趋势。本文针对获取到的国内外关于信息茧房、过滤气泡、回音室、选择性
12、接触以及群体极化研究领域的论文进行关键词抽取,并对其进行同义词合并、无意义词删除等数据清洗操作,然后利用VOSviewer 软件,对历年排名前 50 的关键词进行词云绘制,结果如图 5 和 6 所示:图 5 国内相关研究文献关键词历年词云(次数=50)DOI:10.13266/j.issn.2095-5472.2022.051知识管理论坛,2022(6):638-651知识管理论坛2022 年 第 6 期(总第 42 期)642图 6 国外相关研究文献关键词历年词云(次数=50)对关键词词云图进行分析发现,国内方面,在 2011 年之前,主要的研究领域集中在群体极化,其中主要探究的是网络舆情与
13、群体极化之间的关系问题5-7。在 2011-2017 年之间,研究重点如何采取有效措施预防群体极化的产生8-10。另外,该阶段开始出现了针对群体极化等方面的定量研究11-12。此外值得关注的是,在2017 年信息茧房开始成为该领域的研究热点,但是研究的层次较浅,主要集中于对于信息茧房概念化的探究 13-15。2018-2021 年,信息茧房取代群体极化成为出现次数最多的关键词,研究的重点是信息茧房的形成机理、算法的优化以及预防策略等16-21。此外,在该阶段,很多学者也表示基于人工智能的推荐算法很有可能是引起信息茧房、回音室和过滤气泡的重要因素 22-24。国外方面,2006-2009 年之间
14、,研究主要以群体极化为主25-27。2010-2017 年,选择性接触成为研究的主要内容(通过文献搜索发现,以“information cocoons”为主体的论文几乎空白,通过开展跨域文献搜索发现,国外学者通常采用“selective exposure”(选择性接触)这一术语来分析信息茧房所指代的现象20,28-30)。2018-2021 年,从 2018 年开始,关于过滤气泡、回音室的研究不断涌现,其中以回音室的研究居多,通过对相关文献的分析发现,过滤气泡和回音室也是导致社交媒体群体极化的重要原因31-35。3.3 关键词聚类分析聚类分析方法是针对未分类的事物,按照相似程度进行划分归类,以
15、达到“物以类聚”的目的。其原理是同一簇集中对象具有很大的相似性,而不同簇集之间的对象有很大的相异性。研究采用的聚类分析方法为系统聚类法,选择在样品距离的基础上定义类与类之间的距离作为聚类的方式。首先对筛选出的高频关键词进行两两统计,构建高频关键词的共现矩阵,在此基础上转化为相似矩阵,但是利用相似矩阵进行系统聚类分析发现聚类效果不好,为了进一步减小误差,实现更好的聚类,将相似矩阵转化为相异矩阵,见表 1、表 2。将相异矩阵导入 COOC 软件,本研究计算样品之间距离采用欧式距离,类与类之间的距离方法采用 Ward(离差平方和)方法。在经过系统聚类分析后,重新调整聚类距离后,得到系统聚类图,见图
16、7、图 8。643表 1 国内相关文献高频关键词相异矩阵(部分)群体极化 信息茧房 网络舆情 网络舆论政治参与互联网微博社交媒体 新媒体算法群体极化00.946 10.825 40.795 40.934 40.899 8 0.851 20.910 80.977 4 1.000 0信息茧房0.946 100.992 71.000 01.000 00.981 9 0.962 10.914 20.975 5 0.850 8网络舆情0.825 40.992 700.975 31.000 00.970 7 0.969 30.982 60.940 6 1.000 0网络舆论0.795 41.000 00.975 300.984 90.984 6 0.967 80.945 31.000 0 1.000 0政治参与0.934 41.000 01.000 00.984 900.892 8 0.981 30.978 80.951 6 1.000 0互联网0.899 80.981 90.970 70.984 60.892 800.980 90.956 80.975 4 1.000 0微博0.851 20.9