1、Jun.2023JOURNALOFCHENGDUUNIVERSITY OF INFORMATIONTECHNOLOGY2023年6 月Vol.38No.3息报第38 卷第3期大学学程成都信文章编号:2 0 96-16 18(2 0 2 3)0 3-0 30 6-0 8基于极小极大博奔的水军识别算法研究穆云翔,盛志伟,卢嘉中(成都信息工程大学网络空间安全学院,四川成都6 10 2 2 5)摘要:随着互联网的发展,用户越来越多地在线上完成购物、订餐,并倾向于先参考线上评论。评论对用户决策的重要导向作用催生了网络水军。网络水军会为了自身利益或其他不良动机,发布与实际体验不相符的评价,且会随时调整自已
2、的策略来逃避平台的识别。现提出一个基于行为特征的水军识别算法(FBS),并将FBS加人到极小极大博奔,在这个博奔中,水军与识别器相互竞争,将博奔转换为两个相互依赖的马尔可夫决策过程,不断优化各自的策略,最终得到一个当前场景下最优的识别器。与当前先进的水军识别算法对比,性能有了明显提升,在公开数据集YelpChi上实际效应可以达到3.6 9。关键词:网络水军;水军识别;极小极大博奔;马尔可夫决策过程中图分类号:TP393文献标志码:Adoi:10.16836/ki.jcuit.2023.03.0090引言网络水军是指在网络中针对特定内容发布特定信息的、被雇佣的网络写手,简称水军,又名网络枪手。他
3、们通常活跃在电子商务网站平台中,通过发布虚假的商品评价来影响正常消费者的决策。网络的快速发展为水军提供了滋生条件。一方面,网络环境提供的便利:网络开放性、即时性、自由性、交互性等特点为网络水军的发展壮大提供了环境支撑。网络的开放性为网络水军提供了自由出入的媒体门户,不需要提供任何真实信息即可倘祥于各大论坛、贴吧,在网络上任意发表言论;网络的即时性则有助于网络水军引导网民对舆情的推动,让受众在缺乏理性分析的前提下引爆预设议题。网络的自由性塑造了无中心的狂欢广场,任何网民都可自由发布信息,也为网络水军的“灌水”行为提供了便利。网络的交互性为政府、媒体、网民之间的交流互动提供了便利,从而形成“围观”
4、的力量。另一方面,网络受众的媒介素养偏低。中国网民群体庞大,但媒介素养参差不齐,整体不容乐观,在一定程度上纵容了网络水军的发展壮大。一些年轻网民由于心态不成熟,往往不能客观、全面、辩证地看待社会问题,容易受网络负面情绪影响。面对网络水军故意炒作的热点事件,极易非理性地跟风发帖,成为网络水军的“帮凶”。一些在经济上比较失意的网民则容易产生“仇富”心态,当网络上曝出诸如“房妹”等新闻热点时,他们会不自觉地与网络水军收稿日期:2 0 2 2-0 7-16基金项目:四川省科技计划资助项目(2 0 2 1YFC0332)站在同一战壕;一些网民对娱乐化的追求不断削弱主流媒体的权威性与影响力,为更能把握网民
5、心理的网络水军提供了抢占先机的机会。电子商务平台提供在线评论系统作为商家与消费者的桥梁。消费者通过浏览评论细节来决定是否购买产品,产品评论成为影响消费者购买欲望的重要因素。由于消费者倾向于购买好评产品,而放弃购买负面评论产品,因此在竞争激烈的电商市场中,许多商家通过雇佣“水军”,在自己的店铺下用图片伪造好评,操纵评论。并在竞争对手的门店下进行恶意评论,误导消费者。水军虚假评论的存在干扰了产品描述的真实性,对电商平台和消费者产生了显著的负面影响。因此,识别网络水军评论并保护消费者权益非常重要。总而言之,通过大量同质行为或内容形成回声室效应,从而影响其他用户的观点和决策,是网络水军的最终目的。在电
6、商平台中,网络水军采取发布不实信息来混淆视听。对于消费者而言,水军的存在影响购买意愿;对于商家而言,如何请水军刷好评变成了影响销售的最大因素;对于市场而言,水军扰乱了原有的市场秩序。这对于行业的发展具有很大的影响力,因此网络水军的监管成为一个呕待解决的难题。本文主要关注Yelp系统中的水军。关于这类水军识别器主要有以下缺点:(1)大多数识别器都假设水军有相同的特征,并且可以根据这个特征来识别水军。但是在现实世界里有很多种水军,他们有不同的目标、对象和策略。如一个水军可能想要推广某一件商品,而另一个水军想要贬低竞争对手。(2)专业水307穆云翔识别算法研究第3 期军会研究最新的识别技术,并从中发
7、掘新的策略来逃过识别器 1-2 。(3)现有的识别器大都基于精确率和召回率作为识别目标。而根据Luca3利用市场研究的现有成果,从商品评分变化的角度定义了网络水军的实际效应。实际效应可以用来表示水军和平台在对抗过程中的实际目标,假设水军的目标是推广目标商品,那么平台的目标就是尽可能地减少推广的程度。文献 3 也通过实验证明,即使在召回率很高的情况下,水军依然可以达到很高的推广效果。本文提出一种利用用户行为特征的水军识别算法(FBS),将FBS应用到一个水军对抗模型,最终训练出的识别器在公开数据集YelpChi上取得了不错的性能表现。并利用网络水军账号的一些特点,提出几种新的用户特征和一个基于用
8、户行为特征分析的水军识别算法(FBS)。将FBS应用到一个水军对抗模型中,最终训练出的识别算法性能相较于以前有明显提升。1相关工作1.1AP算法AP(a f f i n i t y p r o p a g a t i o n)算法 4 无需事先指定聚类数目,且没有明确的质心(聚类中心点),样本中的所有数据点都可能成为AP算法中的质心。根据现实环境中网络水军种类繁多,且同类型水军之间较为类似的特点,再基于AP算法的上述特征,将其应用到水军对抗模型。1.2分类器的选择目前最常见的分类器有人工神经网络、K-近邻(K-NN)、朴素贝叶斯和决策树。尽管这些分类算法在几十年的发展中衍生出很多的改进算法,但
9、是仍然没有一种完美的分类算法能适应所有的环境问题。根据Kotsiantis5在主流分类算法性能比较,人工神经网络和支持向量机对大规模数据训练比较困难,且对缺失数据敏感;K-NN时间复杂度和空间复杂度高,可解释性差;朴素贝叶斯通常准确率较低,且只能用于处理二分类问题;相对于其他几种分类算法,决策树计算量简单,可解释性强,比较适合处理有缺失属性值的样本,能够处理不相关的特征。此外,决策树能够很好地处理同时具有离散和连续属性的分类问题。因此,使用决策树算法进行分类识别最为合适,详情如表1所示。表1机器学习常用分类算法比较分类算法优势劣势人工神经网络准确率高训练数据大、学习时间长与特征维度无关,其对数
10、据缺失敏感、计算复杂度支持向量机适用于特征多、样本与样本个数有关少的分类任务K-NN无需训练时间效率低、K的选择不固定朴素贝叶斯对数据缺失不敏感特征之间需要相互独立综合性能均衡、可解信息增益偏向于有多数值的决策树释性强特征1.3网络水军对抗模型2020年Dou等 6 利用强化学习建立的水军对抗模型,提出一种全新的水军识别性能的评测指标PE(p r a c t i c a l e f f e c t)。该模型利用多个水军识别算法和多种水军攻击策略进行博奔,将博奔过程转换为两条相互依赖的马尔可夫决策过程。利用双方博奔直至达到纳什均衡,此时的水军识别算法即可认为是当前环境下的最优算法。本文将提出FB
11、S并将其应用到对抗模型中,以此训练出的水军识别算法达到的效果相较于以前PE提升了8%。1.4研究现状现有识别网络水军的方法主要有3种:基于文本与情感分析法、基于行为特征分析法和基于图结构法。其中,基于文本与情感分析需要花费较长时间进行训练,且随着NLP等人工智能算法的发展,水军文本内容已经和普通用户的评论文本差别越来越小。因此,基于文本分析法的性能相较于其他两种普遍偏低。早期的水军由于发布的评论信息都很类似,因此研究方法大多基于语言学特征。其中,词袋特征是大部分研究者的首选语言特征。MMccord等 7 提取重复评论的bigram特征,在推特数据集训练回归模型,利用随机森林分类器识别只关注品牌
12、的评论和评论文本无关的两类垃圾评论,精确率高达95.7%。Li等 8 基于新扩展的黄金标准数据集识别网络水军,该数据集由来自3个不同领域(酒店、餐厅、医生)的数据组成,每个领域都包含3种类型的评论,即客户生成的真实评论、网络水军生成的欺骗性评论和员工(领域专家)生成的欺瞒性评论。该文试图捕捉欺骗性评论和真实评论之间语言特征的一般差异和水军检测的领域迁移性问题。实验表明该模型在餐厅数据集上分类准确率都能达到7 5%左右,而在医生数据集上准确率只有50%左右。实验表明该特征用于水军的虚假评论检测的领域迁移性差。大308息程都成第38 卷报信学学NoekhahS等 9 通过提取分析词频、信息丰富度、
13、内容定罪等特征,实现了基于欺骗性语言的评论文本在线欺骗识别系统。将这些特征集应用到之前使用的3个分类器(支持向量机、朴素贝叶斯和C4.5决策树),并使用5倍交叉验证。最终的实验结果表明,识别欺骗性评论的准确率达到8 0%,但是该识别方法时间复杂度很高,并不适用于一些较大的数据集。Wang等 10 首先提出虚假评价检测中的冷启动问题,在Yelp评价数据上提取一部分“新的评价”,即该用户只发布了一条评价。作者将之前研究中提到的文本和行为特征检测模型应用到这些新评价上,发现检测的效果并不好。为解决这种冷启动问题,一种直观的想法是从历史数据中去寻找和这个新评价发布者特征相似的评论者,然后把最相似的评价
14、者或者评价的标签作为该新评价的标签。总而言之,虽然新评价信息很少,但可以通过深度学习,在历史数据上学习到有效的关系嵌人(embedding),然后利用该模型得到新的数据嵌入,这样就可以结合历史嵌入和其标签来预测新数据的标签。Hooi B等 利用二部图提出了Fraudar算法。Fraudar定义了一个可以表达结点平均可疑度的全局度量G(),在逐步贪心移除可疑度最小结点的迭代过程中,使G()达到最大的留存结点组成可疑度最高的致密子图。在此算法中,由于无法模仿每个节点与其他节点的联系,因此准确率大幅度提升。但是Fraudar的一个缺点是它的串行运算特性导致在大规模二部图上运算缓慢,其每次迭代只动态地
15、删除一个结点并更新剩余结点状态。Wang等 12 除了利用用户本身的一些信息,还利用用户在社交网络中的好友关系对一些可疑用户进行识别。作者基于图结构的方法将水军和水军的虚假评论识别看作联合分类或排序问题,再采用马尔科夫随机场模型和LBp13(loopy belief propagation)计算每个节点的可疑程度。还对LBP算法进行优化,提高了算法的效率并且有收敛性的保证。实验表明,该模型在新浪微博数据集上的分类Accuracy都能达到7 5%。ShahN等 14 提出利用网络结构特征来识别在亚马逊上通过众包发送水军虚假评论的用户,提出TwoFace算法,更多关注召回率,该算法有的召回率能够达
16、到91%。该算法也有缺点,groundtruth的可信度不是很高。SRayana2提出SPEACLE框架来做网络水军识别,利用关联数据和元数据,结合了图、行为和文本进行水军识别,该方法中图由user-review-product图构成,3种类型的结点都有标签,user:水军与否,review:虚假与否,product:为被攻击目标与否。论文用图来做分类,用metadata来估计有关节点的类分布的先验知识。该算法在数据集YelpZip上的准确率可以达到79.4%。尽管研究者们都针对不同情况下的用户特征进行深入研究,但其往往集中在某几个方面。随着平台和水军的发展,上述方法大多只能识别出某一类水军,适用性并不够广泛。2FBS-基于行为特征的水军识别算法2.1问题描述由于现实环境中电商平台的网络水军复杂且多样,因此水军检测主要面临的困难在于水军检测涉及的特征难以规范化表达。一方面,水军覆盖范围广,在不同平台其特征不尽相同,导致没有一个标准的水军特征集;另一方面,水军经过多年发展,不断通过模仿正常用户来伪装自己,导致识别模型准确率不高。因此特征的选择变得尤为重要,应选用水军无法模仿的一些特征加人