1、情报学报 2023 年 2 月 第 42 卷 第 2 期Journal of the China Society for Scientific and Technical Information,Feb.2023,42(2):176-188大数据下基于跨域多源信息融合的竞争对手识别模型研究基于新能源汽车行业宋新平,陈梦梦,吕国栋,申彦(江苏大学管理学院,镇江 212013)摘要 大数据下竞争对手识别模式发生了显著转变,催生了新型竞争对手识别研究范式。本文以该新范式为导向,借鉴企业生态位理论与互联网下的顾客价值理论,对传统经典陈明哲竞争分析框架进行拓展,提出了基于大数据下的市场共通性和资源能力优
2、势度的竞争对手识别指标体系框架。该框架整合了行业与市场双元视角下的财务、专利、产品、客户等多方跨域信息源,使用模糊C均值聚类构建模型,并以新能源汽车行业为例开展仿真实验研究。结果表明,基于跨域多源信息融合的模型可有效提高竞争对手识别的准确性和全面性。关键词 大数据;竞争对手;多源信息融合;综合视角;模糊C均值聚类A Research on Competitor Identification Model Based on Cross-domain and Multi-source Information Fusion in the Context of Big DataBased on the
3、New Energy Automobile IndustrySong Xinping,Chen Mengmeng,Lyu Guodong and Shen Yan(School of Management,Jiangsu University,Zhenjiang 212013)Abstract:There have been significant changes in the pattern of competitor identification under the big data environment,engendering a new research paradigm of co
4、mpetitor identification.Guided by the new paradigm,this article modifies the traditional classic competitive analysis framework of Chen Ming-Jer,and then presents a new competitor identification index system framework consisting of market commonality and resource capability advantage,using the theor
5、y of corporate niche,the view of resources and ability,and the theory of customer value.The framework integrates cross-domain and multi-source information sources such as finance,patents,products,and customers from the perspective of the industry and market.Subsequently,the competitor identification
6、 model is built based on the fuzzy C-means clustering algorithm,and the new energy automobile industry is taken as an example to carry out simulation experiments.The results show that the model can effectively improve the accuracy and comprehensiveness of competitor identification.Key words:big data
7、;competitors;multi-source information fusion;comprehensive perspective;fuzzy C-means clustering收稿日期:2021-12-16;修回日期:2022-09-15基金项目:国家社会科学基金项目“总体国家安全观视域下基于大数据的企业竞争情报感知能力提升研究”(21BTQ070);国家自然科学基金项目“Web 2.0下全员有效参与竞争情报的行为形成机理及治理策略研究”(71573107)。作者简介:宋新平,女,1971年生,博士,教授,博士生导师,主要研究领域为竞争情报、信息管理、商务智能,E-mail:ph
8、d_;陈梦梦,女,1994年生,硕士,主要研究领域为竞争情报;吕国栋,男,1998年生,硕士研究生,主要研究领域为竞争情报;申彦,男,1982年生,博士,副教授,硕士生导师,主要研究领域为大数据分析与挖掘、商务智能。DOI:10.3772/j.issn.1000-0135.2023.02.005第 2 期宋新平等:大数据下基于跨域多源信息融合的竞争对手识别模型研究基于新能源汽车行业0引 言伴随着大数据时代的到来,企业竞争环境和态势逐渐趋于多变和复杂,企业之间的竞争变得不再是传统同一行业体系内的竞争,转而出现了诸如跨界式竞争的新型竞争形态。大数据环境下传统竞争对手识别研究范式遭遇到极大挑战,在理
9、论假设、跨域信息源、全景式识别和方法流程方面都呈现显著转变1。这一转变,导致传统的竞争对手识别理论框架与方法都不能满足大数据下竞争情报研究的需要。这就要求研究者和管理者要拓宽思路,用新理论和方法来解决大数据环境下的竞争对手识别与分析问题。鉴于此,本文将陈明哲教授经典的竞争分析理论与企业生态位理论、顾客价值理论等结合,基于行业与市场双元视角,构建大数据下基于跨域多源信息融合的竞争对手识别指标体系理论框架和模型,探索建立大数据情境下企业竞争对手识别新范式。1理论背景及问题的提出1.1基于行业视角数据的竞争对手识别方法该视角下的方法主要是通过对企业数据层面的竞争因素进行评估与分析,来识别竞争对手。相
10、关方法有:基于财务数据聚类的方法,根据财务报表中盈利、偿债、营运等指标,使用聚类方法识别竞争对手2-3;基于专利数据分析的方法,通过对企业专利数量和内容进行分析来识别竞争对手,包含专利排序、专利地图、专利合作等方法4-5;基于互联网关系信息源挖掘的方法,通过对竞争企业在互联网信息中的隐藏关系进行挖掘来识别竞争对手,包含共现分析法、共链分析法等6;基于互联网文本信息源挖掘的方法,其分析对象是诸如新闻、报告、资讯、产品信息等网络文本数据,利用文本挖掘等技术从中挖掘企业间的竞争信息,进而来识别竞争对手7。1.2基于市场视角数据的竞争对手识别方法该视角下的方法主要是利用用户产生的数据,通过分析企业在用
11、户心目中的替代性或相似性,来识别竞争对手8-9。相关方法包含:基于用户转换行为数据的方法,依托用户对企业产品或品牌的相关转换行为数据展开研究探索,主要有品牌转换分析法、竞品监控矩阵法等10;基于用户情感数据的方法,从互联网在线用户评论数据中提取用户感兴趣的产品特征,使用情感分析技术判断用户情感倾向,以此来识别企业竞争对手11-12;基于用户微博使用行为数据的方法,如微博共关注法就是根据不同用户在微博上关注的同一类产品的集合,来确定企业的竞争关系13。1.3基于双视角数据的竞争对手识别方法基于双视角数据的方法源于陈明哲教授于 1996年提出的四象限竞争分析框架,根据企业在市场共通性和资源相似性二
12、维度上的表现识别竞争对手14。后续大多数学者的研究主要基于该框架展开15-16。根据信息源的不同,主要方法有:基于单域信息源的方法,集中于使用财务、专利、产品等单领域内数据源进行竞争对手识别17-18;基于跨域二源信息融合的方法,例如,王剑华等19整合专利与 URL(uniform resource locator)共现数据进行竞争对手分析,宋新平等20融合财务与用户情感信息构建竞争对手识别模型。此外,也有少量关于跨域多源信息融合的研究,例如,刘志辉等21使用企业物力、人力、组织资源与市场份额等数据信息对环保行业开展竞争分析,林莉等22提出了基于市场共同度和能力等价性的制造服务化企业竞争对手识
13、别框架。1.4大数据下基于双视角跨域多源信息融合的竞争对手识别思路的提出通过 1.1 节1.3 节的研究发现,现有竞争对手识别方法虽然有很多,但多是基于行业或市场单一视角下的数据源,或是基于单一视角下单一维度的指标体系,这就易导致竞争对手识别时存在盲点,从而忽略掉一些重要层面上的潜在竞争对手23。虽然以往基于双视角数据的方法在一定程度上弥补了单视角下研究的不足,但受限于数据的可获可测性,多集中于单域或二源跨域信息源。即使有少部分学者提出基于跨域多源信息融合的方法,但仍然存在忽略互联网下用户信息或仅有定性而无定量研究的缺陷,无法达到对竞争对手进行全景画像的目的24。大数据环境下,企业竞争对手识别
14、研究范式发生了较大转变,如图 1 所示。理论假设转变。大数据使传统理论假设不断被放宽甚至消除,使传统研究中因数据可得性限制而被忽略的潜在重要变量177第 42 卷情 报 学 报重新被纳入成为可能1。跨域信息源转变。大数据下广泛的可获可测领域外信息源,如客户交易数据、评论、用户搜索引擎日志数据等,促使传统单域信息源下的研究向新型跨域信息源下的研究转变25。全景式转变。大数据下的跨域多源信息拓展了企业竞争力评估维度的广度和深度,使融合全要素的全景式竞争对手识别成为趋势26。方法流程转变。传统单线程的竞争对手识别流程和定性、主观、线性方法,逐渐向多线程流程和定量、客观、非线性方法转变。但纵观以往研究
15、,其还有待朝大数据下的这些新范式努力。因此,本文拟结合大数据驱动的竞争对手识别研究新范式,融合双视角下的跨域多源信息来进行竞争对手识别。其一,基于市场与行业双视角的信息能够较为全面地觉察企业竞争情况,更为准确地刻画企业间竞争关系;其二,通过将大数据下大量跨域多源异构数据进行整合,有助于更为清晰和详实地开展企业竞争分析27;其三,大数据下基于双视角跨域多源信息的方法有助于企业潜在竞争对手的识别。2大数据下基于跨域多源信息融合的竞争对手识别指标体系理论框架2.1大数据下的竞争对手识别指标体系框架设计大数据环境所带来的竞争对手识别研究范式转变,驱使着传统环境下的理论框架向大数据情境下的竞争对手识别理
16、论框架的转变,如图2所示。传统环境下,最经典的竞争分析理论框架是陈明哲教授基于市场共通性和资源相似性提出的框架18,该框架以竞争分析理论为支撑。其中,市场共通性被界定为竞争企业在其共享市场上的重叠程度,通常使用同类型产品的市场份额指标进行测量;资源相似性被界定为竞争企业在资源禀赋上的相似程度,通常使用产品、财务等资源指标来测度14,28。大数据环境下,企业的竞争形态和竞争情境发生了较大改变。本文立足于企业生态位理论对企业竞争关系产生的描述,将企业竞争环境视为一个生态系统,而企业间的竞争,其实就是其所在生态位的竞争,由企业自身的内部环境、具有的资源和能力,以及其所处的外部环境共同影响和决定29。因而,本文在传统陈明哲教授理论框架的基础上对其进行扩展:结合企业生态位重叠度和互联网下的顾客价值理论30-31,将市场共通性的内涵扩展到大数据情境下的市场共通性;结合资源基础理论和企业核心能力理论31,对传统资源相似性在资源维度上进行拓宽,并将企业核心能力特征容纳进去,形成资源能力优势度24。由此,本文提出了以大数据为驱动的竞争对手识别指标体系框架,如图 3所示。2.2大数据下的竞争对手识别指标体