1、第22卷 第6期2022年6月创新科技Innovation Science and TechnologyVol.22 No.6Jun.2022数字化与数据化概念界定与辨析孙新波,孙浩博,钱 雨(东北大学工商管理学院,辽宁沈阳110167)摘要:针对当前数字化研究概念混淆与界定缺乏的情况,以SCI、SSCI一区期刊与自然科学基金委管理科学部认定的30种重要期刊为主要文献来源,使用文献计量法与文献研究法对“数字化”与“数据化”以及“数字化转型”与“数据化转型”两组中英文概念进行区分与界定,明确其内涵外延、演化规律及应用现状,提出数字化未来的研究框架。在数字化快速发展的初期阶段,明确概念的区别与联系
2、,将减少后续研究中的混淆与偏误,为数字化领域的理论积淀提供语义基础,这有助于数字化研究的开展与深化,有利于消除语言障碍,推动成果推广。关键词:数字化;数据化;数字化转型;数据化转型;概念界定中图分类号:C936;G301文献标志码:A文章编号:1671-0037(2022)6-12-19DOI:10.19345/j.cxkj.1671-0037.2022.6.002近年来,信息技术迅猛发展,人类社会正在由工业时代迈入以数字化为特征的数字时代1-2。数字技术的发展与融合带来了前所未见的数字化浪潮3,其以移动互联网、云计算、物联网、人工智能、机器学习等技术的突破与融合发展为重要特征。数字技术的爆发
3、创造了大量的创业机会4,在世界范围内带来了价值创造新范式,使数字经济成为新的风口。数据显示,2020年我国数字经济规模达到了39.2万亿元,占GDP比重的近40%,2021年我国数字经济增加值规模进一步达到45万亿元。“十四五”期间,数字经济核心产业增加值占GDP的比重将从2020年的7.8%上升至2025年的10%5。实践的繁荣与政策的推动引起了学术界对数字经济的关注。Industrial Marketing Management在过去5年间发表了100多篇关于“Digitization”“Digitalization”和“Digital”的文章。国内期刊近 5年也发表了上千篇与“数字化”相
4、关的论文。但因概念模糊和界定缺失,数字化领域的基础研究尚不充分6。“数字化”与“数据化”以及“Digitization”“Datafication”与“Digitalization”在应用 中 均 存 在 不 同 程 度 的 混 淆7-10。Ronda 和Koontz等11-12指出,若想理解任何概念的本质,就要先有一个明确的定义。概念的定义是逻辑分析的起点。如果没有对概念进行统一的界定,那么逻辑推理就有可能出现漏洞,不同研究者之间收稿日期:2022-03-10基金项目:国家自然科学基金项目“复杂适应系统视角下的众包平台激励机制研究”(72172031);首批新文科研究与改革实践项目“工商管理
5、+大数据 专业建设研究与实践”(745);2020年辽宁省“兴辽英才计划”项目“数字辽宁发展战略研究”(XLYC2006009)。作者简介:孙新波(1971),男,山东招远人,管理学博士,教授,博士生导师,副院长,研究方向:组织与战略管理、数据化转型和管理哲学;孙浩博(1997),男,山东潍坊人,硕士研究生,研究方向:组织与战略管理、数据赋能;钱雨(1994),男,黑龙江哈尔滨人,博士研究生,研究方向:数字商业模式。本文通信作者为孙新波。科学学理论与方法 2022年第6期13的对话和交流也可能会缺乏一致性比较的基础13。在数字化逐渐成为管理领域一个重要研究方向的过程中,对其概念本质认识模糊,对
6、其边界、联系与区别把握不准,对其历史演变规律缺乏了解等成为当下不可忽视的问题。针对上述研究缺口,本文旨在对“数字化”与“数据化”以及“数字化转型”与“数据化转型”这两组概念及其对应的英文术语进行辨析。具体来讲,研究问题包括:“数字化”与“数据化”及其下位词“数字化转型”与“数据化转型”,这两组概念及其对应的英文术语的内涵外延应该如何界定?“数字化”与“数据化”及其下位词“数字化转型”与“数据化转型”,这两组概念及其对应的英文术语的概念演化规律是怎样的?在数字化快速发展的初期,明确概念的区别与联系,将大大减少后续研究中的混淆与偏误,为数字化理论的积淀提供语义基础,这有助于数字化研究的深化和科研成
7、果的推广,为政企交流、学企交流消除语言障碍。1研究方法与文献选择现代科学计量学技术可以对海量文献进行多元、历时性的动态分析,例如:以CiteSpace软件为代表的科学知识图谱即是一种重要的文献计量分析和可视化方法14-15;文献研究法是指搜集、鉴别、整理文献,并通过对文献的研究形成对事实的科学认识的方法等。本文首先应用基于CiteSpace的文献计量法进行定量的可视化分析,再使用文献研究法从质性角度有针对性地对资料进行梳理与归纳。根据所研究的问题,本文选择标准抽样法来确定文献范围。借鉴 Wolfswinkel等16的文献选择指南,将具体过程分为5个步骤。第一,在中国知网数据库中,以“数字化”“
8、数据化”“数字化转型”及“数据化转型”为关键词,分别以主题和篇名为依据检索相关文章。根据经验,CiteSpace在分析单元为100600时效果最佳。受存续时间与研究热度的影响,上述4个概念的研究规模差别较大。故本文采用“独立检索标准”,多次比较后有针对性地设置检索条件,在期刊权威度与检索结果数间进行平衡,从而既保证期刊来源的质量,又将检索结果数控制在最优分析区间内。表1 展示了检索标准、检索条件以及剔除书评、开刊词等不相关内容后的有效检索结果。第二,运用CiteSpace软件对检索的有效结果进行文献计量学分析,通过数据分析和信息挖掘展现研究的现状、热点和趋势。第三,阅读每篇文章的正文及参考文献
9、,删除对研究主题贡献度小的文献,增加遗漏的文献,最终将与本研究紧密相关的134篇文献作为对4个中文概念进行文献研究的分析对象。文献筛选过程由几位作者“背靠背”独立做出判断,针对意见不一致的文献经讨论后予以确定;同步记录所研究关键词的所有英文翻译,共有Digitalization、Digitization、Digitalized、Datafication、Datalization、Data Transformation、Datamation、Datazation、Digital Transformation、Digitization Transformation等10种。第四,在Web of S
10、cience科研数据库平台中以主题、篇名为依据,从SSCI及SCI期刊中依次检索上述10种翻译方式,阅读检索结果,敲定中文概念对应的英文单词应为 Digitization、Digitalization、Datafication、Digital Transformation。接下来同步骤三,由几位作者对与Digitization、Digitalization、Datafication、Digital Transformation 主题相关的论文进行筛选,最终将符合条件的206篇文献作为对4个英文概念进行文献研究的分析对象。检索对象数字化数据化数字化转型数据化转型检索标准自然科学基金委管理科学部认
11、定的30种重要期刊CSSCICSSCI所有期刊检索条件主题主题篇名主题检索结果数/篇205583440188有效结果数/篇195558424174首篇发表时间1989年1998年2002年2010年表1CiteSpace可视化分析资料选择表孙新波,等:数字化与数据化概念界定与辨析14第22卷创新科技第五,使用文献研究法对步骤三确定的134篇中文文献与步骤四确定的206篇英文文献进行梳理与总结,确定各个概念的定义内涵、演化过程、实践应用,最后基于系统性综述的结果绘制各概念间的联系与区别图表,并提出未来研究展望。此外,为避免由翻译问题导致的偏误,本研究在界定中文概念时仅参考中文文献的原创内容,剔除
12、了翻译后引用的英文论文部分;同样,在界定英文概念时仅参考英文文献的原创内容,以保证研究的准确性与可信度。2文献可视化分析2.1“数字化”与“数据化”2.1.1关键词共现及聚类分析。本文分别制作了“数字化”和“数据化”文献关键词共现与聚类叠加图谱,如图1和图2所示。在图谱中,黑色字体为文献关键词,彩色字体及色块代表关键词的聚类结果。通过关键词聚类分析可以发现,“数字化”与“数据化”聚类图谱中聚类模块值均远大于0.3,聚类平均轮廓值均远大于0.5,这表明关键词共现网络结构较为紧密,聚类结构显著。由图 1 可知,“数字化”聚类有数字化、企业管理、数字经济、价值共创、电子政务与知识产权。图谱中的关键词
13、与各个聚类均紧密相关。除代表聚类的关键词外,出现频次最高的关键词依次为数字技术、数字创新、数字金融及数字平台等。从聚类结果及高频关键词共现结果来看,“数字化”的研究方向较为聚焦,成规模的子领域有数字经济、企业管理与价值共创。这表明,此前“数字化”领域的研究侧重于数字经济背景下数字技术对企业管理模式及价值创造方式的影响,而数字技术驱动下的技术创新与平台经济研究也具有一定的理论积淀。此结果与实践的结合较为紧密,与中国当前良好的数字经济土壤密切相关。由图2可知,“数据化”的聚类结果较为多元,呈“五大类五小类”分布,规模较大的聚类有大数据、数据化、关联数据、人工智能与数据资源,规模较小的聚类有数据共享
14、、数据分析、个人数据、“互联网+”及信息技术。除代表聚类的关键词外,出现频次最高的关键词依次为数字人文、数据驱动、数据挖掘等。从聚类结果及高频关键词共现结果来看,“数据化”的研究呈现两大方向:其一是以数据驱动、数据挖掘、数据分析、大数据、区块链等数据价值挖掘技术为代表的微观研究;其二是以数字化、数据化、智能化、智慧化等为代表的数字技术整体影响研究。总体而言,“数字化”主题研究与“数据化”主题研究属于同根同源,但各自发展的状况,具体体现在两个图谱的高频关键词小部分的重合与大部分的差异上。“数字化”主题关键词围绕各自聚类,内部关系紧密,而“数据化”主题关键词则整体分布较为均匀且内容多元。比较而言,
15、“数字化”的关键词更加宏观,与社会联系更加密切,如数字经济、数字创新、企业管理等;“数据化”的关键词更加微观,与新兴数字技术联系更加密切,如数据挖掘、区块链、大数据等。2.1.2关键词时区分析。本文分别制作了“数字化”和“数据化”文献关键词时区图谱,如图3和图4所示。在图谱中,关键词所处的位置代表图1“数字化”关键词共现与聚类叠加图谱图2“数据化”关键词共现与聚类叠加图谱2022年第6期15其在分析对象中首次出现的年份,连线代表关键词在不同文献中的共现关系。时区图谱可以较为清晰地展现关键词的更迭进程与研究热点的演进规律。由图3可知,“数字化”研究领域最早出现的关键词是1989年的“地理信息”。
16、高频关键词出现较密集的时间段有19962004年以及20182021年。其中,19962004年出现的高频关键词有数字技术、信息服务、企业管理等;20182021年出现的高频关键词有动态能力、数字平台、价值共创、案例研究、数字创新、数字经济等。随着时间发展可以清晰地看出,“数字化”领域关注的技术类别中,最开始是信息技术,中期是数字技术,最近是新兴数字技术。20182021年出现的关键词表明,当下“数字化”领域的前沿研究热点聚焦在价值创造方式以及数字经济与创新方面。由图4可知,“数据化”研究领域最早出现的关键词是 1998年的“数据化”。2011年是“数据化”领域研究规模的分水岭,2011年之前该领域的研究热度不温不火,2011年之后其高频关键词则以每年35个的频率快速涌现。20132015年“数据化”领域有较大部分研究重心落在出版业与媒体业的数据化方面;2018年之后“数据化”领域的关键词逐渐与新兴数字技术产生密切关联,如大数据、区块链、人工智能等;最新出现的数据利用技术方面的关键词代表了数据化研究的新方向。对比而言,“数字化”领域的关键词出现时间更早,涌现节奏也更均匀;“数据化”领域