1、第 卷 第 期 年 月科 学 学 研 究 文章编号:()创新型企业的论文与专利关联性研究 以基因工程领域为例陈 茜,毛 进,马亚雪,李 纲,(武汉大学信息资源研究中心,湖北武汉;武汉大学信息管理学院,湖北武汉;南京大学信息管理学院,江苏南京)摘 要:科学与技术具有双向互惠、协同发展的特征。当前研究多从领域发展视阈探究科学与技术间的关联模式及相互作用,而较少从特定创新主体出发分析两者关联。论文和专利分别是科学与技术的代表性产出,本文以基因工程领域为例,构建以论文和专利为节点的创新型企业科学技术关联网络,结合知识网络分析方法,整合节点语义特征与网络结构特征,揭示创新型企业科学与技术的关联性。结果表
2、明:()在创新能力更强的企业中,科学向技术的转化程度更高,但科技规模过大会导致转化速度降低;()相比跨企业的科技关联,创新型企业内部的科技关联更具优势,科学到技术的知识流动速度更快,且创新能力更强的企业能够在更广泛的科技领域产生关联;()创新型企业科学与技术关联的领域多样性与领域平衡性和企业的异质性能力相关,而领域平衡性仅与领域多样性有关。本研究能够为创新型企业开展基础科学研究、促进科技创新提供管理启示。关键词:科学与技术;基础研究;专利;创新型企业;基因工程中图分类号:文献标识码:收稿日期:;修回日期:基金项目:国家自然科学基金创新研究群体项目();国家自然科学基金面上项目()作者简介:陈茜
3、(),女,博士研究生。毛进(),男,副教授,博士,通讯作者,:。马亚雪(),女,博士。李纲(),男,教授、博士生导师。科学与技术决定创新的发展方向,“十四五”规划明确指出,应“坚持创新在我国现代化建设全局中的核心地位,把科技自立自强作为国家发展的战略支撑”。科学创新是对自然界客观规律的探索和新知识的发现,技术创新是改造世界的方法、手段和过程,表现为科学基础上的技术发明和升级,二者相互融合,协同发展,双向互惠。一方面,科学的发展是技术突破的基石,科学研究中的发现能够促进工业领域生产力的提高和技术创新的出现;另一方面,技术的进步为科学研究提供新的研究视角与有效的检验手段。论文和专利分别是科学和技术
4、的代表性产出,已广泛应用于识别与预测科学或技术领域热点及前沿。分析二者之间的关联性有助于理解科学与技术的关系。现有研究主要从领域发展的视角探究科学与技术间的关联模式及相互作用关系,而较少从特定创新主体出发分析科学与技术之间的关联。创新型企业指拥有持续创新机制,能够将资源要素系统地转化为创新绩效,以获取持续稳定竞争优势的企业。知识基础理论指出,知识是企业创新最核心的竞争性资源。根据动态能力理论,创新型企业作为连接学术界与工业界的重要创新主体,对知识的运用能力是提高核心竞争力的关键。识别科学与技术潜在的知识关联,整合、构建和重新配置以应对快速变化的环境,有助于促进知识从学术界到产业界的流动。尽管企
5、业创新的直接目的是解决商业问题并盈利,更注重创新的应用性,但也会带来具有重大意义的科学突破。因此,探究创新型企业中科学与技术之间的关联性,亦是促进科技创新的重要研究内容。根据内生经济增长理论,创新型企业中新科技知识的产生依赖于旧知识的消化、吸收、再创造。通过剖析创新型企业科学与技术的关联性,有助于识别科学和技术在知识流动中的关联模式和发展规律,促进科学向技术的转化,为理解科学和技术之间的相互作用提供新的视角。同时,厘清科学与技术DOI:10.16192/ki.1003-2053.20220906.001科 学 学 研 究第 卷的关联性有助于创新型企业规划科技创新战略,提高创新能力,对我国创新型
6、国家的建设和经济发展方式的升级转型具有十分重要的现实意义。有鉴于此,本文分析创新型企业中科学与技术的知识流动,探究其科学与技术的关联情况,为促进科技创新提供参考。基因工程指通过基因靶向、核移植、转染合成染色体或病毒插入等方法修改生物体基因组成。该领域知识密集程度高,技术创新高度依赖于科学成果,产业基础建立在科学与技术的发展与协作之上。因此本研究选取基因工程领域的创新型企业作为研究对象,以论文和专利为节点构建企业内部科学技术关联网络,运用知识网络分析方法,整合节点语义特征与网络结构特征,从主题和引用两个角度揭示创新型企业科学与技术的关联性。文文献献综综述述科学追求知识并理解知识,而技术旨在创造能
7、够满足人们需求的产品和系统,即科学强调知识发现与创造,技术强调将知识应用于实践。在对科学和技术的研究中,二者的关系是最复杂的问题之一,引起了学者们的广泛讨论。二战后,“科学驱动技术,技术驱动经济”的线性模型占据主导地位。后续研究逐渐发现科学和技术的多面关系,指出技术依赖于科学的观点过于简单化,科学与技术之间的依赖理应是双向的。提出,科学与技术的关系像“一对舞者”,并非单纯的单向促进关系,而是以多种方式持续发生关联。则指出,科学与技术的进步遵循结构性积累模式,新知识在旧知识基础上向前发展,科学和技术内部稳定累积的过程是相互独立的,当范式被打破,知识可能从科学流向技术,也可能从技术流向科学。科学与
8、技术遵循不同的发展逻辑,但具有协同发展、双向互惠的关系,二者之间的互动加快能够推动领域的快速发展。一方面,科学推动技术的变革,科学研究成果为技术升级创新和突破瓶颈提供理论依据,科学到技术的转化实质上是科学成果的商品化。科学知识的新颖性可以提高技术影响力的广度,而非冗余性的异质科学知识能够提高技术创新的效率。另一方面,技术往往也以重要的方式塑造科学,为科学研究带来更全面的视角,提供丰富的物质条件,以提升科学的竞争力。研究表明,一个领域内科学与技术有相同的发展趋势。学者们通过分析具体领域内论文与专利的关联,识别领域主题、科技前沿与发展态势。陈稳等分析了科学前沿主题与技术前沿主题间的联系,识别出前沿
9、主题的内容演化过程,指出固体氧化物燃料电池领域科学研究与技术研究互相推进,呈双螺旋式发展。宁子晨等通过对数据挖掘领域专利主体、专利技术、论文关键词的多维共现分析,探究基于专利主体的专利文献与论文主体、主题的关联关系,发现数据挖掘相关技术发明与科学研究都已经实现了较为深入的相互渗透。等基于低碳能源领域的美国专利及其引用论文,发现了该领域技术创新的三个独立集群。综上所述,现有科学与技术的关系研究主要从领域发展视阈探究科学与技术间的关联模式及相互作用关系,较少涉及从特定创新主体角度对科学与技术关联性的解读。研研究究设设计计 研究框架论文是科学的重要载体,记录了科学研究发现,具有易获取的特点;专利是技
10、术信息最有效的载体,内容丰富,且需要实时对公众开放,便于收集。科学与技术的关联实际上是两个知识体系的关联,通过分析两个知识体系中知识单元的关联性可以有效揭示科学与技术的关联情况。知识网络作为知识单元的链接网络,能够揭示知识单元的独立性、关联性及整个知识结构的完整性。因此,本研究从主题和引用关系两个角度以论文和专利为知识单元构建创新型企业科学与技术的知识网络,探究创新型企业科学与技术的关联性,分析框架如图 所示,步骤如下。()检索基因工程领域创新型企业拥有的专利和论文;()识别专利和论文主题,计算专利 论文对的主题相似度,探究创新型企业科学与技的主题关联;()分析主题在专利和论文中分布的时间,揭
11、示创新型企业中科学与技术的转化关系;()构建创新型企业内部专利对论文的引用网络;()对引用网络的结构、引用时滞、引用领域的 第 期陈 茜 毛 进 马亚雪 等:创新型企业的论文与专利关联性研究多样性和平衡性进行分析,引用网络结构能够体现科学和技术关联的范围和频率,引用时滞可以评价科学知识向技术知识的流动速度,引用领域的多样性和平衡性则是知识跨领域流动的表现。图 创新型企业论文与专利的关联性分析框架 数据来源本研究中专利数据来源于美国专利商标局(),利用分类号检索确定基因工程领域专利。选取 位国际专利分类号()为“”和美国专利分类()为“”的所有专利,共得到 条专利。通过正则匹配和手工检索筛选出企
12、业专利受让人,对名称进行消歧,得到 个基因工程领域企业。在 数据库中,以企业名称为关键词,检索截至 年 月 日企业发表的全部论文,共收集 家企业发表的 篇论文。通过检查论文检索结果,不同发文规模的企业的准确度均在 以上。参考 对基因工程的定义及 等的工作,检索论文标题、摘要、索引关键字、作者关键字是否包含“”或者“、”等任一单词或短语,得到 家企业在基因工程领域发表的 篇论文,平均每个企业发表 篇。由于较小的专利和论文规模难以衡量企业科学产出与技术创新的整体水平,本文选取同时拥有 篇及以上论文和 项及以上专利的 家创新型企业作为样本,共有 项专利和 篇论文,平均每家企业拥有 项专利,发表 篇论
13、文。基于主题的论文与专利关联分析()主题识别本文利用 主题模型识别论文和专利的主题概率分布。对论文和专利的标题和摘要文本去除停用词、数字和单字母单词,并分词和词干化处理,输入到 主题模型中,通过困惑度确定 主题模型的超参数 值,确定合适的主题数,识别专:。科 学 学 研 究第 卷利和论文的主题。困惑度越小,模型的主题识别效果越好。()相似度计算基于论文主题概率分布 ,和专利主题概率分布 ,计算两者之间的 距离衡量论文与专利之间的相似性:(,)()(,)(,)()与 的相似度(,)越接近,两个概率分布的相似度越高;越接近,则相似度越低。基于引用的论文与专利关联分析科学与技术之间的知识流动可以通过
14、两者之间引用进行显性体现。利用创新型企业内部专利对论文的引用构建科学技术关联网络,结合 位 分类号和 学科分类,得到专利 论文分类对,以评价创新型企业内部科学技术的知识关联,分析指标如下:()网络规模,指网络的节点数和边数,体现创新型企业论文和专利数量与关联规模。()网络密度,衡量创新型企业论文和专利的关联密度。()引用时滞,为专利授予时间与被引论文发表时间的差距,用于评价创新型企业论文知识到专利知识的转化速度。()引用领域多样性,指同一创新型企业内部不同专利分类和被引论文分类的组合数量,以分析论文和专利的跨领域关联。()引用领域平衡性,衡量创新型企业论文和专利不同领域的关联分布是否平衡。由于
15、较高的基尼系数()代表较低的平衡性,本文使用 衡量关联的领域平衡性,使其与引用领域的平衡性具有相同的方向,计算方式为:()()其中 为某企业拥有的专利 论文类别对总数,为序列指标,是企业内部某一专利 论文类别对数量,类别对依据数量从小到大进行排序。该数值越大则平衡性越好,反之越差。研研究究结结果果与与讨讨论论 创新型企业论文和专利的主题关联()主题关联强度分析 主题模型的困惑度曲线如图 所示,在主题数为 时模型生成能力较强,得到 个主题下概率排名前 位的词语(表)。利用 获得论文与专利的主题概率分布,分别计算创新型企业内部所有专利 论文对之间的相似度,选取与每一篇专利相似度最高的论文和与每一篇
16、论文相似度最高的专利,形成最终的关联专利 论文对。然后,根据所有专利 论文对计算每个企业专利 论文平均相似度、专利平均相似度和论文平均相似度,再将所有企业按照其论文和专利规模(即论文和专利的数量)十分位数分成十组,求出每组三项指标平均值,结果如图 和图。随着论文和专利数量增加,企业专利 论文平均相似度、专利平均相似度和论文平均相似度均保持上升趋势,说明在创新能力更强的企业中,内部科学与技术的关联更加紧密。新知识的创造依赖于企业的知识基础。创新能力更强的企业往往拥有更多专利和论文,具备内容更丰富、范围更大的知识库,在获取与识别前沿知识方面具有优势,减少了创新所需知识的不确定性,更容易捕捉科学到技术的知识流动,有效吸收和整合旧知识,从而提升创新效率和效果。()专利授权与论文发表的时滞分析根据专利 论文对计算专利授权时间和论文发表时间的差值,得到企业专利 论文平均时滞、专利平均时滞和论文平均时滞。如图 和图 所示,具有相似主题的专利和论文平均时滞在 年到 年之间,即论文发表时间早于专利授权时间,说明创新型企业的科学产出是技术创新的基石,新主题往往来自于科学研究,然后溢出到技术发明中。企业专利