1、基金项目:河北省社会发展研究课题()收稿日期:作者简介:梁思宇(),男,黑龙江齐齐哈尔人,硕士研究生,研究方向:运动生物力学,智能体育工程第 卷第期浙 江 体 育 科 学 ,年 月 文章编号:()深度学习研究概述及其在运动科学领域中的应用综述梁思宇,井兰香,徐赟(燕山大学 体育学院,河北 秦皇岛 ;浙江大学 工程师学院,浙江 杭州 )摘要:深度学习作为机器学习的一个分支,在图像处理,计算机视觉,自然语言等方面得到广泛的运用。而“运动科学”是以多学科融合交叉作为研究手段从而达到研究目的的学科,为使研究手段更加便利,研究结果更加精确,部分学者将深度学习的研究方法引入到运动科学的研究中,并取得了优异
2、的成果。通过对现有的深度学习发展状况和在运动科学领域中的应用进行检索并综述,提出存在的问题和对未来的展望。综述表明,将深度学习运用到运动科学领域中时,使得运动科学的诸多问题开始倾向于工业化、信息化,简化了研究过程,提高了研究效率,深入了研究层次。但由于运动科学中计算机领域人才的缺失,使其泛化性不强。面对国际体育领域学术研究范式的根本性转变,需要运动科学的研究模式更应与其他学科进行融合交叉,将世界一流体育学科作为建设目标。关键词:人工智能;深度学习;运动科学;运动想象脑机接口;关键点检测中图分类号:文献标识码:,(,;,):,“”,:;前言运动科学()是对人类从事体育活动进行科学分析的一个综合性
3、学科。近些年来,在深层次的国际交流中发现,“运动科学”与“体育科学()”是两个不同的概念,并且“运动科学”的研究人员往往通过学科交叉的方式在其他领域大展拳脚,或将其他领域的研究方法运用到“运动科学”领域中来,现已成为研究热点。当下正值我国 学位授予和人才培养学科目录设置与管理办法 的调整年,为了“运动科学”学科能有一个更好的归宿,陈佩杰教授在 建议交叉学科门类下设置“运动科学”一级学科 中指出,“运动科学”是以运动学基本理论为基础,多学科交叉融合,并以自然科学、社会科学为主要导向的独立学科,而体育学更适宜作为教育学门类下以人文学科为主导方向的学校教育领域学科,由此可以清晰地辨别“运动科学”与“
4、体育科学”的区别。随着人工智能技术的发展,作为其重要技术之一的深度学习也得到广泛的研究,并在 其 他 学 科 中 得 到 运 用,成 为 当 下 研 究 热点。但深度学习在“运动科学”领域上的应用并不广泛,通过查阅文献可知,深度学习在“运动科学”的应用包括:运动想象,人体骨骼关键点检测,人体异常行为检测,体育教学,运动轨迹捕捉等方面,缺乏在应用方面的综述性研究。本文通过回顾深度学习的发展历程,总结深度学习在运动科学领域中具有广泛应用的方向,提出存在的问题及对未来的展望。深度学习概述 深度学习人工智能(,)是计算机科学的一个分支,是新一轮科技革命和产业变革的重要驱动力,他的新生和发展主要是人们期
5、望让人工系统来代替人的工作,且与人拥有相同的智力和能力。机器学习(,)则属于人工智能的一个方法子领域,它的作用是使计算机从历史的经验中汲取优势并学习,进而改善并提高自身性能。在近几十年的发展过程中,机器学习的一个新的分支被挖掘出来深度学习(,),这个概念在 年由多伦多大学的 等最早提出,运用了无监督预训练方法网络权值的初值进行优化,再将权值进行了微调,从此拉开了深度学习的序幕。它本是人工神经网络研究的概念,在被引入到机器学习后被认为是目前最接近人工智能的方法。深度学习与传统机器学习有着诸多差异,其中最显著的是,深度学习方法运用了多层非线性处理单元级联进行特征的提取和转换,实现了多层次的特征表示
6、与概念抽象的学习,避免了同传统机器学习下对特征工程的要求,轻松实现了端到端的训练,并且在大数据下展现出了卓越的优势,在语音、图像处理、计算机视觉和自然语言处理等领域取得的成功。近些年来,国内外各大网络科技公司纷纷在深度学习领域进行布局,例如:国内最早出现且影响力最大的是由百度推出的“飞桨()”,它是以深度学习为核心框架,现已成为技术先进、功能完备的产业级别深度学习平台。在此之后,旷世科技和华为也相继开源了自身的深度学习框架。在国外,谷歌的 和脸书的 已在开源社区取得广泛影响力。深度学习之所以被称作“深度”,是相对于支持向量机(,)、提升方法()、最大熵方法等“浅层学习”方法而言的,深度学习所学
7、得的模型中,非线性操作的层级数 更多。浅层学习抽取样本的途径是通过人工经验,网络模型学习后只能获得单层特征,它并不具备层次结构,。而深度学习的不同之处是逐层对原始信号进行特征变换,将原空间的样本特征变换到新的特征空间,通过自动学习得到新的层次化的特征表示,从而更有利于分类或特征的可视化(如图)。深度学习理论的另外一个理论动机是:如果一个函数可用层结构以简洁的形式表达,那么用层的结构表达则可能需要指数级数量的参数(相对于输入信号),且泛化能力不足,。图深度学习与机器学习的学习过程差异 深度学习实现路径深度学习是在机器学习上的深入,将支持向量机、决策树、聚类等传统方法中普遍使用的较浅的特征提取层次
8、加深,模仿神经元之间的传导关系,通过多层隐藏“神经元”建立网络架构,按照人脑的原理解释数据,从而通过前向与反向传播,计算出从输入的数据到输出的结果之间的一系列变换过程(如图),从而能够用于预测结果、揭示内部规律、提取数据特征、风格迁移与融合、数据修复等一系列的操作。深度学习的应用领域已经非常广泛,通过对当前最为热门、成熟的计算机视觉 和自然语言理解 领域的深度学习方法的实现进行研究后,将深度学习的本质归结为多层次且有意义的运算数据得到期待结果,实现过程总结为:输入大量信息,对输入进行预处理,得到高质量的待处理数据;进行一层一层的正向传播,进行特征提取、张量变形等操作,将低层次的抽象程度低的数据
9、转换为高层抽象程度高的数据,从而能够简化原本复杂的运算,仅需梁思宇,井兰香,徐赟:深度学习研究概述及其在运动科学领域中的应用综述简单的模型实现相应操作;通过反方向的传播由优化器()来进行参数值的调整,降低损失;最后计算出这个参数情况下模型运算结果的损失,也就是偏差值,以此衡量模型的好坏。图含有多个隐藏层的深度学习模型 深度学习当前热点目前,深度学习研究热点较为广泛,分布领域交错复杂。在教育领域中,有学者通过运用 、等工具对深度学习的研究热点进行多维尺度分析和聚类分析等可视化处理 后推断,未来深度学习的研究趋势将与人工智能、教学研究、大数据等紧密结合,梁策在 近十五年我国深度学习热点研究 指出“
10、教育人工智能”“在线学习”与深度学习联系紧密,关键词出现频率较高;在人工智能领域中,它可以和其他人工智能技术相融合,比如与强化学习的融合,这两个技术的综合实力,在机器围棋大师 和 身上得到 充 分 的体现;在自动化技术中,它虽然简化了特征工程,但是模型设计和超参数调试依旧在大量消耗人工,特别是部署对网络结构有更特殊化的要求;在生物医学工程中,它可以对医学影像进行分类、检测、分割和智能分析,但当前大多医学影像智能分析平台,只可针对单种疾病,因此建立分析多种疾病医学影像智能化平台是未来重要发展方向。深度学习在运动科学领域中的应用深度学习在运动科学领域中的应用,针对运动想象、人体骨骼关键点检测、人体
11、异常行为检测、运动轨迹捕捉等领域的应用上,实质上仍然可以归结于计算机视觉的问题,究其根本运用了分类、聚类、特征提取的方法,只是输入的数据发生了改变,需要得到的结果也有自己特定的运动科学公式,从而分析得到结果。由于运动科学中数据量通常是很大的,所以对数据进行预处理非常重要,预处理阶段主要进行筛选、数据增强、添加随机噪声等操作,这些都是为了能够增加结果准确率和模型收敛速度,提高训练效率。预处理之后,数据被送入到中间的各个“神经元”中进行一层一层的运算,通常会先进行特征提取操作,使用多层卷积将原本大量复杂的数据运算得到新的具有较高抽象程度的特征,为了避免层与层之间的作用,由于存在线性关系而无法表示更
12、为复杂的数据之间的变换关系,通常加入激活函数。激活函数常用的有 函数,如式()所示,其取值为(,)通常被使用在中间的隐藏层;函数,如式()所示,其中,表示第维特征,表示总共有个特征,取值为(,),能够被使用在多个类别进行分类时,计算每个类别的可能性,所有类别的值之和为。在层与层的传播中,还会有反向的用于更新调整参数的运算,我们使用优化器来实现,从本质上看是进行求导操作,误差对权重求偏导,经过链式法则简化运算根据对应的学习率从而得到对权重的更新。最后在每一次输出以后使用损失函数对模型进行评估,根据通过该网络的输出与期望得到的输出对比,得到两者之间的偏差大小,例如在人体骨骼关键点检测中,就可以通过
13、检测到的骨骼点和有监督训练数据集中标注的骨骼点位置之间的交叉熵损失得到。从而在一次又一次的模型训练中得到一个损失很小的模型,就能够将这个模型利用到该类型问题的应用中了,并且实际使用中,也能够让模型继续得到学习,达到更加精确的结果。()()()运动想象脑机接口运动想象(,),指人在想象自己肢体进行运动但没有实际的运动输出,人脑的特定区域仍存在信号刺激。运动想象的研究源于对大脑功能区域的认知,新皮质是位于大脑最外层沟壑纵横的复杂沟回区域,由大约 亿个神经元细胞组成。年,德国神经解剖学家 将新皮质功能区域进行了分区。运动想象疗法()是指为了提高某种运动功能而进行的反复的特定的运动想象方法,期间没有任
14、何运动输出,根据自身对运动的记忆在大脑中激活某一特定区域,从而达到提高运动功能的目的,在运动康复领域中被广泛运用。它的原理是:心理神经肌肉理论(第 卷 第期浙 江 体 育 科 学 年月 ,),它基于人体通过运动训练后,运动的运动计划或“流程图”会储存于中枢神经系统,通过运动想象后,可以将中枢神经系统所存储的“流程图”进行强化和完善,再不调动肌肉的前提下,有助于学习和完善运动技能。它的应用范围有:正常人运动、脑损伤患者、脊柱损伤患者、截肢患者等。运动想象脑机接口(,)是指记录不同类型的运动想象,如左手、右手或脚的想象运动时的局限和短暂的脑电图变化,使用相关的解码算法分类识别运动想象的内容。的原理
15、是大脑皮层会明显减弱对侧运动感觉区的脑电节律能量,增加同侧运动感觉区的脑电节律能量,在节律()与节律()上最为明显,该现象被称为事件相关的去同步(,)或事件相关的同步(,)。研究人员可以通过 技术为患者搭建一条神经通道通过检测患者的脑电信号,识别患者的运动意图,由运动意图触发外部设备进行治疗工作,可以实现闭环训练和主动康复。学者们基于深度学习原理和框架提出了多种对 的分类方法,例如:。该方法包括样本生成模块、信号处理模块和分类识别模块具体流程(如图)。图 方法流程示意 以深度学习理论为基础,包括流程图中个部分,首先,通过自动编码器(,)网络对其样本的基础数量进行扩充;然后,为了获得更准确的样本
16、信息,设计带通滤波器,对所提取的 (脑电图)信号的个波段进行分析;最 后,通 过 调 整 深 度 信 念 网 络(,)的结构和参数对多类运动想象脑电进行分类识别。运用此方法进行 竞赛的结果分析表明,此方法得到的平均 系数值最高,在多类脑电识别过程中具有更好的分类性能。基于通道注意力和稀疏时频分解模型。该方法为了充分利用原始脑电信号的空间结构和时间特征,搭建了基于通道注意力和稀疏时频分解(,)的深度神经网络模型。首先,利用 算法时频平面上的脑电稀疏性,后结合脑电信号的特性,加入注意力模 块(,)。利用全局关系信息来沿着时间和空间两个不同的维度依次对脑电信号进行映射,提取运动想象脑电信号的时间和空间特征。最后利用改进的时间 卷 积 网 络(,)进行特征融合分析,实现对运动想象脑电信号的解码任务。此研究模型优势在于可以提高脑电信号在时频域的稀疏性,增强时频特征的差异性;再加入注意力模块后,可利用它的多通道特性,提高分类效果;最后运用 对提取特征进行融合分析,加入深度卷积层和可分离卷积层,减少卷积层的参数数量,并将数据特征在空间维度上进行加权组合,减小模型参数计算成本。深度学习算法。算法是目前