1、h t t p:/ww w.j s j k x.c o mD O I:1 0.1 1 8 9 6/j s j k x.2 2 0 6 0 0 1 6 6到稿日期:2 0 2 2-0 6-1 8 返修日期:2 0 2 2-1 0-0 3基金项目:西部之光青年学者A类项目(2 0 2 1 X B Z G-A-0 0 2)T h i sw o r kw a ss u p p o r t e db yt h eC A S“L i g h to fW e s tC h i n a”P r o g r a m(2 0 2 1 X B Z G-A-0 0 2).通信作者:蒋海波(j i a n g h b
2、c i b.a c.c n)深度学习在健康医疗中的应用研究综述雪峰豪1蒋海波2唐 聃11成都信息工程大学软件工程学院 成都6 1 0 2 2 52中国科学院成都生物研究所 成都6 1 0 0 4 1(1 4 2 9 2 5 8 7 1 5q q.c o m)摘 要 随着生物医学和信息技术的快速融合发展,健康医疗领域积累了海量的影像数据、患者报告数据、电子健康记录和组学数据等,这些数据具有复杂性、异构性和高维等特点。而深度学习有着复杂函数模拟和自动学习特征的能力,能够从复杂的数据中较为精准地提取有效的信息,可为医学诊断、药物研发等方面的研究提供高效的技术支撑。目前,深度学习在医学影像方面已经取得
3、极大的成功,一些基于深度学习的医学影像诊断系统所获得的性能甚至能够与相关专家媲美。由于自然语言处理技术的进步,深度学习在利用非图像数据中的任务中也取得了显著的进步。文中首先简述了深度学习在健康医疗中的发展历程;然后,针对深度学习模型在健康医疗领域中的应用情况进行了统计分析,并对相关数据集进行了整理,还介绍了深度学习在疾病诊断、健康监护等医学诊疗过程中的研究情况,以及它在蛋白质结构预测和药物发现等方面的研究进展;最后,讨论了深度学习在健康医疗应用中存在的数据质量、可解释性、隐私安全和实际应用限制等关键挑战,以及应对这些挑战的可行方案或途径。关键词:深度学习;疾病诊断;健康监护;蛋白质结构预测;药
4、物发现中图法分类号 T P 1 8;T P 3 9 1.7 R e v i e wo fD e e pL e a r n i n gA p p l i c a t i o n s i nH e a l t h c a r eX U EF e n g h a o1,J I ANG H a i b o2a n dTAN GD a n11S c h o o l o fS o f t w a r eE n g i n e e r i n g,C h e n g d uU n i v e r s i t yo f I n f o r m a t i o nT e c h n o l o g y,C h
5、e n g d u6 1 0 2 2 5,C h i n a2C h e n g d uI n s t i t u t eo fB i o l o g y,C h i n e s eA c a d e m yo fS c i e n c e s,C h e n g d u6 1 0 0 4 1,C h i n a A b s t r a c t W i t h t h e r a p i dd e v e l o p m e n t a n d i n t e g r a t i o no f b i o m e d i c i n e a n d i n f o r m a t i o n
6、t e c h n o l o g y,m a s s i v e a m o u n t s o f i m a g i n gd a-t a,p a t i e n t r e p o r td a t a,e l e c t r o n i ch e a l t hr e c o r d s,a n do m i c sd a t ah a v eb e e na c c u m u l a t e dr a p i d l y i nh e a l t h c a r e.T h e s ed a t aa r ec h a-r a c t e r i z e db yc o m p
7、l e x i t y,h e t e r o g e n e i t ya n dh i g hd i m e n s i o n a l i t y.D e e p l e a r n i n gh a s t h ea b i l i t yo f c o m p l e xf u n c t i o ns i m u l a t i o na n da u t o m a t i c f e a t u r e l e a r n i n g,w h i c hc a np r o v i d ee f f i c i e n t t e c h n i c a l s u p p o
8、 r t f o r r e s e a r c h i nm e d i c a l d i a g n o s i sa n dd r u gd e v e l o p m e n t.C u r r e n t l y,d e e p l e a r n i n gh a sb e e ne x t r e m e l y s u c c e s s f u l i nm e d i c a l i m a g i n ga n d f u r t h e rm o r e,s o m em e d i c a l i m a g i n gd i a g n o s t i c s y
9、 s-t e m sb a s e do nd e e p l e a r n i n gh a v e a c h i e v e dp e r f o r m a n c e t h a t i s e v e nc o m p a r a b l e t o t h a t o f r e l e v a n t e x p e r t s.D u e t o t h ep r o g r e s so fn a t u r a l l a n g u a g ep r o c e s s i n gt e c h n o l o g y,d e e p l e a r n i n gh
10、 a s a l s om a d e r e m a r k a b l ep r o g r e s s i n t h eu s eo f n o n-i m a g ed a t a t a s k s.T h i sp a p e r f i r s tb r i e f l yd e s c r i b e s t h ed e v e l o p m e n to fd e e p l e a r n i n g i nh e a l t h c a r e.S u b s e q u e n t l y,t h ea p p l i c a t i o no fd e e pl
11、 e a r n i n gm o d e li nh e a l t h c a r e i ss t a t i s t i c a l l ya n a l y z e d,a n ds o m ea v a i l a b l ed a t a s e t sa r es o r t e do u t.I na d d i t i o n,t h i sp a p e ra l s oi n t r o d u c e st h er e-s e a r c hp r o g r e s s o f d e e p l e a r n i n g i nm e d i c a l d
12、i a g n o s i s a n d t r e a t m e n t p r o c e s s e s s u c ha sd i s e a s ed i a g n o s i s a n dh e a l t hm o n i t o r i n g,a n di t sr e s e a r c hp r o g r e s s i np r o t e i ns t r u c t u r ep r e d i c t i o na n dd r u gd i s c o v e r y.F i n a l l y,k e yc h a l l e n g e so fd
13、 e e p l e a r n i n g i nh e a l t h c a r ea p-p l i c a t i o n ss u c ha sd a t aq u a l i t y,i n t e r p r e t a b i l i t y,p r i v a c y s e c u r i t ya n dp r a c t i c a l a p p l i c a t i o n l i m i t a t i o n s a r ed i s c u s s e d.I t a l s od i s c u s s e sf e a s i b l es o l u
14、 t i o n so ra p p r o a c h e s t ot h e s ec h a l l e n g e s.K e y w o r d s D e e p l e a r n i n g,D i s e a s ed i a g n o s i s,H e a l t hm o n i t o r i n g,P r o t e i ns t r u c t u r ep r e d i c t i o n,D r u gd i s c o v e r y 1 引言人工智能(A r t i f i c i a l I n t e l l i g e n c e,A I)能
15、够利用计算机系统来模拟人类智能过程的特征,甚至能够通过有监督或无监督等算法实现自我修正,这些特性使得它能够支撑加速实现个性化、预测性的健康医疗1-2。随着数据来源多样化以及数据量的加速累积,健康医疗数据已经具有多维性、复杂性和异构性等特点。这些健康医疗数据具体包括影像数据、可穿戴设备获取的数据、电子健康记录、蛋白质组学数据和基因组学数据等3。面对高维的医学数据,很多经典的机器学习算法如随机森林(R a n d o mF o r e s t,R F)和支持向量机(S u p p o r tV e c t o rM a c h i n e,S VM)等 已 经 不 能 够 对 其 进 行 较 优
16、的处理4。而深度学习5(D e e pL e a r n i n g,D L)可以使用多层复杂结构或由多重非线性变换构成的多个处理层对数据进行处理,能够从复杂的样本数据中挖掘出不同层面的抽象特征6,这使得它能够准确地从医学数据中挖掘出潜藏的规律特性和模式特征。现阶段,深度学习已经在健康医疗领域中得到了广泛的应用。受2 0 1 2年深度学习模型在图像分类任务中取得巨大成功的影响,深度学习在医学影像诊断方面已经取得许多显著的成果7,具体包括不同组织器官或病灶的分割8和分类9等。在一些放射科的诊断任务中,深度学习所取得的性能已经达到甚至超过人类专家水平1 0-1 3。近几年,由于自然语言处理技术的进步,深度学习模型在基于信号、文本等非图像数据的处理中也逐渐展示出优异的性能。可穿戴设备和电子健康记录中包含了大量有价值的非图像数据,可用于对病人的健康监测、患病风险预测或疾病诊断,这使得深度学习在这些方面的研究也逐渐增多1 4-1 7。深度学习不仅可以通过常规影像数据诊断相应的疾病,还能够从中发现新的诊断方向或者提供新的见解。举例来说,视网膜图像通常被用来诊断糖尿病性视网膜病变等眼科疾病,但一些研