1、2022-2023中国人工智能计算力发展评估报告目录核心观点第一章 人工智能发展概况1.1 放眼全球:各国持续加大布局,拓展人工智能创新应用1.2 聚焦中国:人工智能算力需求稳增,持续夯实算力底座第二章 人工智能算力及应用2.1 芯片:需求日益增长,发展空间广阔2.2 服务器:中国市场领跑全球,绿色节能引领未来2.3 计算架构:以系统创新为基础,支持多元算力发展2.4 云服务:市场规模稳步提升,算力设施提供强力支撑2.5 算法模型:加速大模型行业落地,助力实体经济发展2.6 生态:推进产业化布局,发挥平台价值2.7 应用:场景化落地纵深发展,加速智算力向创新力转化第三章 中国人工智能计算力发展
2、评估3.1 行业排名3.2 地域排名第四章 行动建议4.1 对行业用户的建议4.2 对技术提供商的建议4.3 对产业发展的建议01 030405 0809101112121314 171822 26272727核心观点01通过aaS服务提供AI平台和AI服务正越来越被用户接受,AI平台和服务的快速迭代能力和丰富的场景化人工智能能力,正在为行业的智能化发展提供有力支撑。IDC调研显示,目前排名前三的人工智能云服务是:搜索、人脸识别和推荐引擎,预计未来18个月,排名前三的人工智能云服务将为:自然语言处理、图像识别和视频识别。人工智能算法模型呈现出多样化、巨量化、专业化等显著特征,算法基建化发展对于
3、实现普惠人工智能具有重要作用,绿色高效、可应用性强等成为主要诉求。市场积极探索面向专业场景的轻量化模型以加速落地运作,并通过集中式的数据和算力开发模式为企业提供预训练平台,提供分布式加速计算集群解决方案,合理匹配计算任务与计算资源,提升整体利用率和训练效率,加速实现人工智能普惠化目标。从计算架构发展来看,基于 DSA(Domain-Specific Architec-tures)思想设计的人工智能芯片正在成为主导,推动了人工智能芯片多元化发展。多元算力从“能用”到“好用”并且为企业创造业务价值,离不开通用性强、绿色高效、安全可靠的计算系统的支持。业内正在推动多元算力系统架构创新,基于计算节点内
4、和节点间的互联技术破局现有计算架构的瓶颈,通过充分调动起多芯片、多板卡、多节点的系统级能力,实现各种加速单元以及跨节点系统的高效协同,提升计算性能。2022年,人工智能在各个行业的渗透度均有提升,应用渗透度排名前五的行业依次为:互联网、金融、政府、电信和制造。总体来看,人工智能在各个行业的应用程度都呈现不断加深的趋势,应用场景也越来越广泛,人工智能已经成为企业寻求新的业务增长点、提升用户体验、保持核心竞争力的重要能力。在2022年中国人工智能城市排行榜中,北京、杭州、深圳继续保持前三名,上海和广州分列第四、五名,天津进入前十名。除了 TOP10 城市之外,诸如合肥、武汉、长沙等多个城市在自身产
5、业优势及各种因素推动下,人工智能应用取得了较大进展,未来将会出现越来越多具有城市特点的人工智能示范区,为产业发展树立标杆。算力是数字经济时代的核心生产力,智算力则是数字化创新的源动力。人工智能已在国家经济建设、科技实力提升、推动生产力发展等方面呈现出举足轻重的作用。人工智能算力正在为国家创造力的发展带来实质性推进,为企业带来切实的创新成效,加速驱动新业态的形成。我国进一步明确了人工智能对于提升国家核心竞争力的重要支撑作用,随着新基建、数字经济等持续利好政策的推动,中国人工智能市场将保持平稳增长。IDC预测,2022年中国人工智能市场相关支出将达到130.3亿美元,有望在2026年达到266.9
6、亿美元,2022至2026年年复合增长率达19.6%。中国算力规模,尤其是智能算力规模,正在高速增长。2021年中国智能算力规模达155.2每秒百亿亿次浮点运算(EFLOPS),2022年智能算力规模将达到268.0EFLOPS,预计到2026年智能算力规模将进入每秒十万亿亿次浮点计算(ZFLOPS)级别,达到1,271.4EFLOPS。2021年中国通用算力规模达47.7EFLOPS,预计到2026年通用算力规模将达到111.3 EFLOPS。2021-2026年期间,预计中国智能算力规模年复合增长率为52.3%,同期通用算力规模的年复合增长率为18.5%。伴随人工智能算力需求的高速增长,建
7、立健全助商惠民的数字基础设施服务体系、推进算力基建化发展势在必行。人工智能服务器仍是人工智能市场增长的主力军。IDC数据显示,2021年全球人工智能服务器市场的同比增速为39.1%,超过全球整体人工智能市场增速(20.9%),是整体人工智能市场增长的推动力。在中国,人工智能应用的加速落地很大程度推动了中国人工智能服务器市场的高速增长。2021年人工智能服务器市场规模59.2亿美元,与2020年相比增长68.2%,预计到2026年,中国人工智能服务器市场将达到123.4亿美元。目前,中国仍以GPU为主实现数据中心计算加速,市场占有率近90%,但ASIC、FPGA、NPU等非GPU芯片市场也在加速
8、发展。近年来,在政策、资本等多重因素驱动之下,中国人工智能芯片专利数量不断增长,产业链和应用场景不断完善扩充,市场规模不断扩大,产业正向好发展。6*1*7*8*9*10*2*3*4*5*2022-2023 中国人工智能计算力发展评估报告02人工智能发展概况03 全球企业持续增加对人工智能的投资伴随数字经济的持续发展,以及诸如新冠肺炎疫情等突发事件的影响,企业积极打造敏捷反应机制,推进精益化管理,提升组织创新能力,以期在变革中发现新的赛道甚至实现弯道超车,实现数字时代中的自身发展。为满足企业内部发展需求和外部市场需求,企业一直大力投资数字化转型相关技术,特别是在人工智能领域。人工智能支出已经成为
9、支持企业数字化转型支出的主力之一。IDC数据统计,全球范围内,企业在包括硬件、软件和服务在内的人工智能(AI)市场的技术投资从2019年的612.4亿美元增长至2021年的924.0亿美元,预计将在2022年(同比)增长 26.6%至1,170.0亿美元,并有望到2025年突破2,000亿美元,增幅高于企业数字化转型(DX)支出整体增幅。全球各国人工智能发展特征对于国家而言,人工智能在国家经济建设、科技实力提升、社会生产力发展等方面表现出举足轻重的作用。世界诸多国家,尤其是领先的大国正在竞相开发和部署人工智能技术,以改善人民生活、工作、科研条件和方式,进而在未来智能世界中保持科技竞争力和优势,
10、同时对经济发展带来促进作用。2022-2023 中国人工智能计算力发展评估报告041.1放眼全球:各国持续加大布局,拓展人工智能创新应用纵观各国,人工智能发展呈现如下特征:各国持续布局人工智能发展战略:诸如美国、英国、欧盟、日本等全球主要经济体进一步推进人工智能战略的制定,在国家战略领域的引导下,持续推进技术的产业化发展:在2022财年美国研发类项目预算中,人工智能、量子计算等领域被列为优先投资项目;英国采取全行业、大投入策略,从基础设施建设到人工智能企业进行全方位扶持建设,一批人工智能创业企业崭露头角,得到市场认可;欧盟、日本等尝试结合产业优势,成为细分领域“领头羊”,比如,德国结合工业行业
11、积累,积极打造人工智能工业制造品牌;日本从可持续发展、灾难预警治理等方面入手,希望构建具有国家特色的人工智能产业。在政府推动下,各国科技企业积极跟进,进一步提升人工智能领域投资。这些人工智能发展战略对应用水平的提高起到了促进作用,同时也推动了各国对人工智能的投入,根据IDC数据,各个国家的人工智能投入在其本国GDP总量的占比均出现不同程度提升,从2015年-2022年,美国人工智能投入占比提高了3倍,德国提高了5倍,而中国人工智能投入占比则提高了13倍之多。全球领先超大规模企业引领了这一发展,微软支出数十亿美元投资AI创业公司OpenAI构建智能计算系统;Stability AI公司在 AWS
12、 云上部署了4,000多个节点的集群用于人工智能训练工作负载等。加强政策支持和引导,探索监管与创新之间的平衡:各国越来越重视公共政策的出台,以期规范和引导人工智能的良性发展:诸多国家和地区相继出台不同的人工智能监管法规,例如,美国国防部2022年出台的负责任的人工智能策略报告,指出政府应主动思考并提出应对策略,解决人工智能可能带来的数据安全、道德伦理等问题;日本政府发布的人工智能战略2022摘要指出产业发展对数字化、人工智能等基础设施具有迫切需求,在发展的前提下,政府也会配套关注人工智能安全策略;2022年,欧洲议会决议通过欧洲机器人技术民事法律规则,填补机器人和人工智能民事立法空白,加强对机
13、器人市场的监管和引导。各国一方面鼓励区域性的人工智能解决方案的提出,降低在数据获取、数据偏见、隐私和道德伦理等方面存在的潜在风险,另一方面也在思索如何在监管、创新和人工智能商业化之间取得平衡。发挥人工智能在社会与民生问题方面的价值:各国政府面临的重要民生问题也有望通过人工智能技术制定更优的预防和管理方案。在医药研发领域,人工智能模型对基因组结构预测提供数万倍计算效率提升,同时精度并未有明显损失,有效助力新冠疫苗研发;在公共卫生事务管理领域,基于人脸识别的自动健康码扫描、身份证识别等服务,为突发公共事件的治理和预防提供新的有效方案;在 AI支出增幅 DX支出增幅 GDP增幅 图1 全球人工智能支
14、出、数字化转型支出及GDP增长趋势预测,2020-202435.0%25.0%30.0%20.0%15.0%10.0%5.0%0.0%-5.0%2020202120222023202429.0%16.9%16.9%10.6%26.6%27.9%26.3%17.6%17.0%16.2%3.0%3.0%2.9%5.7%-3.3%来源:IDC,世界银行,2022气象灾害预测领域,越来越多组织以神经网络为基础进行智能化风险识别,比如,日本将“利用人工智能应对紧迫危机”作为2022年首要人工智能战略,希望通过利用人工智能技术,实现大规模灾害的精准预测,提升国家灾害抗压力;在农业领域,各国也加强人工智能赋
15、能,以美国为例,美国国家科学基金会(NFS)联合各政府机构以及科技巨头,共同合作新建国家人工智能研究所,以期提供可持续发展的作物生产解决方案,对抗日益凸显的粮食危机。人工智能的快速发展,极大拉动了算力的发展。如同生物大脑是“人智”的核心,人工智能也同样非常依赖一个高质量的“大脑”,即人工智能基础设施,包含计算、存储和网络。面对数据攀升、算法和模型领域的突破,“大脑”需要尽可能快速、精准地处理大量数据或执行复杂的指令,这对人工智能计算力提出更高的需求。当前,全球人工智能算力基础设施产业加速发展,为人工智能技术更广泛的场景落地带来可能。释放算力的价值,对国家整体的经济发展将起到推动作用。根据202
16、1-2022全球计算力指数评估报告的研究结果,计算力指数平均每提高1点,数字经济和GDP将分别增长3.5和1.8。国家计算力指数越高,对经济的拉动作用越强。元宇宙迎来快速发展风口期,算力基础设施重要性凸显2021年元宇宙(Metaverse)成为全球科技领域备受瞩目的重要概念之一,它作为混合现实类先进解决方案可推进实现数实融合:一方面实现虚拟数字世界对现实物理世界的映射,另一方面也在虚拟数字世界里创造可以与现实世界交互的新体验,进而打造共情化的卓越体验,实现高效有序的韧性运营。在这个过程中,人工智能技术将对元宇宙的建设起到至关重要的作用,计算机视觉、机器学习、自然语言处理等人工智能技术为创造广
17、阔复杂的虚拟空间、优化交互体验提供底层支持,元宇宙的实现将营造一个全新的数字环境。在这个环境里,诸如3D场景构建、实时渲染、高仿真交互等场景的实现需要大规模算力支持。当下,尽管全球各大互联网巨头已加入元宇宙战略布局,但元宇宙的发展仍处于萌芽阶段,打造趋于终极形态的元宇宙世界需要大量数字化内容的创建和分发、资产的数字化建设以及可落地场景的探索,这对算力基础设施将提出更高的要求,也在计算成本等维度给企业带来更多的挑战。目前元宇宙对云计算、边缘计算、人工智能芯片等领域的上 政策驱动下,中国人工智能发展迎来黄金时期中国始终强调科技兴国的重要性。数字经济时代,技术的力量更为凸显。近年来,中国政府相关部门
18、相继发布一系列政策,更加明确了人工智能对于提升中国核心竞争力的重要支撑作用,加上新基建、数字经济等持续利好政策的推动,中国人工智能市场保持平稳增长。IDC预测,2022年中国人工智能市场相关支出将达到130.3亿美元,有望在2026年达到266.9亿美元,2022至2026年年复合增长率达19.6%。加速技术行业落地、推进优化治理是中国人工智能相关政策的核心目标方向:加速技术的行业落地:中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要(简称“十四五”纲要)指出要推动互联网、大数据、人工智能等同各产业的深度融合。基于此,各省市纷纷布局打造示范应用行业和场景,推进人工智能与
19、产业融合。2022年关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见(简称意见)发布,意见为各地方和各主体加速人工智能行业和场景化落地提供指引,指出制造、农业、物流、金融、商务、家居等重点行业可深入挖掘,“促进智能经济高端高效发展,以更智能的城市、更贴心的社会为导向,在城市管理、交通治理、生态环保、医疗健康、教育、养老等领域持续挖掘人工智能应用场景机会,开展智能社会场景应用示范”,并鼓励科研机构及高等院校加大对于人工智能技术研究、开发及应用的投入力度。2022-2023 中国人工智能计算力发展评估报告051.2聚焦中国:人工智能算力需求稳增,持续夯实算力底座下游生态圈已经产生推
20、动作用,IDC预计在2022年,以运营商、基础架构供应商、互联网大厂为主的元宇宙基础设施建设参与者会领衔发力,加快相关产品的研发、操作平台的创新和内容的升级,除在游戏、媒体和娱乐等行业内的诸多场景外,培训和远程办公有望成为最先落地的元宇宙商用场景。此外,元宇宙也将在教育、金融、零售、文化旅游、智慧城市等领域实现渗透,为人工智能的发展带来更多创新空间。企业应提前布局底层算力支持平台,为更多元宇宙场景的落地和运行提供算力支持。06推进优化治理:伴随人工智能应用逐步广泛落地,国家相关机构通过制定一系列规范和政策,例如要求医疗人工智能影像公司“持证上岗”,制定智能网联汽车道路测试与示范应用,完善无人驾
21、驶领域相关监管框架和法规等,旨在一方面监管和把控人工智能发展过程中存在的潜在风险和问题,另一方面基于规范化管理促进人工智能的规模化、可持续化发展。此外,数据安全及个人隐私也成为新一代人工智能治理的重要组成部分,基于联邦学习、隐私计算等技术创新,法律法规约束和社会监督,旨在降低安全隐患,避免乱用滥用,促进企业重新审视自身数据及人工智能战略,调整和优化管理流程,以符合政策法规,促进科技向善。中国智能算力规模持续扩大,推进算力、算法基建化发展势在必行数据海量增加,算法模型愈加复杂,应用场景的深入和发展,带来了对算力需求的快速提升。为定量评估算力规模的大小,本报告基于IDC中国加速计算服务器市场半年度
22、跟踪报告及智能加速卡半精度(FP16)相当运算能力数据,测算了中国智能算力规模。结果显示,中国智能算力规模正在高速增长。2021年中国智能算力规模达155.2 每秒百亿亿次浮点运算(EFLOPS),2022年智能算力规模将达到268.0 EFLOPS,预计到2026年智能算力规模将进入每秒十万亿亿次浮点计算(ZFLOPS)级别,达到1,271.4EFLOPS。作为参考,本报告基于IDC中国服务器市场季度跟踪报告及CPU双精度(FP64)运算能力数据,测算了中国通用算力规模。2021年中国通用算力规模达47.7EFLOPS,预计到2026年通用算力规模将达到111.3 EFLOPS。2021-2
23、026年期间,预计中国智能算力规模年复合增长率达52.3%,同期通用算力规模年复合增长率为18.5%。随着数字基础设施在政务服务、经济建设、民生保障、社会治理等方面的支持作用加大,以及伴随人工智能算力需求的高增长,中国政府鼓励推进数字公共服务的普惠化发展,建立健全助商惠民的数字基础设施服务体系,推进算力基建化发展。2022年2月,国家发展改革委会同中央网信办、工业和信息化部、国家能源局等部门,启动实施了“东数西算”工程。“东数西算”工程的启动以及智能计算中心的建设从国家层面实现有效的资源结构整合,助力产业结构调整,通过算力基础设施从点到网的升级,构建更为健全的基础设施结构。目前,国家在京津冀、
24、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群,协调区域平衡化发展,推进集约化、绿色节能、安全稳定的算力基础设施的建设。2022年发布的企业技术创新能力提升行动方案(2022-2023年)也提及将加速智能计算中心的发展,以期面向企业提供低成本算力服务,推进算力的基建化发展。IDC调研发现,中国企业对人工智能算力基础设施平台的关注点依次为:丰富的应用场景配置、加速性能和计算能力、规模效应下的价格成本因素、训练的数据支持、人工智能配套政策吸引。IDC认为,就现阶段而言,由于中国市场倾向于首先投资硬件,中国人工智能支出中硬件占比将保
25、持最大,未来5年将一直保持65%左右的份额。2022-2023 中国人工智能计算力发展评估报告图2 中国智能算力规模及预测,2019-20262021202020192022202320242025202602004006008001,0001,2001,400百亿亿次浮点运算/秒(EFLOPS)31.775.0155.2268.0427.0640.7922.81,271.4来源:IDC,2022百亿亿次浮点运算/秒(EFLOPS)图3 中国通用算力规模及预测,2019-20262021202020192022202320242025202602040608010012014030.139.6
26、47.756.567.980.395.5111.3来源:IDC,2022100%80%60%40%20%90%70%50%30%10%0%202120222023202420252026 硬件 软件 服务 图4 中国人工智能支出中硬件、软件、服务占比及趋势,2021-2026来源:IDC,2022企业在模型研发和落地过程中往往存在高投入、高风险等挑战,算法基建化可有效帮助企业实现破局。借助智能计算中心,企业可部署训练和推理系统,推进模型研发和创新,尤其有利于自然语言处理大模型、视觉大模型和多模态大模型等高算力消耗模型的构建。除了大模型研发和创新,对于众多企业而言,他们还面临如何将大模型落地行业
27、,解决现实复杂、琐碎场景中的应用问题。IDC调研显示,未来超过80%的组织表示会考虑购买预先训练好的人工智能模型,而不是自己进行训练。但是预先训练的模型在可用性和适应性、运行模型的基础设施,以及内部专业知识等方面还存在提升的空间,企业亟需行业的解决方案商的支持,缩小技术创新和落地应用之间的鸿沟。2022-2023 中国人工智能计算力发展评估报告0708人工智能算力及应用IDC研究发现,2021年中国仍以GPU为主实现数据中心计算加速,市场占有率近90%,GPU芯片多用于图形图像处理、复杂的数学计算等场景,可较好支持高度并行的工作负载,常用于数据中心的模型训练,也可以用于边缘侧和端侧的推理工作负
28、载。ASIC,FPGA,NPU等非GPU芯片市场占有率超过10%,其中,NPU较以往具有明显增长,NPU芯片设计逻辑更为简单,常用于边侧和端侧的模型推理,并生成结果,在处理推理工作负载时,具有显著的能耗节约优势。算力是实现AI产业化的核心力量,它的发展将对人工智能技术的进步和行业应用起到决定性的作用。随着人工智能向多场景化、规模化、融合化等高应用阶段方向发展,数据体量呈现出急剧增长态势,算法模型的参数量呈指数级增加,以加速计算为核心的算力中心规模将不断扩大。本报告将从算力基础架构层面,对人工智能芯片、服务器、计算架构、算法及应用等方面的发展近况逐一进行分析。0123456788未知1%2%12
29、%12%8%19%7%7%12%12%12%11%3%2%3%9%2%5%16%16%14%15%3%3%2%2%9%13%10%6%7%15%12%14%11%11%5%3%8%4%17%16%15%14%ASIC 当前 ASIC 未来18个月图5 全球人工智能服务器GPU、ASIC和FPGA芯片搭载率全球人工智能技术发展逐渐成熟,数字化基础设施不断建设完善,人工智能产业技术不断提升,产业商业化应用加速落地,推动全球人工智能芯片市场高速增长,IDC预计,到2025年人工智能芯片市场规模将达726亿美元。IDC全球范围调研显示,人工智能芯片搭载率(attach rate)将持续增高,目前每台人
30、工智能服务器上普遍多配置2个GPU,未来18个月,GPU、ASIC和FPGA的搭载率均会上升。2.1芯片:需求日益增长,发展空间广阔0123456788未知3%3%2%2%14%10%10%6%10%13%10%13%15%10%6%3%10%7%16%13%14%11%FPGA 当前 FPGA 未来18个月0123456788未知来源:IDC,2022 GPU 当前 GPU 未来18个月072022-2023 中国人工智能计算力发展评估报告09人工智能算力规模的快速增长将刺激更大的人工智能芯片需求。随着疫情、供应链及政治环境的影响,芯片领域的供需关系产生了很大变化,很多企业开始从“国际采购”
31、转向“本地采购”,这对国产芯片厂商来说迎来了较好的发展机会,但整体来说,目前中国大部分基础芯片主要依靠国外厂商的供应,国产芯片厂商在全球产业链中不具有明显优势。本报告认为,中国芯片产业主要面临两方面的挑战:技术与国际先进水平相比相对落后,产业生态建设同样不够完善。中国将持续优化芯片产业发展环境,不断促进设计、封装等环节发展,对流片制造环节实现攻坚,加大对高通用性、高性能、高效率芯片的研发力度,以更好地支持如图像渲染、机器学习等重要人工智能应用场景。此外,中国还需构建健全完整的产业链,打通行业应用、芯片研发、系统开发、高校研究之间的壁垒,形成跨企业、跨领域、跨行业的合作,推进芯片行业全维度发展。
32、在中国当前人工智能发展局势下,人工智能芯片产业发展体现出以下趋势:人工智能芯片发展驱动力增强,未来发展前景广阔:芯片产业不仅是信息产业的核心部分,同时也是国家信息安全的硬件保障,近年来中国高度重视芯片产业发展。随着政策支持以及资本推动等多重驱动,人工智能芯片不仅专利数量不断增加,产业链和应用场景持续完善扩充,人工智能芯片产业发展前景广阔。不同类型人工智能芯片发展进度参差不齐:在面向人工智能领域的芯片中,用于终端产品的应用层芯片发展较快,而用于云计算等领域的通用基础层芯片发展则较为滞后,有较大发展潜力。在近几年的热门领域如智慧城市建设、无人驾驶载具、智慧医疗系统构建、智能家居等应用中,ASIC、
33、GPU、FPGA、NPU四大类芯片,受到了绝大多数中国人工智能产业链企业的青睐。人工智能芯片低能耗为大势所趋:低功耗人工智能芯片是时代之需,这对实现数据中心的总功耗降低具有重要价值,此外,低功耗人工智能芯片也是实现边缘智能的重要环节,能满足更多复杂、极端的边缘侧应用场景需求。但研发出能够满足性能需求,兼顾制造可行性、成本可控性、性能可靠性等要求的低功耗芯片仍颇具挑战。产业分工成雏形,逐步完善生态建设:企业面对多元化的算力和海量的数据,期待技术创新可以为企业带来活力。但由于芯片架构繁杂,开发工具匮乏,系统软件、应用开发平台配套少,应用难以迁移,资源不能复用和共享等问题使得生态复杂离散。面对这样的
34、现状,芯片技术厂商(含设计、制造、应用等流程)应联合上下游厂商,建立技术生态系链条,加速人工智能场景的落地。GPU NPU ASIC FPGA图6 中国人工智能芯片市场规模占比人工智能服务器仍是人工智能市场增长的主力军。IDC数据显示,2021年全球人工智能服务器市场的同比增速超过全球整体人工智能市场的增速,是整体人工智能市场增长的推动力。IDC发布的全球人工智能市场半年度追踪报告显示,2021年全球人工智能服务器市场规模达156.3亿美元,约合人民币1,045亿元,这是全球年度人工智能服务器市场首次突破千亿元人民币,同比2020年增速达39.1%。其中,浪潮信息、戴尔、HPE分别以20.9%
35、、13.0%、9.2%的市占率位列前三,三家厂商总市场份额占比达43.1%。未来五年,人工智能服务器市场将继续高速增长,预计2026年全球人工智能服务器市场规模将达到347.1亿美元,五年复合增长率为17.3%。在中国,人工智能应用的加速落地很大程度推动了中国人工智能服务器的高增长。根据IDC数据,2021年中国人工智能服务器市场规模达到59.2亿美元,与2020年相比增长68.2%,其中,浪潮信息、新华三、宁畅、安擎、华为等诸多中国厂商正加速推动人工智能基础设施产品的优化更新,探索赋能技术升级,为人工智能技术的用户带来价值。IDC调研显示,超过80%的中国企业将在未来一年持续增加人工智能服务
36、器的投资规模,中国人工智能服务器市场将在未来五年保持稳定增长,预计到2026年,中国人工智能服务器市场规模将达到123.4亿美元。2.2服务器:中国市场领跑全球,绿色节能引领未来1.0%0.4%2022-2023 中国人工智能计算力发展评估报告109.6%89.0%来源:IDC,2022深度学习是典型的多迭代计算类工作负载,庞大的计算力是催生业务价值的必要条件。在通用算力技术演进节奏放缓的大背景下,针对特定问题或特定领域来定义计算架构成为市场的普遍诉求,基于DSA(Domain-Specific Architectures)思想设计的人工智能芯片,在特定人工智能工作负载上表现出远超通用芯片的处
37、理能力,大大推动了人工智能芯片的多元化发展,并为产业AI化的加速提供了重要的产业基础和更加丰富的选择。然而,多元算力从“能用”到“好用”并且为企业创造业务价值,还有比较长的路要走,尤其是以百花齐放的AI算力芯片为核心,打造出一个通用性强、绿色高效、安全可靠的计算系统,对于推动人工智能技术普及应用至关重要。一般来讲,从芯片到计算系统,需要完成体系结构、信号完整性、散热、可靠性等大量系统性设计工作,涉及到材料、热力学、电池技术、流体力学、化学等众多学科。由于人工智能基础架构往往是高密度集成的大算力系统,系统功耗、总线速率、电流密度等指标随业务需求持续攀升,给人工智能计算系统设计带来严峻挑战。业内从
38、多个层面推动多元算力系统架构创新,充分发挥出多元化算力的体系创新优势,让算力好用、易用。在系统层面,由于人工智能芯片发展呈现多元化趋势,各厂商采用不同技术路线,产业面临硬件体系孤岛和生态割裂问题。加速人工智能技术产业发展,系统级产品创新是关键在基础硬件、基础软件、核心应用、上层生态间建立起统一的技术路线及标准API接口,将加速器模块标准化,简化人工智能基础架构设计,缩短硬件开发和产业赋能周期。浪潮信息开放加速人工智能服务器NF5498,支持UBB v1.0 OAM基板,OAM兼容性高、扩展性好,支持多品牌异构加速芯片,已经在众多客户场景里面实现了落地,有效支撑国内外多元算力芯片发展。在异构协议
39、层面,为了提高CPU与多元算力芯片间的数据传输效率,业内在互联技术方面展开了新的探索,近年涌现了一系列新兴的互连协议标准,包括QPI/UPI、CXL、GenZ、CCIX等,其中浪潮信息研发了支持CXL高速总线的智能加速器F26A,与传统的PCIe、DMA方式相比,CPU与加速器之间的平均数据访问延迟降低80%,同时可扩展2倍的内存容量。从部署位置而言:产业侧对于低时延人工智能服务应用需求递增。相较于科研、重型产业能够通过大模型、高密度人工智能计算满足需求的场景,便捷、低时延的人工智能应用场景愈发普遍。越来越多的数据将在边缘位置进行收集、分析等操作,并可被移动到数据中心以进行进一步价值挖掘。越来
40、越多的企业将构建跨本地数据中心、云、边缘的全链路人工智能基础设施,形成一个包括数据收集、分析、汇总和存储等所有环节的人工智能战略。绿色节能化发展:人工智能服务器将朝着绿色节能的方向发展,实现低功耗、高效率的计算。“东数西算”工程在全国启动,通过建设国家算力枢纽,规划设立10个国家数据中心集群,朝着全国一体化大数据中心体系迈进了一步。此外,国家对节能减排也提出了更高的要求,在发布的贯彻落实碳达峰碳中和目标要求推动数据中心和5G等新型基础设施绿色高质量发展实施方案中提到,到2025年,国家枢纽节点的PUE要进一步降到1.25以下,对建设绿色、低碳的数据中心提出了新的要求。企业开始将重点转移到液冷技
41、术的探索和应用,液冷技术不但有更高的散热效率,还能节约大量电能,目前已经有大量成功案例。不论是从政策角度,还是市场需求角度,抑或技术成熟角度,液冷都将成为数据中心的发展方向。2.3计算架构:以系统创新为基础,支持多元算力发展从工作负载角度而言:IDC认为企业将更多地使用人工智能服务器处理推理工作负载。伴随企业人工智能应用成熟度逐步递增,企业将把精力更多从人工智能训练转移到人工智能推理工作负载上,这意味着人工智能模型将逐步进入广泛投产模式,这将对企业的人工智能基础设施规划带来影响,企业需要更好地制定运营支出规划,提升服务器利用率。据IDC数据,2021年中国数据中心用于推理的服务器的市场份额占比
42、已经过半,达到57.6%,预计到2026年,用于推理的工作负载将达到62.2%。图7 中国人工智能服务器工作负载预测,2020-2026 训练 推理0%10%20%30%40%50%60%70%80%90%100%202020212022202320242025202648.542.441.540.539.338.237.851.557.658.559.560.761.862.2来源:IDC,2022112022-2023 中国人工智能计算力发展评估报告2.4云服务:市场规模稳步提升,算力设施提供强力支撑云计算的出现为企业提供更丰富的算力支持。通过aaS(as a Service)服务提供AI
43、平台和AI服务,因其快速的产品迭代能力和丰富的场景化人工智能能力,越来越被用户接受。2021年全年,人工智能公有云服务市场规模达到44.1亿元人民币,占整体人工智能软件市场的13.4%。从年增长率来看,人工智能公有云服务市场的增长速度仍然远远超过人工智能软件整体市场的增长速度。而在未来2-3年内,IDC还观察到私有化部署仍将是整个人工智能市场的主流。IDC调研显示,排名前三的人工智能云服务是:搜索、人脸识别和推荐引擎,预计未来18个月,排名前三的人工智能云服务将为:自然语言处理、图像识别和视频识别。近几年,人脸与人体识别已经达到一定的市场规模,相比2020年,2021年人脸人体公有云服务市场规
44、模实现80.1%的增长,应用场景的扩展,市场产品形态不断丰富,以及疫情防控等因素是重要驱动力。在图像视频领域,视频结构化、多模态人工智能等技术的创新促进了该领域市场增长。公有云厂商一方面通过视觉开放平台输出图像视频领域的人工智能能力,另一方面则专注于开发基于场景的解决方案。在自然语言处理方面,2021年NLP市场较2020年实现了126.9%的增长,在技术方面,得益于大型模型的推广;在市场方面,与应用场景的发展(如机器翻译、文档处理、智能写作等)息息相关。同时,智能语音公有云服务市场已经实现了高增长,2021年市场规模较2020年增长52.3%,目前已进入应用场景深化阶段。智能客服、客服质量控
45、制、客服数据分析、智能营销等应用推动了对话式人工智能的市场增长,2021年较2020年增长109.6%。大模型是在智算算力驱动下最为典型的重大创新。得益于模型泛化能力强、长尾数据的低依赖性以及下游模型使用效率的提升,大模型被认为具备了“通用智能”的雏形,并成为业内探索实现普惠人工智能的重要途径之一。大模型的技术基础是 transformer 架构、迁移学习和自监督学习,transformer架构应用于NLP领域并取得了突破性进展,其在视觉任务上也同样证明了有效性。从算力的视角看,语言类、视觉类模型容量和相应的算力需求都在快速扩大,大模型发展的背后是庞大的算力支撑。如果用“算力当量”(PetaF
46、lops/s-day,PD),即每秒千万亿次的计算机完整运行一天消耗的算力总量,来对人工智能任务所需算力总量进行度量,AI+Science领域的AlphaFold2、自动驾驶系统、GPT-3等模型训练需要几百甚至几千PD的算力支持,如GPT-3训练需要3,640PD的算力。2022年,大模型正在成为AIGC领域发展的算法引擎。在大模型的能力加持下,包括以文生图以及虚拟数字人等AIGC类应用将快速进入到商业化阶段,并为元宇宙内容生产带来巨大的变革。大模型正在让人工智能技术从五年前的“能听会看”,走到今天的“能思考、会创作”,未来有望实现“会推理、能决策”的重大进步。大模型的发展同样给算力带来巨大
47、的挑战。大模型训练的计算和存储资源开销之大,对加速计算系统和人工智能软件栈都有很高的要求,训练千亿、万亿模型动辄需要上千块加速卡,对大模型的推广和普惠带来了很大的挑战。同时,受限于边际递减效应,模型复杂度与精度的进一步提升将会需要更大比例的计算资源开销,对计算效率问题的顾虑会限制大模型参数规模的持续扩张。尽管目前的大模型参数数量还没有达到人脑神经系统的突触规模,但市场对于大模型的认知趋于理性。业内逐渐认识到,大模型的发展更要注重绿色低碳、服务能力下沉以及商业模式的实践,为大模型在各行各业的规模落地铺平道路。在学术界,除了对预训练大模型进行性能优化,有大量研究集中在提升大模型的落地能力上,包括降
48、低模型在预训练、适配下游任务和推理过程中的算力开销,通过模型压缩、剪枝、蒸馏等方法加快模型部署效率。2.5算法模型:加速大模型行业落地,助力实体经济发展2022-2023 中国人工智能计算力发展评估报告12在跨节点层面,节点之间的网络通信所产生的RPC、协议处理、内存拷贝、压缩会占用30%左右的CPU资源,成为数据中心级的“通信税”。业内尝试通过智能网卡卸载计算密集型业务,将NVMe-oF、无损网络能力等功能转移到智能网卡上由专有硬件负责处理,能够提升通信性能并降低CPU占用率。通过智能数据处理单元和高速网络形成分布式互连交换,可实现CPU与各种加速芯片的算力协同以及内存池化、新型存储池化,节
49、点间的数据访问延迟可低至亚微秒级别。技术创新的价值是提升效率,产业AI化的目标就是通过人工智能技术的应用来提升垂直行业研发、生产、运营等环节的效率,并产生更大范围的经济价值和社会价值。不过,人工智能目前还是新兴技术,技术供应商在实施产业AI化时仍面临诸多挑战,包括市场对人工智能技术的理解程度、供应商技术和商业能力是否成熟、如何在精细化落地的基础上实现快捷高效的部署,都会影响人工智能技术在产业内的实际落地效果。通常来讲,推动某一类新兴技术应用走向成熟的基本路径和逻辑,是在产业发展初期,通过协同平台对多元市场主体的标准化是技术规模化应用的必要前提,但对于目前的人工智能技术及基础架构来说,定制化的工
50、作量依然很大,主要集中在包括多元人工智能芯片适配、人工智能算力资源管理和调度、数据整合及加速、深度学习开发环境部署等各个方面。以人工智能芯片为例,市场上存在各种类型人工智能芯片,互联标准各不相同,用户在使用这些人工智能芯片系统时会遇到系统适配、芯片驱动、互联互通、功耗管理、安全传输、易用性等各类问题,给用户在部署多元人工智能芯片算力系统时带来巨大挑战。这些非标准的工作无法快速复用,限制了人工智能算力的使用效率,不利于人工智能在各行各业的推广和应用。围绕人工智能算力产品市场呈现出的这些突出问题,AI算力和算法的基建化和标准化,是新时期人工智能产业发展和企业战略布局重点。近年来,包括公有云厂商和服