1、想到的比看到的多想到的比看到的多 把话题起得博大一点,人类文明的发展一直与能源变革密切相关。从百年前电力的大规模应用完成了第二次工业革命,到以 2G、3G、4G 为代表的通信技术驱动了第三次工业革命,人与人之间的联结已经变得非常紧密。现在我们一直说,以 5G、AI、云等为代表的创新 ICT 技术正在驱动第四次工业革命,5G 高速率、低延迟、大容量的特性实现了万物互联,AI 高算力、低功耗、全场景的特性实现了万物智能,云虚拟化、超大规模和高扩张性的特性实现了万物共享。5G、AI、云使能所有行业,构建了数字世界基础,而 AI 在5G 时代的算力化考量,就变得很有迫切感了。AI 是又一次工业革命 1
2、7 世纪后期,英国采矿业特别是煤矿已发展到相当的规模,单靠人力、畜力已难以满足排除矿井地下水的要求,而现场又有丰富而廉价的煤作为燃料。现实的需要促使人们致力于“以火力提水”的探索。1769 年英国人詹姆斯瓦特制造了蒸汽机,引起了 18 世纪的第一次工业革命。100 年后,美国人发明和实现了电力的广泛使用,引领了 19 世纪的第二次工业革命。1946 年,世界第一台二进制计算机的发明,人类在 20 世纪进入了第三次工业革命,信息技术的发展尤其是移动互联网的普及极大地改变了人类的生活。进入 21 世纪,人类正在迎来以智能技术为代 表的第四次工业革命,人工智能、物联网、5G 以及生物工程等新技术融入
3、到人类社会方方面面;驱动全球宏观趋势的变化,如社会可持续发展,经济增长的新动能,智慧城市、产业数字化转型、消费体验等。人工智能是一系列新的通用目的技术(GPT),包括自然语言处理、图片识别、视频分析等。人工智能是信息化进程的新高度,信息技术带来了效率的提升,人工智能则带来生产成本的变化。行业+A,I 人工智能将会改变每个行业、每个职业、每个组织、每个家庭和每个人。可以说,时代又仿佛回到了对采矿行业非生物动力需求极大的 17 世纪,进入21 世纪,人工智能也对算力提出了强劲的增长需求。AI 算力需求的急剧增长与传统 CPU 算力缓慢提升(每年 10%)之间存在巨大矛盾,全球掀起造芯运动,加速算力
4、成本降低和 AI 应用普及。AI 的根本难题在哪里 我们知道,人工智能的支撑要素包括算力(工业云计算和边缘计算)、数据(工业大数据)和算法(工业人工智能),在中国,基于人口规模和经济的发展程度,在数据和行业应用都在全球处于领先地位。但是 AI 算力资源却很稀缺而且昂贵,各行业应用需要越来越强劲的 AI 算力。但是我们也看到,算力价格贵、使用难和资源难获取是目前 AI 发展的三大瓶颈。比如,现在人工智能整个训练的过程,譬如训练人脸识别、交通综合治理、自动驾驶,模型的训练成本非常高昂的;又比如,缺乏一个统一的开发框架,无法适配从训练到推理,从公有云到私有云、边缘、终端的多种应用场景,开发、调优、部
5、署的工作量巨大;再比如,业界用于 AI 计算的 GPU 供货周期长,限量供应等,导致硬件资源不易获取。业界开发大规模 AI 训练芯片的主要厂家,比如英伟达、谷歌和华为都推出了自己的 AI 训练芯片。英伟达 Tesla V100 GPU 最高提供 125 Tera FLOPS 深度学习性能,最大功耗为 300 W。Google I/O 2018 开发者大会上,Google 推出了第三代 TPU 3.0,最高提供 90 TeraFLOPS 深度学习性能。华为早在去年10 月的全联接大会上发布了针对 AI 训练场景的昇腾 910AI 处理器。昇腾 910AI处理器,是当前计算密度最大的单芯片,适用于
6、 AI 训练,可提供256 TeraFLOPS 的算力,最大功耗为 310W。很显然,AI 训练的耗时与模型的复杂度、数据集和硬件资源的配置是强相关,在天文研究、自动驾驶训练、气象预测、石油勘探等大规模训练时,硬件资源尤其显得重要。人工智能的快速发展,得益于硬件和云计算技术的提升,更得益于各个行业数字化带来的大量的数据来训练模型。开发平台要求从原始数据到标注数据、训练数据、算法、模型、推理服务,实现千万级模型、数据集以及服务对象的全生命周期的管理。同时,无智能不成云,全栈发展走向纵深,AI 已经成为云的基础业务,实现云端训练和推理。在云上部署,支持在线和批量的推理,满足大规模并发的复杂场景需求
7、。云、AI、IoT 协调使能蓝海市场,在智慧家庭、物联网和车联网等场景,构建云+AI+IoT 的綜合解决方案,开拓新的人工智能市场。如上,这其中最值得一书的就是华为昇腾系列 AI 处理器。昇腾采用了面向张量计算的达芬奇 3D Cube 架构,该架构面向 AI 的全新突破性设计,为昇腾 AI 处理器提供了超强的 AI 算力,使得芯片具有高算力、高能效、可扩展的优点。基于统一的达芬奇架构,华为可以支持 Ascend-Nano、Ascend-Tiny、Ascend-Lite、Ascend-Min、i Ascend-Max 等芯片规格,具备从几十毫瓦 IP 到几百瓦芯片的平滑扩展,天然覆盖了端、边、云
8、的全场景部署的能力。正如华为轮值董事长徐直军所述,达芬奇架构可大可小,从 Nano 一直到 Max、从穿戴设备一直到云,可以全场景覆盖;我们推出 MindSpore 的目的就是协同达芬奇架构来面向全场景的。也就是说,在端、边缘、云都可以训练和推理,还可以进行相互协同,这是现在其他的计算框架所做不到的。后续 可以预见,5G 与 AI、云计算等技术融合,有助于打造智能机器人云端大脑,突破单个机器人自我学习的局限,赋予终端设备更加强大的智能,极大拓展智能机器人的应用场景,加速智能机器人规模化发展。目前,我们的运营商把 5G 智能工业产品通过 5G 厂内专网切片实现实时通信就是 AI 在 5G 时代算力化考量的一个明显表现。管中窥豹,想到的比看到的多,这就是现实。