1、鸟瞰人工智能应用市场安防行业研究分析2017丨报告亿欧智库 reserved to Yiou intelligence,September 20172 人工智能技术作为一个降本增效工具去赋能传统行业,其中安防行业在政策和技术的双轮驱动下成为人工智能的首要着陆场。为什么人工智能优先在安防行业落地?安防对人工智能的需求是如何驱动整个产业链条的?而“安防行业”和“人工智能技术”的内涵外延如何设定?以及在人工智能新技术的驱动下,传统安防行业如何做应对?借助新技术起来的人工智能算法初创企业有机会成长为多大的企业?这些疑问的量化解答对于参与变局的企业都有意义,对于技术买单者政府也有参考价值,甚至对于第三方
2、的投资者、媒体等都能给予有参考意义的信息;此次研究亿欧智库采取了“桌面研究”+“企业/专家访谈”两种方式,试图通过“是什么”、“为什么”、“怎么办”的叙述顺序去力求清楚阐述“人工智能技术”和“安防行业”碰撞的过去、现在和未来的发展脉络。人工智能=Artificial Intelligence=AI,报告后续将对其作统一简写,即AI;序言总目录 行业篇:应用场景、产品、产业链变化AI+视频监控的四种应用场景解析AI+视频监控产品盘点AI驱动下视频监控产业链的变化 趋势篇:行业未来趋势判断安防行业趋势判断AI+安防行业趋势判断 附录:企业案例 综述篇:范围界定、需求、发展条件AI+安防的概念范围界
3、定需求的驱动AI+安防的发展条件 技术篇:技术如何驱动行业变革智能安防并非新逻辑,从“智能”到“人工智能”三大基本要素驱动人工智能发展559152121232828344043434754PS:由于视频监控系统是安防的重要组成部分,所以AI+安防会落实到AI赋能下的视频监控系统如何更好应对社会治安事件(安防的对象),报告内文会作更详细解释;4 综述篇:范围界定、需求、发展条件AI+安防的概念范围界定需求的驱动AI+安防的发展条件 技术篇:技术如何驱动行业变革 行业篇:应用场景、产品、产业链变化 趋势篇:行业未来趋势判断 附录:企业案例5591521284354目录Yiou intelligen
4、cePart1.综述篇AI+安防的概念范围界定AI+安防的概念范围界定总览图5 亿欧智库此次研究讨论的“安防”更多是指针对社会安全事件下的恐怖袭击事件和经济安全事件的安全防范,即针对社会治安的安全防范,属于相对狭义的安防范围定义范畴;利用计算机视觉技术结构化后的视频监控数据将能更好帮助政府公安部门应对社会安全事件的事前、事中、事后三个阶段,此为总起概述,具体后面会作详细阐述;亿欧智库此次研究谈论的“AI”更多是指计算机视觉识别技术,它将视频监控数据结构化成以人、车、物为主体的属性信息;安防事故灾难事件社会安全事件恐怖袭击事件经济安全事件事前预警防控事中常态监督事后规范执法公共安全企业安全民用安
5、全涉外突发事件自然灾害事件公共卫生事件计算机视觉识别技术车人物车牌识别特征属性识别人脸识别行为识别Yiou intelligencePart1.综述篇AI+安防的概念范围界定社会安全事件更多指经济安全事件,治安复杂地区还包括恐怖袭击事件6 安防:即安全防范,其保护对象可分为公共共安全、企业安全、民用安全;公共安全:突发事件应对法按照事件的性质、过程和机理的不同,将公共安全可能面临的突发事件分为四类,即自然灾害、事故灾难、公共卫生事件和社会安全事件;社会安全事件:根据国家突发公共事件总体应急预案规定:社会安全事件主要包括恐怖袭击事件、经济安全事件和涉外突发事件等。而在中国大部分地区,其社会安全事
6、件更多是指经济安全事件,新疆地区除了经济安全事件还需考虑恐怖袭击事件;事件按照进程可以分为事前、事中和事后,而技术防范手段的主要作用是事前的预警防控、事中的常态监督和事后的规范执法。安防事故灾难事件社会安全事件恐怖袭击事件经济安全事件事前预警防控事中常态监督事后规范执法公共安全企业安全民用安全涉外突发事件自然灾害事件公共卫生事件Yiou intelligencePart1.综述篇AI+安防的概念范围界定计算机视觉识别技术将海量视频监控数据结构化成以人、车、物为主体的属性信息7计算机视觉识别技术+4种识别应用技术;计算机视觉识别技术相对车牌识别、特征属性识别、人脸识别、行为识别等技术,前者是底层
7、技术,后者是识别具体对象的应用技术;目前这4种识别技术应用程度较为成熟、应用范围较广,其中人脸识别属于生物识别技术的一支;4种识别应用技术主要是对海量的视频监控数据进行结构化,提取以人、车、物为主体的属性信息。属性:指代对象的性质或特性,它因对象而异,或随时间而变化;计算机视觉识别技术车人物车牌识别特征属性识别人脸识别行为识别Yiou intelligencePart1.综述篇AI+安防的概念范围界定计算机视觉识别的4种应用技术8亿欧智库:计算机视觉识别技术的4种识别应用技术识别模型设备场景数据库核验效果车牌识别车辆牌照是机动车唯一的管理标示符号。车牌识别是图像处理与字符识别的综合应用,它由图
8、像采集、预处理、牌照区域的定位和提取、牌照字符的分割和识别等几个部分组成;电警、卡口;公共场所、交通、停车场、门禁等;车牌的字符、车牌颜色等;车牌识别受到环境光照条件、拍摄位置和车辆行驶速度等因素的影响,有的情况下对识别的实时性要求也高;特征属性识别通过数据调取接口可实时抓拍图片及卡口视频等资源后做实时或者离线二次识别,识别目标的形状、属性以及身份等;电警、卡口;公共场所、交通、停车场、门禁等;人物特征属性库(性别、大致年龄、行李属性、衣服颜色、运动方向、速度、目标大小、骑车、背包、拎东西等);车辆特征属性库(车牌识别、车标识别、车型识别、人脸探测、安全带、行驶方向、年检标等);电警、卡口的摄
9、像头采用了较高分辨率,如果拍摄的角度合适,正面状态几率增加的话会提高了识别的成功率;人脸识别通过人脸检测将图像分割成人脸区域和非人脸区域,再采取某种表示方法检测出人脸和数据库中的已知人脸,后将已检测到的待识别的人脸特征和数据库中的已知人脸特征进行比较匹配得出相关信息;摄像头;人证合一、限制环境的人脸识别(eg.银行开户)等;人脸特征库、实时摄取的人脸特征信息等;一般来说,人脸识别的有效宽度在3米左右;采集到的人脸图像信息的分辨率最好是达到100100个像素以上,能有效提高识别率;行为识别先检测时空显著兴趣点,接着在兴趣点的局部区域内提取特征描述符,然后对提取出来的特征点进行聚类形成字典,之后把
10、这些特征进行最近邻量化并进行直方图向量汇总,最后利用分类器对这些直方图特征向量进行分类训练和测试;摄像头;越界报警、踩踏事件、姿态识别等;/9 综述篇:范围界定、需求、发展条件AI+安防的概念范围界定需求的驱动AI+安防的发展条件 技术篇:技术如何驱动行业变革 行业篇:应用场景、产品、产业链变化 趋势篇:行业未来趋势判断 附录:企业案例5591521284354目录Yiou intelligencePart1.综述篇需求的驱动底层需求:社会处于经济转型阶段,治安问题逐步显现10社会经济转型阶段人口流动就业分布城市和农村格局变化资源市场化配置社会关系复杂人口密度较高区域矛盾冲突表面化社会管理难度
11、加大社会治安问题显现 现今社会治安问题逐步显现的根本原因是因为社会经济进入转型阶段,原本稳定的社会关系变得复杂。资源的市场化配置造成人口流动和就业分布以及城市、农村格局等一系列变化,导致社会管理的难度加大和各种矛盾冲突的表面化,客观上为犯罪活动提供了更多的机遇。69079711827311174916771166565664222629616186660346500005500060000650007000075000800002011年2012年2013年2014年2015年亿欧智库:2011-2015年中国城镇化趋势明显城镇人口(万人)乡村人口(万人)亿欧智库:中国人口流动趋势亿欧智库:以
12、北京为例,犯罪高发区即人口密度较高区北京西城中关村展览路国贸永外大街来源:国家统计局Yiou intelligencePart1.综述篇需求的驱动实施技术:公安部门采取视频监控系统来应对社会治安问题11 面对城市这样一个庞大的复杂系统,如果想要做到信息的实时发布、监控、分析和智能化管理,以确保整个系统的决策、命令能够稳妥迅速地传达执行并反馈,高度集成的可视化终端必不可少。装载在城市各个角落的视频监控系统是城市管理系统的重要组成部分;智能安防属于智慧城市的一个应用功能,智慧城市即将先进的信息技术、数据通讯传输技术、电子传感技术、控制技术及计算机技术等有效地集成运用于整个城市管理系统而建立的一种在
13、大范围内、全方位发挥作用的、实时、准确、高效的城市综合管理系统;在国家发展改革委、中央网信办、国家标准委联合下发的国家新型智慧城市评价指标(2016年版)中,公共安全视频资源采集和覆盖情况、公共安全视频监控资源联网和共享程度、公共安全视频图像提升社会管理能力情况成为智慧城市发展重要指标,有望进一步推动视频监控的发展。Yiou intelligencePart1.综述篇需求的驱动现状痛点:海量视频监控数据与人力分析瓶颈之间的矛盾12 安防系统有效运转面临的挑战:海量视频监控数据与人力分析瓶颈之间的矛盾;海量视频数据:根据博思数据,截至2016年中国前端摄像头出货量已达到4338万台,而同时出于换
14、机市场和增量市场的双轮驱动,国内监控摄像头的销售市场在逐步扩张,预计在2020年出货量会达到5422万台;仅就视频监控录像每天的数据量就达上千PB,累积的历史数据将更为庞大,并且海量视频监控数据中99%以上都是非结构化数据;人力瓶颈:随着监控点位的骤增,遍布大街小巷的监控摄像头每时每刻产生的视频数据也在爆炸式增长,过去简单利用人海战术进行检索和分析已经很难满足新时代的安防工作需求;一方面对视频监控人员人体产生危害,另一方面,相关研究表明人在盯着视频画面仅仅22min之后,人眼将对视频画面里95%以上的活动信息视而不见。亿欧智库:视频监控数据具有高并发、大容量特点高并发:以1080P为例,在4M
15、bps的码率下,中等城市的监控规模一般为数千到数万个摄像头,按5000路计算,并发写入码流为5000路*4Mbps*24小时*60分钟*60秒大容量:根据公安部要求录像数据在系统中保存30天以上。中等城市的存储容量为:5000路*4Mbps*24小时*60分钟*60秒*30天来源:博思数据3125433845714828511154220100020003000400050006000201520162017e2018e2019e2020e亿欧智库:中国前端摄像头出货量测算(万台)Yiou intelligencePart1.综述篇需求的驱动技术升级:视频监控系统正在迈向智能化时代1320世纪
16、80年代2006年20世纪初传统模拟监控数字化监控高清化/网络化监控2017年智能化监控大安防时代来临,安防监控系统向集成化、智能化模式发展,现代安防系统逐渐向智能化综合管理平台演变;视频监控系统从诞生之日起发展至今,大体上经历了三个阶段:第一阶段,20世纪80年代开始,视频监控的实现主要采取模拟方式,录制的视频主要在同轴电缆中进行信号传输,之后在控制主机的监控下实现模拟信号的显示;第二阶段,20世纪初开始,视频监控实现了远距离视频联网,但仍没有完全实现数字化,视频通过模拟的方式并通过同轴电缆来进行信号的传递,在多媒体控制主机以及硬盘刻录主机中进行数据处理和储存;第三阶段,2006年左右开始,
17、随着数字技术与网络技术的发展,安防监控领域的视频技术也进入了高清化与网络化阶段,体现为前端高清化、传输网络化、处理数字化、系统集成化;当前,随着人工智能三大要素逐步发展成熟,视频监控即将迎来智能化监控时代。人工智能三大基本要素即数据资源、计算力、核心算法,报告的技术篇会进行详细阐述;Yiou intelligencePart1.综述篇需求的驱动期望:AI技术能更好地应对海量视频监控数据,AI在安防领域作人力的增效补充14 安防系统由人防、物防和技防三者组成,其最大应用是保障社会治安。AI作为一项新兴的技术,其赋能下的安防系统将较高程度地发挥社会治安效用;对于社会治安的责任主体公安部和各省市级公
18、安机关来说:1.整体来看,出于对成本和所衍生的社会问题考虑,加强技术手段是提升社会治安水平的必由之路,是需要长久坚持的道路;2.由于重大事故的不可挽回性,安防工作者对于事前防范的需求要远远高于事后追查。因此不断扩大的安防行业规模、以及安防业务的特殊性决定了AI在安防行业的潜在需求巨大;AI时代的计算力能更好应对海量视频监控数据:从计算力来看,GPU的出现,在处理海量数据方面相对传统CPU呈现出了压倒性的胜利。使用GPU和使用传统双核CPU在运算速度上的差距最大会达到70倍,前者相比起后者能将程序运行时间从几周降低到了一天;AI在安防领域作人力的增效补充:海康威视数据显示,从传统的视频回看人工查
19、证,转向以车牌搜索、特征搜索为核心的智能搜索应用,以及以浓缩播放、视频摘要为核心的智能查看应用,破案时线索排查效率提升20-100倍。安防系统物防人防技防亿欧智库:安防系统的组成亿欧智库:AI时代计算力的提升CPU(过去)GPU(AI时代)运算速度x70 x运算时间几周一天视频结构化视频非结构化破案效率提高亿欧智库:视频结构化帮助公安部门提高破案效率线索排查效率 X 20100倍15 综述篇:范围界定、需求、发展条件AI+安防的概念范围界定需求的驱动AI+安防的发展条件 技术篇:技术如何驱动行业变革 行业篇:应用场景、产品、产业链变化 趋势篇:行业未来趋势判断 附录:企业案例559152128
20、4354目录Yiou intelligencePart1.综述篇AI+安防的发展条件基于PEST分析AI+安防的发展条件16 在需求驱动下,城市从政策(Pplitical)、经济(Economical)、社会(Social)、技术(Technological)四个方面为人工智能落地安防提供支持,即为其人工智能技术赋能传统安防塑造发展条件。智能安防发展条件Political-政策Social-社会经济-Economical技术-Technological2015-2017年智能安防被纳入国家发展战略之中;地方财政加大在社会治安上的投资力度;中国安防整体行业收入增加;计算机视觉识别初创企业数量增加
21、,融资笔数增加;机器的识别错误率已低于人类;处于社会治安的需求,公安部门降低对新技术的期待值;Yiou intelligencePart1.综述篇AI+安防的发展条件政策(Political):2015-2017年智能安防被纳入国家发展战略之中17 在国家政策支持下,“感知互联、数据驱动、云端共享、智慧应用”将成为未来公安及安防行业的重要发展趋势,物联网、大数据、视频结构化、生物识别以及人工智能等技术,产品将愈发深入地融入到行业整体解决方案中,并不断扩展延伸,逐步成为智慧城市建设运行的重要技术支撑以及社会综合治理平台的重要组成部分。亿欧智库:2015-2017年我国政府机关发布的智能安防相关政
22、策内容盘点时间发布机关政策文件名称主要内容2015年4月中共中央、国务院关于加强社会治安防控体系建设的意见提出“加强社会治安防控网建设、提高社会治安防控体系建设科技水平、完善社会治安防控运行机制”等目标,推动安防视频监控行业发展;2015年5月发改委等9个部门关于加强公共安全视频监控建设联网应用工作的若干意见提出2020年实现公共安全视频监控的全域覆盖和全网共享;2016年6月工信部等部门“互联网”人工智能三年行动实施方案主要任务中提及将智能安防作为人工智能产品创新的重点应用推广领域:即提出实施智能安防推广工程,鼓励安防企业与互联网企业开展合作,研发集团图像与视频精准识别、生物特征识别、编码识
23、别等多种技术的智能安防产品,推动安防产品的智能化、集约化、网络化;2016年10月中国安全防范产品行业协会中国安防行业“十三五”(2016-2020)发展规划明确提出要“积极探索安防及相关融合领域的前沿基础技术,并取得若干突破,包括核心器件技术、人工智能、计算机视觉、超大规模存储技术等。”此外,还要积极促进多鉴、联网(复核)报警技术,快速安检技术,用于门、箱、出入口控制等领域的生物识别技术,以及行为智能识别技术的研发及应用;2016年12月国务院“十三五”国家战略性新兴产业发展规划提出重点推进智能家居、智能汽车、智慧农业、智能安防、智慧健康、智能机器人、智能可穿戴设备等研发和产业化发展;201
24、7年5月科技部“十三五”公共安全科技创新专项规划要求突破公共安全情景构建与推演、重大综合灾害耦合实验、国家安全平台等关键技术:突破超大规模网上网下统一身份管理、人员身份特征精细刻画与精准识别、高通量人车物综合特征感知与风险防控,全面提升我国重大基础设施的安全保障能力;Yiou intelligence21.3%11.2%12.7%13.4%8.3%8.0%9.4%14.3%7.3%2.4%10.8%7.3%01002003004005006002011年2012年2013年2014年2015年亿欧智库:2011-2015年地方财政公共安全支出(亿元)及其增速Part1.综述篇AI+安防的发展条
25、件经济(Economical):地方财政加大在社会治安上的资金投入力度18 安防领域的投入源于政府对社会稳定、提升自身社会管理智能的要求,历来是各级、各地区政府的重点;在国家政策驱动下,地方财政公共安全支出金额逐年增加,公共安全占比一般公共预算支出比例也在增加。新疆维吾尔族自治区北京市上海市1,128.0 2,464.0 2,373.0 2,425.5 43.381.8157.6146.13.8%3.3%6.6%6.0%05001000150020002500300035004000450050002014201520162017亿欧智库:深圳市2014-2017年公共安全占比一般公共预算支出
26、情况(亿元)一般公共预算支出公共安全占比来源:国家统计局来源:深圳市本级2014年-2017年政府预算(草案)Yiou intelligencePart1.综述篇AI+安防的发展条件社会(Social):安防行业整体收入增加,计算机视觉识别初创企业增多,融资笔数也在增加19 从行业角度来看,中国安防行业收入在2012-2016年逐年增加,并预测在未来2020年会达到8000亿元,但中国安防行业市场已经成熟,即收入增速明显整体趋缓;安防领域存在着从传统方法难以解决的痛点,安防领域引起计算机视觉创业公司的关注。国内的计算机视觉识别公司大多都是在最近5年成立,并在2014、2015年达到高峰。此间成
27、立公司数量较多,同时开始受到资本集中关注。商汤科技、旷视科技、格灵深瞳等均受资本青睐。32403883430048605400595865737251800019.8%10.7%13.0%11.1%10.3%10.3%10.3%10.3%02000400060008000100001200020122013201420152016 2017e 2018e 2019e 2020e亿欧智库:中国安防行业收入和增速状况及预测中国安防行业市场规模(亿元)增长率(%)来源:中安协051015202012年前2012年2013年2014年2015年2016年亿欧智库:计算机视觉识别初创企业成立数量变化和融
28、资笔数变化成立公司数量融资笔数来源:Ofweek安防网Yiou intelligencePart1.综述篇AI+安防的发展条件技术(Technological):出于社会治安的需求,公安部降低对新技术的期待值20 在人脸方面,深度学习可以实现人脸检测、人脸关键点定位、身份证比对、聚类以及人脸属性、活体检测等,以人脸识别为例,2015年ImageNet ILSVRC大赛团队识别分类的错误率已经降到3.5%,低于人眼5.1%的识别错误率;民众对于新技术的期待值是上下大幅度波动的,而企业对新技术抱有的期待值波动幅度明显小很多,企业对新技术的期待值曲线和新技术的实际价值曲线是相近的、甚至是重合的;在社
29、会治安上,公安部和各省市级机关对安防技术的期待值等同于下图中的企业对新技术的期待值曲线。28.0%26.0%16.0%12.0%7.0%3.6%3.0%0.0%10.0%20.0%30.0%40.0%2010201120122013201420152016亿欧智库:ImageNet2010-2016年图像识别错误率快速降低来源:ILSVRC低于人眼5.1%的识别错误率亿欧智库:随时间变化,不同角色对新技术期待值的变化期待值时间民众使用的期待值企业商用的期待值新技术的实际价值eg.2015年图像识别错误率已超过人眼;eg.2016年AlphaGo战胜李世石;21 综述篇:范围界定、需求、发展条件
30、 技术篇:技术如何驱动行业变革智能安防并非新逻辑,从“智能”到“人工智能”三大基本要素驱动人工智能发展 行业篇:应用场景、产品、产业链变化 趋势篇:行业未来趋势判断 附录:企业案例5202123284354目录Yiou intelligencePart2.技术篇智能安防并非新逻辑,从“智能”到“人工智能”智能安防并非新逻辑,从“智能”到“人工智能”22 智能安防并非新逻辑,实际上海康、大华等行业龙头从2006年就开始布局智能安防产品,从这个时候开始安防行业就向着智能化发展,但一直不能有令人满意的突破;从“智能”到“人工智能”,解决了过去安防得不到普及的问题,使之“识别准确率提高”、“设备环境适
31、应性提升”、“识别种类增多”;从“智能”到“人工智能”,是“数据资源”、“核心算法”、“计算力”三大基本要素起主导作用,后续会进行详细解析。识别准确率提高:Google在ImageNet图片识别准确率快速提升京LPR268车牌识别:牌照号码、牌照底色;人体特征属性识别:衣着颜色、运动方向、速度、目标大小、骑车、背包、拎东西等;车辆特征属性识别:车牌识别、车标识别、车型识别、车身颜色、人脸探测、安全带、年检标、行驶方向;人脸识别:在人脸检测的基础上,进一步确定脸部特征点(眼睛、眉毛、鼻子、嘴巴、脸部外轮廓)的位置;识别种类增多:从车牌识别到人、车特征点识别设备环境适应性提升:例如从室内到室外,光
32、照等复杂干扰因素行为识别:穿越警戒面,进入区域,离开区域,区域入侵,徘徊,物品拿取,物品遗留,停车,快速移动,人员聚集等;23 综述篇:范围界定、需求、发展条件 技术篇:技术如何驱动行业变革智能安防并非新逻辑,从“智能”到“人工智能”三大基本要素驱动人工智能发展 行业篇:应用场景、产品、产业链变化 趋势篇:行业未来趋势判断 附录:企业案例5212123284354目录Yiou intelligence2.2部3.4部2015年2020年Part2.技术篇三大基本要素驱动人工智能发展24数据资源:连接的设备量在增加,数据量在增加 连接的设备量在增加,数据量在增加:思科全球云指数GCI预测,到了2
33、020年存储数据总量将从2015年的1.4ZB增加至6.2ZB;思科可视化网络指数VNI预测,到了2020年,连接到IP网络的设备数量将接近全球人口数量的3倍,人均网络设备数量将由2015年的2.2部增加到3.4部,人均IP流量也从2015年的10GB增长至25GB;海量视频数据:根据博思数据,截至2016年中国摄像头出货量已达到4338万台,而出于“换机市场”和“增量市场”的双轮驱动,国内监控摄像头的销售市场在逐步扩张,预计在2020年出货量会达到5422万台;仅就视频监控录像每天的数据量就达上千PB,累积的数据量将更为庞大。312543384571482851115422050001000
34、0201520162017201820192020亿欧智库:中国前端摄像头出货量测算(台)1.4ZB6.2ZB2015年2020年存储数据总量人均网络设备数10GB25GB2015年2020年来源:国家统计局来源:思科可视化网络指数VNI来源:思科全球云指数GCI 来源:思科可视化网络指数VNI人均IP流量Yiou intelligencePart2.技术篇三大基本要素驱动人工智能发展核心算法:深度学习拥有强大的数据表达能力251)含多个隐层的人工神经网络具有十分强大的特征学习能力,通过训练模型所提取的特征对原始输入数据具有更抽象和更本质的表述,从而有利于解决特征可视化或分类问题;2)通过使用
35、无监督学习算法实现一种称作“逐层初始化”的方法,实现对输入数据信息进行分级表达,从而可以有效地降低深度神经网络的训练难度。“”卷积神经网络结构卷积神经网络作用下的物体检测系统的概览 什么是深度学习?主要通过多层神经网络来模仿人脑的多层抽象机制来实现对数据的抽象表达,将特征学习和分类器整合到一个框架中。一个典型的基于深度学习的目标检测方法包括从输入图像上提取区域块,用卷积神经网络计算每个区域块的特征,最后用线性SVM分类器对每个区域块进行分类等步骤;深度学习是机器学习的一个分支,它具有天然强大的数据表达能力。2006年加拿大多伦多大学教授、机器学习领域的泰斗Geoffery Hinton及其学生
36、在学术刊物Science上发表了一篇文章,第一次提出了深度学习的思想,以及提出两个观点Yiou intelligencePart2.技术篇三大基本要素驱动人工智能发展核心算法:深度学习VS传统机器学习方法26 传统机器学习方法特点:早期的图像识别系统的特征提取方法,所提取的特征本质上是一种手工设计的特征,针对不同的识别问题,提取到的特征好坏对系统性能有着直接的影响,因此需要研究人员对所要解决的问题领域进行深入的研究,以设计出适应性更好的特征,从而提高系统的性能;这个时期的图像识别系统一般都是针对某个特定的识别任务,且数据的规模不大,泛化能力较差,难以在实际应用问题当中实现精准的识别效果;相比之
37、下深度学习可以:适应足够多的环境和场景。深度学习在训练模型参数的阶段使用了海量数据,相比传统机器学习方法,包含了足够多的场景,并且直接建立从数据到信息的映射,对约束条件的依赖较少,即深度学习的产品可以应用到更广泛的环境当中;识别种类更丰富。理论上只要有足够多的样本进行训练,深度学习能够实现比较精准的目标分类识别,自主特征识别的特点又让深度学习特别适用于抽象、复杂的关于人的特征、行为的分析领域。Yiou intelligencePart2.技术篇三大基本要素驱动人工智能发展计算力的成熟使得深度学习强大的数据表达能力得以体现27基础信息架构19世纪50年代神经网络概念兴起;20世纪80-90年代神
38、经网络算法突破;深度学习拉开商用序幕:2010年斯坦福软件语言学教授吴恩达(AndrewNg)会见了Google当时的CEO,决定开发Google Brain(深度学习+GPU);同年ImageNet图像识别错误率降至0.28;深度学习商用爆发:2012年Google只有2个深度学习项目,2016年前后达到1000多个;同年ImageNet图像识别错误率降至0.16;1999年英伟达推出GPU,因为GPU较之CPU拥有大量的逻辑单元,所以相对而言更擅长海量数据处理,为此被运用到深度学习领域;2006年英伟达推出CUDA编程工具包,CUDA框架使得GPU可以通过更加方便高效的接口和开发者进行交互
39、,开发者就可以充分利用GPU的运算资源;计算力的成熟2015年ImageNet图像识别错误率降至0.036,低于人眼识别错误率0.051;架构的不同决定了GPU比CPU更擅长海量数据的运算 左图是CPU和GPU内部结构上的对比,总体上来说二者都是由控制器(Control),寄存器(Cache、DRAM)和逻辑单元(ALU:Arithmetic Logic Unit)构成。但是三者的比例却有很大的不同。在CPU中控制器和寄存器占据了结构中很大的一部分,与之相反,在GPU中,逻辑单元的规模则是远远超过其他二者之和;这种不同的构架就决定了CPU在指令的处理/执行,函数的调用上有着很好的发挥,但由于逻
40、辑单元所占比重小,相对于GPU而言,在数据的处理方面(算数运算或者逻辑运算)的能力就弱了很多。计算机视觉识别深度学习28 综述篇:范围界定、需求、发展条件 技术篇:技术如何驱动行业变革 行业篇:应用场景、产品、产业链变化 AI+视频监控的四种应用场景解析AI+视频监控产品盘点AI驱动下视频监控产业链的变化 趋势篇:行业未来趋势判断 附录:企业案例521282834404354目录Yiou intelligencePart3.行业篇AI+视频监控的四种应用场景解析AI+视频监控的四种应用场景解析29“线”布防以道路监控为主要部署场景,结合车辆识别和人脸识别;“面”布防以热点区域、重点场所为主要部
41、署场景,应用人群与行为特征分析技术,按需部署人脸识别产品;“后台”分析以视频结构化后的属性数据结合其他数据进行数据挖掘分析。从应用的场景来看,AI+视频监控的部署分为4种类型:“点”布防以卡口、出入口的身份认证为主,应用于车站、机场、酒店等关键节点;Yiou intelligencePart3.行业篇AI+视频监控的四种应用场景解析“点”布防,以卡口、出入口的身份认证为主,应用于车站、机场、酒店等关键节点30 场景描述:车站、机场、酒店等关键节点的身份认证,此类场景特点为相对封闭的室内空间、人流量多;应用描述:单点布防场景的核心技术为静态人脸识别技术,系统通常将“人脸图像+身份证+公安局端数据
42、”三者进行比对,并完成身份验证;技术描述:1.人脸识别技术既可以实现“主动识别”又可以实现“被动识别”场景;2.目前众多安防企业已经完成技术迭代,实现高于99%的识别率,可以实现金融安防级别的应用。“主动识别”功能场景,即识别对象必须“主动配合”识别过程,例如主动伸出手指、双眼或者做出特定行为;而人脸识别则是一种既可以实现“主动识别”又可以应用于“被动识别”场景的生物识别方案,因此具有更广阔的应用空间与市场。公司案例:商汤科技的身份证一体机、格灵深瞳的威目人脸识别系统等;亿欧智库:人脸识别技术和其他生物识别技术相比人脸识别其他生物识别(指纹识别/虹膜识别/手势识别等)场景被动识别场景主动识别场
43、景主动识别场景(需要识别对象的配合,例如伸出手指、双眼或者做出特定行为)应用空间和市场较为广阔有所限制Yiou intelligencePart3.行业篇AI+视频监控的四种应用场景解析“线”布防,以道路监控为主要部署场景,结合车辆识别和人脸识别31 场景描述:以道路监控为主,结合车辆识别和人脸识别技术的ITS系统(Intelligent Traffic System,智能交通系统),是人工智能实现把各个点连成“线”的重要应用场景,此类场景特点为开放、车流量较多;应用描述:通过安装在道路旁边或者中间隔离带的支架上的摄像机和图像采集设备将实时的视频信息采入,经过对视频图像的实时处理分析得到各种交
44、通信息,如车辆的流量、速度、交通密度、车型分类、车辆排队长度、转弯信息等。车辆识别目前已经能够胜任识别车牌、车辆颜色、车辆品牌、车辆类型、车辆型号,以及驾驶员是否使用安全带及接听手机等行为;技术描述:基于车辆识别的识别类算法可以大幅降低道路信息监控系统的技术门槛,提高道路执法效率;公司案例:格灵深瞳旗下的威目车辆大数据系统,便是基于深度学习的新一代车辆识别引擎,其产品形式包括在线云服务、离线SDK、软硬一体。全智能识别自动判断白天黑夜,同时识别双向车头车尾;杂场景多目标检测分类区分机动车/二轮车/三轮车/行人;轮廓不完整车辆检测识别可识别部分被遮挡车辆;车牌/车型/车款/车身颜色识别可识别16
45、种细分车型、3000多种车款、12种颜色;标志物检测可检测年检标、遮阳板、纸巾盒、挂件、摆件、安全带等;Yiou intelligencePart3.行业篇AI+视频监控的四种应用场景解析“面”布防,以热点区域、重点场所为主要部署场景,应用人群与行为特征分析技术,按需部署人脸识别产品32 场景描述:此类场景为特定时间、特定活动下的人流量聚集,诸如2014年跨年夜上海外滩踩踏事件。重点区域与重点社会活动的布防对于公安部门而言有着重要意义,同时也已经成为公安部门安防布控的重点和难点,因为它大量得消耗警力资源;应用描述:通过对视频的迅速分析,信息分析平台可以监测出可视范围内的人群数量,并且捕捉每个个
46、体的行为动作,形成重点场所及区域的面状布防;技术描述:1.图像识别技术不仅可以实现静态识别,也可以完成动态识别和轨迹识别;2.人群与行为识别是图像识别的一个延伸,通过更为优化的AI算法与模型实时分析可视范围内的人物、车辆及其行为;公司案例:旷视科技的智能安防解决方案便适用于“面”布防场景,诸如重点区域智能监控可自动判别在危险分子进入前后,是否出现异常态势(例如人员异常聚集等)并及时预警;再比如可视化人员的滞留分析、人群行为分析和群体轨迹分析,能够为公安机关实现快速、精准、移动化指挥提供依据。人数统计分析统计视野范围内人群的数量,跟踪个体行为轨迹,防止人群密度超负荷;个体跟踪结合人脸识别技术,跟
47、踪特定人员的运动轨迹与行为举止,实现提前预警;禁区管控使用人工智能技术可以采集到更多的交通流量参数,实现动态数据分析;对禁区范围实现实时监控,对违规行为实时报警;异常行为分析实现了更多执法功能,例如套牌车分析、交通违章监控;对人物行为进行分类,并及时预警异常动作行为;Yiou intelligencePart3.行业篇AI+视频监控的四种应用场景解析后台分析,结合数据进行智能案情分析、统筹资源调配33场景描述:公安机关坐拥庞大的文字卷宗档案及数据库,警方需要对卷宗进行查阅和分析时,往往需要动用大量警力,进行人工文档筛查;应用描述:例如,有经验的警官通常对特定案件,如盗窃案件,有着独特的理解。根
48、据实战的经验,警官可以对案件的要素,如作案时间、作案手段、受害对象等,进行分类。根据这些分类,警方往往可以进行串并案操作,丰富犯罪嫌疑人的行为特征,实现快速破案;技术描述:利用自然语言理解技术对电子卷宗进行智能检索;公司案例:商汤科技旗下的视图情报研判系统,便是基于深度学习以图搜图、模糊人脸搜索技术,助力公安干警快速确认相关人员身份的产品,适用于刑侦破案场景。作案时间作案手段受害对象案件A案件B串并案情报属性数据作案时间作案手段受害对象基于人脸识别进行案件管理和串并案分析;人机结合,提供自定义标签及关键字检索功能,缩小研判范围,提升检索效率及准确度;能在亿级大库中检索出低质量(例如:模糊、残缺
49、、噪点、暗光、大角度等)人脸图像;迅速获得检索结果,每小时可达千万级入库速度;34 综述篇:范围界定、需求、发展条件 技术篇:技术如何驱动行业变革 行业篇:应用场景、产品、产业链变化AI+视频监控的四种应用场景解析 AI+视频监控产品盘点AI驱动下视频监控产业链的变化 趋势篇:行业未来趋势判断 附录:企业案例521282834404354目录Yiou intelligencePart3.行业篇AI+视频监控产品盘点35前端智能设备初步结构化视频数据亿欧智库:前端智能设备产品盘点名称功能参数应用场景海康深眸系列网络摄像机支持深度学习算法,提升Smart功能(侦测、道路监控、智能后检索、跟踪功能)
50、,并支持去误报和目标分类;支持最大1920108060fps高清画面输出;采用高效红外阵列,低功耗,照射距离达200m;可应用于需要大范围高清画质监控的场所,如:河流、森林、公路、铁路、机场、港口、岗哨、广场、公园、景区、街道、车站、大型场馆、小区外围等场所;大华智能交通高清摄像机嵌入式一体化结构设计,内置安全带识别、车标识别、车型识别、车系识别、遮阳板识别等多种智能算法;融合Smart-PCT技术(基于精确光控制的图像处理技术),图像效果更优;支持违章图片合成功能;卡口电警一体机,适用于公安、交通行业;格灵深瞳皓目行为分析仪基于深度信息进行目标检测、利用深度相机还原三维场景、俯视视角下人员动