搜索
您的当前位置:首页正文

计算机视觉领域黑科技一览

来源:爱够旅游网
HeaderTable_User10128119921360521840HeaderTable_Industry13021300看好investRatingChange.same173833703计算机行业人工智能“黑科技”系列报告一:计算机视觉领域前沿一览报告起因继前期针对人工智能主线发布的系列深度报告及月报(见首页相关报告)之后,行业评级国家/地区行业看好中性看淡(维持)中国/A股计算机我们推出新的“黑科技系列”,主要针对人工智能领域不同细分方向的技术突破报告发布日期2016年11月23日与应用进展、顶级比赛表现以及重大影响事件。核心观点计算机视觉技术方法与应用发展迅速。计算机视觉研究如何让计算机可以像人类一样去理解图片、视频等多媒体资源内容。例如用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等,并进一步处理成更适合人眼观察或进行仪器检测的图像。近些年在海量的图像数据集、机器学习(深度学习)方法以及性能日益提升的计算机支持下,计算机视觉领域的技术与应用均得到迅速发展,行业表现13%0%-13%-25%-38%计算机沪深300国内外众多知名机构在计算机视觉不同方向均有涉及,国内更是涌现出一批相关的明星创业团队。除了耳熟能详的Google、微软、Facebook等工业界11/5121/5110/6120/6130/6140/6150/6160/6170/6180/6190/6101/61科技巨头有所涉及之外,一些著名高校也设有专门的实验室,如斯坦福、麻资料来源:WIND省理工以及伯克利等。国内则涌现出一批以依图、商汤、旷视、云从以及格灵深瞳等为首的创业公司,技术团队核心成员大多拥有前述工业界及学术界知名机构的研究经验。两大挑战赛与三大顶级会议引关注,揭示计算机视觉研究热点与技术进展。两大挑战赛分别基于ImageNet和MSCOCO数据集。ImageNet数据集主要由斯坦福大学李飞飞教授团队牵头创建,比赛重在评测算法识别图像中显著物体的能力,MSCOCO数据集主要由微软赞助,大赛更倾向于评测复杂场景中识别各类物体的能力。三大顶级会议分别为ICCV、CVPR、ECCV,近些年来接受的论文开始更多涉及到计算机视觉在工业界的创新应用,逐渐成为领域内前沿理论和技术的聚集地。投资建议证券分析师张颖建议关注计算机视觉在自动驾驶、机器人、AR/VR、金融、安防以及医疗等021-63325888*6085领域的应用进展。风险提示zhangying1@orientsec.com.cn执业证书编号:S0860514090001计算机视觉技术在实验室的表现结果不等于实际应用场景的效果,在不同领联系人邵进明域的应用也存在差异,进度可能不达预期。021-63325888*3209shaojinming@orientsec.com.cn相关报告人工智能月报2016年10月期人工智能月报2016年9月期人工智能月报2016年8月期2016-11-022016-10-092016-09-04人工智能商业化应用的“五要素模型”及2016-08-12各类参与主体竞争优势分析从深蓝到AlphaGo:人工智能的二十年起2016-07-14伏东方证券股份有限公司经相关主管机关核准具备证券投资咨询业务资格,据此开展发布证券研究报告业务。东方证券股份有限公司及其关联机构在法律许可的范围内正在或将要与本研究报告所分析的企业发展业务关系。因此,投资者应当考虑到本公司可能存在对报告的客观性产生影响的利益冲突,不应视本证券研究报告为作出投资决策的唯一因素。有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。深度报告【行业·证券研究报告】HeaderTable_TypeTitle计算机深度报告——人工智能“黑科技”系列报告一:计算机视觉领域前沿一览目录一、计算机视觉的发展现状与应用从传统图片处理方法跨入人工智能处理时代海量训练数据集解决计算机视觉瓶颈深度学习方法提升计算机视觉准确度计算机视觉在众多领域得到应用二、知名研究机构和创业团队国外研究机构和学术达人国内知名创业团队三、两大挑战赛ImageNetMSCOCO四、三大顶级会议三大会议的介绍会议亮点回顾风险提示有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。2HeaderTable_TypeTitle计算机深度报告——人工智能“黑科技”系列报告一:计算机视觉领域前沿一览图表目录图1:计算机视觉与其他学科的相互关系图2:ImageNet竞赛图3:目标检测图4:目标定位图5:视频中的目标物体检测图6:场景分类图7:场景分割图8:目标检测和分割图9:关键点检测图10:图片描述图11:给机器“看电视剧”预测人类行为图12:基于深度学习的手势识别图13:微软全息“穿越”技术:HoloPortation图14:人工智能为视频配音图15:深度学习识别YouTube视频内容图16:社会化行走机器人Jackrabbot懂礼貌会排队表1:2012年以来ImageNet图像分类大赛冠军成绩表2:计算机视觉技术在众多领域得到应用表3:国外著名高校计算机视觉相关实验室表4:ImageNet2016中国团队包揽众多冠军有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。3HeaderTable_TypeTitle计算机深度报告——人工智能“黑科技”系列报告一:计算机视觉领域前沿一览一、计算机视觉的发展现状与应用1从传统图片处理方法跨入人工智能处理时代计算机视觉(ComputerVision)研究如何让计算机可以像人类一样去理解图片、视频等多媒体资源内容。例如用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等,并进一步处理成更适合人眼观察或进行仪器检测的图像。近些年在海量的图像数据集、机器学习(深度学习)方法以及性能日益提升的计算机支持下,计算机视觉领域的技术与应用均得到迅速发展,图1:计算机视觉与其他学科的相互关系数据来源:雷锋网、东方证券研究所①、传统的图片处理依据数字图像的基本特性进行处理,例如常见美图软件中的祛斑效果就属于图像处理中的图像增强部分。伴随着图像处理技术的不断提升,对于图像的简单处理已经不能满足人们的使用需求,模式识别便成为新的发展方向。②、模式识别方法着眼于图像间的不同,使得计算机可以像人类一样很方便地分辨出两幅图片的差异。例如指纹识别就是模式识别中的一个经典应用。可以说模式识别已经踏入了人工智能的领域。③、人工智能方法利用的是最新的卷积神经网络技术,自动生成足以区分不同图片的强大特征。迈入人工智能领域,可以说计算机视觉已经可以像人类一样去看,去理解。尽管神经网络不断刷新着计算机视觉的表现成果,但对于人类来说依然是一个黑匣子,究竟是什么造就了神经网络的强大能力,尚需学术界、工业界进一步的探索与研究。1海量训练数据集解决计算机视觉瓶颈计算机视觉的传统挑战是图片分类,即让计算机拥有可以识别图像中物体的能力。对于图片分类问题,计算机就像一个学生,需要人类为它提供图片和图片对应的标签来告诉计算机图片上究竟有什么。计算机虽然有强大的计算能力,但是却缺乏人类一样的智慧,需要给予大量有标注的图片。对于已有的数据集,目前传统的算法已经足够优秀。MNIST手写数字数据集的错误率已经达到0%。计算机视觉的进一步发展需要新的图片数据集,但数据标注需要耗费大量人力物力,一般实验室很难完成如此艰巨的工作。直到现任斯坦福人工智能实验室和斯坦福视觉实验室主任李飞飞教授(近期公开宣布加入Google并担任GoogleCloudMachineLearning负责人)带领团队,于2007年发起、2009年创建完成的图像识别数据集ImageNet解决了这个问题。该数据集不仅图片种类达有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。4HeaderTable_TypeTitle计算机深度报告——人工智能“黑科技”系列报告一:计算机视觉领域前沿一览到惊人的1000种,同时每一类都含有超过1000张图片。新的海量数据集的出现挑战了计算机视觉的传统技术,推动了计算机视觉领域技术的发展,也让卷积神经网络一展所长。1深度学习方法提升计算机视觉准确度目前计算机视觉领域最为流行也最为有效的技术是卷积神经网络。它是一种常见的深度学习架构,相比传统神经网络,卷积神经网络体积更小,能力更强。得益于现在强大的GPU并行运算能力,卷积神经网络已经由最开始的8层的AlexNet,到16层的VGGNet,再到152层ResNet,甚至更高,在ImageNet比赛中所取得的成绩也越来越优秀,自从2012年Hinton团队首次在该赛事中使用深度学习以来,Top5分类错误率已经从26%降低到不足3%。表1:2012年以来ImageNet图像分类大赛冠军成绩时间2012机构多伦多大学纽约大学Google微软亚洲研究院公安部三所数据来源:互联网,arXiv.org,东方证券研究所结构层数Top5错误率872215216%11%6%3%2%1计算机视觉在众多领域得到应用计算机视觉作为人工智能的研究方向之一,主要目的在于使得计算机能识别、分辨甚至理解不同的图像、视频及复杂场景。在自动驾驶、机器人、AR/VR、金融、安防以及医疗领域均得到应用。表2:计算机视觉技术在众多领域得到应用应用领域应用简述自动驾驶(无人车、无人机)计算机视觉技术在自动驾驶中解决的问题主要是障碍物检测和道路检测,尤其是在驾驶过程中的实时动态检测,对计算机判断的速度和准确性要求都很高。机器人训练机器人“能听会说能看”的能力显然离不开计算机视觉,除了需要SLAM即时定位与地图构建技术,在对象识别上主要依赖图像及场景的分类与分割等基本技术。在物体跟踪、动作识别、三维环境建模等方面都需要用到计算机视觉技术。例如“虚拟试衣应AR/VR用”主要利用计算机视觉技术对人体和服装进行建模,然后做在线试衣、穿搭,未来的游戏甚金融安防医疗至可能将现实世界扫描,建模,完成对象识别,最后生成游戏地图。基于人脸识别、指纹识别以及指静脉、虹膜等生物识别技术对目标任务进行身份鉴定,从而在开户、支付等环节提供更为安全、便利、高效的服务。车牌、车辆识别在公安、交管领域应用较早也相对成熟,人脸识别目前应用还相对有限,更多在门禁系统、ATM监控等简单任务,未来在刑事案件侦查、特定人员追踪、嫌疑人报警灯领域将发挥更大的作用。计算机视觉在医疗领域的应用主要表现为对医学影像的识别,从而辅助医生对患者进行诊疗。数据来源:东方证券研究所有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。5

因篇幅问题不能全部显示,请点此查看更多更全内容

Top