本篇文章2525字,读完约6分钟
新华社北京5月9日电2017年5月9日,人工智能计算技术的全球领导者英伟达在硅谷隆重召开了第八届gpu技术大会(gtc 2017)。上塘科技作为唯一一家再次受邀参加gtc的中国ai公司,参与了此次展会,展示了智能视频、移动视频、互联网娱乐应用等领域的众多前沿ai产品、技术和解决方案。其中,首次演示的sensepose单目摄像机运动估计解决方案引起了全世界参与者的广泛关注。
对于人工智能、虚拟现实和无人驾驶汽车领域的开发者、数据科学家和企业高管来说,gtc是今年最大的盛事。作为会议的组织者和推动者,nvidia每年都会在会议上表彰突破性的人工智能初创企业。在去年4月的gtc 2016大会上,上塘科技凭借其对gpu技术的深入理解以及在计算机视觉和深度学习方面的顶尖研发能力获得了“ecs奖”。这也是唯一一家获得该奖项的中国企业。在过去的两年里,上塘科技在计算机视觉领域的各种权威测试中赢得了许多冠军,如ilsvrc、activitynet、mot challenge、cityscapes challenge和kitti。
上塘科技首席执行官徐莉博士说:“现代人工智能的爆发源于对核心技术深入学习的突破。自2011年以来,上塘科技团队成员专注于深度学习,并率先将其应用于计算机视觉领域,在学术界和工业界取得了许多令人瞩目的成就。凭借我们独创的深度学习框架、自建的深度学习超级计算平台,以及与英伟达的深度合作,我们将能够迅速将人工智能的潜力释放到更多的场景中,并利用算法的可再现性实现快速人工智能。大规模应用将推动产业升级。”
会上,汤徐莉博士和严胜根博士分别就深度视频理解和工业深度学习技术进行了演讲。尚汤展示的Sensepose、senseface、sensevideo、sensephoto、sensear等解决方案充分说明了其行业领先的深度学习原创技术的优势,并结合gpu技术,利用学习能力更强、速度更快、功耗更低的神经网络架构,实现了更多深度视频理解和图像处理的可能性。
●感知姿态:使用单目摄像机进行人体运动估计
作为上汤科技的第一个产品,sensepose具有开拓意义。它不同于传统的双目摄像机、红外摄像机和关节传感器等运动捕捉解决方案,通过单目摄像机实现运动估计,大大降低了运动捕捉设备的制造成本。Sensepose能够充分利用gpu的性能,能够准确定位人体关节10个像素内的关键点,从而在视频中实时准确地识别人体姿态,定位手、肩、脚、腰等10多个关键点,具有良好的鲁棒性。
传感技术将成为未来人机交互、虚拟穿着、虚拟试衣等应用的决定性技术。运动估计和人脸预测技术的结合可以用来描述视频中人物的关系或状态,从而实现对视频内容的理解和分析,为影视行业创造更多的商业价值。
此外,尚唐科技还展示了一个运行在nvidia titan x gpu上的高质量双目深度估计系统,该系统可以实时读取双目视频并计算深度。该系统采用上塘科技最新开发的神经网络架构,在权威的自动驾驶算法评估数据集kitti 2015立体基准上取得了优异的性能。
●senseface:视频监控中的大规模人脸识别
Senseface人脸控制系统非常适用于机场、火车站等公共场所的大规模视频监控系统中的实时人脸识别。该系统可以在监控视频中提供实时人脸捕捉、报警控制、属性识别、统计分析、关键人员跟踪恢复等功能,并做出及时有效的智能预警。通过上唐技术的1000多层神经网络,传感人脸在光照、角度、表情、遮挡和年龄变化的情况下仍能保持较高的识别准确率。多亏了nvidia cudnn和tensorrt库,senseface可以分别在一个tesla m40 gpu和一个jetson tx1上支持12通道和2通道全高清视频的实时处理。目前,senseface已经帮助抓获了数百名罪犯。
●传感视频:视频监控中的对象识别和分析
Sensevideo视频结构化系统是上唐科技深度学习模型的实际应用成果,该模型在2016年国际权威计算机视觉竞赛ilsvrc中获得了场景分析第一名。该系统具有行人检测、车辆检测、车辆分类等多种技术,能够实现监控视频中根据时间和地点对人、非机动车和机动车进行检测、跟踪、抓拍、检索、数据统计和分析,为道路状况动态分析、交通密集区域识别和街道安全时间分析提供有力的辅助。多亏了nvidia cudnn和tensorrt库,sensevideo可以在单个jetson tx1平台上实时处理双通道高清视频。
● sensephoto:手机图像处理的综合解决方案
Sensephoto已被中国十大国产手机品牌中的大多数使用。借助基于gpu的深度学习引擎,sensephoto可以提供暗光增强、去雾、智能滤镜、艺术绘画和各种人像照片解决方案,包括人脸变形、美容、背景模糊等功能,即使在暗光、背光和大角度的情况下,效果也不成问题。Sensephoto还可以提供一个智能相册解决方案,它可以将云中和离线的人脸或场景进行聚类,轻松解决手机中数十万张照片的管理和分类问题。
●sensar:实时视频中的ar特效生成解决方案
Sensear结合了世界领先的技术,如人脸检测和跟踪,以及106个人脸关键点定位。sensear基于手机摄像头,可以跟踪定位人脸、手势和背景,并利用增强现实技术绘制内容,可用于娱乐、教育等诸多领域。目前,sensear技术已经被应用到很多应用中,包括faceu,snow,xiaokaxiu,panda live broadcast等。用户可以体验许多有趣的功能,例如有趣的面部贴纸、面部变化、甚至动作增强、背景替换等。
作为中国拥有最多科学家的初创企业,上汤科技拥有大量业内认可的学术成果。自主开发的深度学习框架和自主构建的深度学习超级计算平台deeplink已成为上汤科技的巨大技术优势。同时,通过与nvidia、mellanox、曙光等平台厂商的合作,以及与金融、安全、手机、互联网等领域300多家签约合作客户的合作,上唐科技成功构建了一个内有sensetime的ai商业生态系统,并成长为ai独角兽,成为目前中国融资金额最大的ai企业。
来源:搜狐微门户
标题:商汤科技再登GPU技术大会 首秀动作识别黑科技
地址:http://www.shwmhw.com/shxw/61316.html