本篇文章2208字,读完约6分钟
视觉一直是人类最重要的感知系统。如今,在人工智能时代,这种能力也被“移植”,试图让计算机“理解”一切。
“让机器看”的第一步是模仿人类。这种起源于20世纪50年代的统计模式识别的计算机视觉主要是基于二维技术的研究,但其结果远不如人类视觉。在人工智能的第三阶段,深度学习算法的突破直接推动了神经网络算法的发展。有趣的是,人类大脑皮层中有一半的神经元与视觉相关,这类似于神经网络算法中的“神经元”。一旦人类“视觉”系统被借鉴,神经网络算法直接成为计算机视觉的技术引擎,视觉智能的应用场景也逐渐丰富。
高德:利用视觉惯性导航技术实现高精度地图的大规模制作
随着导航、驾驶辅助、自动驾驶等技术的不断发展,对地图的精度要求越来越高。传统的道路平面图对于智能交通系统来说有很多缺点。为了满足自动驾驶应用的需要,高德提出了一种利用视觉惯性导航技术制作高精度地图的方法。
高精度地图的制作主要是从两类要素进行的,一类是路标,如道路导向标志和交通信号灯;一是地面标志,如车道分界线、导向箭头等。首先计算两类地图要素的位置,然后通过将要素与道路网相关联来获得要素的属性信息和几何信息。
地图元素的生成将手动操作与自动提取相结合。首先,利用现场采集的数据求解图像和轨迹,获得自动化所需的视觉惯性导航信息。地图元素根据视觉惯性导航融合技术生成。在自动地图的基础上,采用人工网络编辑模式来提高地图要素的准确性,并最终存储在相应的数据库中。
目前,高德已经完成了中国32万多公里高等级公路的高精度地图数据,并采用了激光雷达采集和图像视觉惯性导航融合两种方法。一方面,通过将图像视觉与惯性导航相结合来收集数据,可以大大降低成本。另一方面,基于图像视觉的高精度地图在识别方面具有一定的优势,可以提高车道线级要素运算的效率。
图像光谱技术:利用智能图像技术实现图像内容的自动生成
零点二号研究中心发布的报告指出,在计算机视觉技术中,图像识别主要是基于静态图像的识别、分析和应用,未来技术和应用的重点将转向动态图像技术,即智能视频采集、识别和处理,最终实现智能图像制作。目前,智能影像已经与娱乐、教育、媒体等行业深度融合,形成了一套实用有效的登陆方案,体现出较强的商业化能力。目前,娱乐领域是智能图像商业化的主导产业,尤其是图像频谱技术领域。
基于新的ai+视频技术组合——“mape,用于机器自动化生产的视频内容引擎”,Image Technology推出了针对特定行业定制的多个ai应用组件,涵盖智能图像生产技术、平台和行业应用的全堆栈布局。生产引擎结合人工智能和交互式视频技术,提出了包括景深测量和反演技术、亚像素反轨道技术、视频叠加技术、优化计算技术等技术在内的完整技术框架。它有三个人工智能组件,即完全视觉识别(MCV)、自动构建视频和自动生成视频内容,这有助于媒体和娱乐公司应用非结构化数据,并对他们创建、获取和交付给观众的内容做出更明智的决策。
这是一种新的服务组合,有效地补充了行业中现有的视频内容开发和应用功能。Mape使用结构化和非结构化视频数据,并使用ai内核来帮助客户理解他们的视频数据,分析和收集视频数据中的洞察力,并从视频中获得洞察力、结构、情感和视觉分析。根据内容中的图片和语义识别,将视频分为逻辑场景,通过对内容和上下文的深入理解来识别场景,并自动生成可用的内容和上下文,从而实现视频的自动生成。
百度:视觉技术已经完全升级,软硬结合赋予了许多领域力量
机器视觉仍在升级中,它可以模仿人眼,用3D视觉精确定位周围环境。我们经常在侦探作品中看到读心术,但实际上它是在阅读微观表达。百度云的“情感识别专家”可以通过镜头捕捉人们的微观表情,如果不小心,你可能比自己更了解自己的情感。目前,百度云已经将3D视觉应用到人脸识别中,活体识别的正确率提高到99.55%。三维视觉技术可广泛应用于机器人、无人驾驶、智能工厂、虚拟/增强现实等领域。
这主要通过两个层面来实现:硬件层面,百度云拥有适合3D视觉的立体视觉人工智能传感器,并采用3D人工智能视觉模块,大大降低了成本。在软件层面,已经开发了许多算法,从实时计算到大规模云分布式计算。基于百度的3D视觉技术,机器可以像人一样看透世界,从而更好地展示自己在ar、新零售、工程机械等领域的才华。
目前,百度的计算机视觉技术也已经全面开放,包括人脸识别、字符识别(ocr)、图像审查、图像识别和图像搜索,拥有58项基本功能,已经服务了数十万开发者。最近,百度也为自己的视觉技术(人脸识别)发布了一个新品牌“杜牧”,并发布了四款硬件产品:人脸应用套件、人工智能镜头模块、视频分析盒和人脸捕捉机。“独木”代表了百度大脑一套集成的可视化软硬件产品,主要定位于高灵活性、高易用性和高性价比,并应用于人脸识别门禁控制、门禁控制、司机身份验证和行为分析、视频流下人员黑白名单识别、购物中心零售客户群分析等多种应用场景。
在人脸识别和图像分类等许多任务中,计算机视觉要优于人类视觉。但是在其他需要推理的任务中,计算机视觉还有很长的路要走。业内专家说:“人类可以很容易地理解物体之间的关系,当我们看到一幅图片时,我们可以编一个故事。”但是计算机远没有达到这种理解和想象的水平。“随着计算机视觉技术的不断发展,它将带来更多的新发现。计算机视觉和人工智能都处于各自发展的初级阶段,还有很多事情值得探索。
来源:搜狐微门户
标题:视觉智能落地难?中国科技企业已在路上且速度比想象快得多
地址:http://www.shwmhw.com/shxw/9120.html