本篇文章1818字,读完约5分钟
[CCIDI新闻]2017年5月9日,cadence Electronics在北京召开媒体交流会议,详细介绍了最近发布的神经网络dsp cadence tensilica vision c5 dsp的技术指标和产品优势。与现有的神经网络加速器相比,cadence的vision c5 dsp可以大大减少芯片面积、提高能效和降低功耗。
据了解,这是业界第一个独立完整的神经网络dsp。它主要针对视觉设备、雷达/光学雷达、融合传感器等应用进行优化。,这对神经网络的计算能力有很高的要求。对于车载、监视和安全、无人驾驶飞行器和移动/可穿戴设备,vision c5 dsp 1tmac/s的计算能力可以胜任所有神经网络计算任务。
随着神经网络应用的深入和复杂,对计算的要求日益提高。与此同时,神经网络的体系结构也在不断升级,新的网络、新的应用和新的市场也层出不穷。在上述趋势下,业界迫切需要一种为嵌入式系统量身定制的高性能、通用的神经网络解决方案,该解决方案不仅要具有极低的功耗,还要具有高度的可编程性,以适应未来的变化和降低风险。
基于摄像机的视觉系统在汽车、无人机和安防领域最为常见。该体系结构需要两种基本的可视化优化计算模式。首先,使用传统的视觉算法来增强相机拍摄的照片或图像。其次,利用基于神经网络的认知算法对目标进行检测和识别。现有的神经网络加速器解决方案都依赖于与图像dsp相连的硬件加速器。神经网络代码分为两部分。网络层的一部分运行在dsp上,卷积层运行在硬件加速器上。这种结构不仅效率低,而且消耗大量能量。
Vision c5 dsp是一款专门针对神经网络优化的dsp,可以加速整个神经网络层(卷积层、全连接层、汇集层和归一化层)的计算,而不仅仅是卷积层。因此,主视觉/图像dsp的功能被释放,图像增强应用程序独立运行,而视觉5 dsp负责执行神经网络任务。通过消除神经网络dsp和主视觉/图像dsp之间的冗余数据传输,视觉c5 dsp的功耗远低于现有的神经网络加速器。同时,vision c5 dsp还为神经网络提供了一个单核编程模型。
我们的许多客户都在努力选择理想的神经网络平台。毕竟,一个产品的开发可能需要几年时间,cadence Company的tensilica部门的高级市场总监steve roddy说。嵌入式系统的神经网络处理器不仅需要低功耗和快速的图像处理速度,还需要灵活性和前瞻性。目前的平台并不理想,客户迫切需要一个全新的解决方案。通用神经网络数字信号处理器应运而生。它易于集成,使用灵活,具有比有线电视新闻网加速器、图形处理器和中央处理器更好的功耗和能效。
嵌入式视觉联盟的创始人杰夫比尔说,现实世界中有大量深度学习应用,对计算要求很高。visual C5 DSP作为一种特殊的神经网络编程处理器,可以帮助我们将深度学习技术应用到低成本、低功耗的设备中。
vision c5dsp的参数和性能
凭借独立的引擎,vision c5 dsp拥有领先的神经网络性能:
小于1mm2的芯片面积可以实现1tmac//s的计算能力(吞吐量是vision p6 dsp的4倍)。为深度学习内核10248位mac或51216位mac提供极高的计算吞吐量,确保8位和16位精度的出色性能。128位simd或64位16位SIMD的vliwsimd架构专为多核设计而设计。以极低的资源成本获得nxtmac的处理能力。内置idma和axi4总线接口使用与visionp5和p6dsp一致的经过验证的软件工具包。基于业内知名的alexnet cnnbenchmark,vision c5 dsp的计算速度是业内gpu的6倍。cnn基准测试,性能提升9倍。
Vision c5dsp是一款灵活、前瞻性、经得起未来考验的解决方案,支持各种内核尺寸、深度和输入规格。Vision c5 dsp采用多因素压缩/解压缩技术,支持未来新增的计算层。相反,美国有线电视新闻网硬件加速器由于其有限的重新编程能力,可扩展性较差。
visual C5 DSP配有cadence神经网络映射工具链,可将caffe和tensorflow映射为visual C5 DSP上高度优化的可执行代码,充分发挥人工优化神经网络库的丰富功能。
Cadence正与许多早期客户合作。要了解有关vision c5 dsp的更多信息,请联系您的cadence销售代表。
来源:搜狐微门户
标题:Cadence瞄准汽车、监控、无人机和移动市场
地址:http://www.shwmhw.com/shxw/61325.html