本篇文章3701字,读完约9分钟

"我们相信零售业将成为我们的第15个行业,收入超过1000万英镑."汤汤集团总经理尚海龙说。

在过去的三年里,以汤为代表的计算机视觉公司以算法和更高的准确率打破了海康、大华等传统巨头的壁垒,进入了相对封闭的安全领域。

随着证券市场的变红,它与线下零售的升级不谋而合。2017年下半年,视觉技术领域的大大小小的玩家都把赌注押在了零售业上,而安全领域的人工智能明星们都在猜测,它是否会成为下一个高地。长期以来在利基领域努力工作的潜在股票也期待着登上舞台的机会。

“在展示了技术授权效应之后,我相信整个零售业已经真正进入了从商品或服务中获利,并转向从数据中获利。每个人都能意识到数据的价值。这种意识的转变是伟大的。”

然而,零售场景的分散性和可变性给新技术带来了巨大挑战,并使市场更加不确定。人工智能视觉能否被传统的土地所接受是一个复杂得多的实践。

看清面孔是一项基本技能

顾客站在大门前的摄像机前。几秒钟后,机器采集的人脸出现在连接到摄像头的屏幕上,这意味着身份识别完成。购物后,再次刷牙可以支付离开商店的费用。在苏宁体育用品店,这张脸也是用户的购物id,相机和背后的机器认真记录:男,25岁,长时间站在耐克鞋前,买了一顶帽子。

苏宁biu的视觉解决方案是由汤提供的。对于简历明星来说,面部识别是一项家务技能。2014年,汤汤创始人唐晓鸥的联合实验室用20万张人脸数据达到了98.52%的准确率,超过了人眼,成为业内热门。此后,汤以其技术优势,以雄厚的资金和刚性的需求进入证券市场。

汤汤、易图、迪法恩斯和“影像四小龙”从云都有相似的发展道路,去年都完成了数亿元的融资。三、四年前,国家安全设备产生的海量数据急需处理和分析,比如如何在火车站的人海中找到在逃的犯罪嫌疑人,但控制政府项目的传统巨头无法消化,人工智能视觉“趁机进入”。

2017年,尤其是下半年,随着新零售理念和智能零售的落地,视觉明星也相继进入其中,包括汤汤、轻蔑、易图、图谱、阅读面等。他们采取了“刷脸入市”和“付脸”的立场。商汤和苏宁联手,绝望地赢得了阿里巴巴的淘咖啡。图普将技术推广到天府超市、易趣和oppo……...

这两种功能在无人商店和传统零售店的升级中被广泛使用,这也是目前视觉技术最知名的功能。最直接的效果是简化收银机和节省成本。

当然,新手在陌生的零售领域努力工作容易吗?

“人工智能不是万能的,不同的场景对算法有不同的要求。与证券和金融相比,零售领域过于复杂多变。”一位视觉产品经理叹息道。

据报道,目前的刷脸技术其实比较简单。“市场上提供的大多数算法都是前台识别,这种访问控制模型在离线零售中存在一些问题。线下零售应该难以察觉。它可能不会被注册的面孔识别,但第一次进入作为地下室的商店。它可能光线不足,可能被遮挡,也可能是侧面,需要特殊训练。”

尤其是在支付方面,有必要人为地设置一个固定的静态场景,迫使消费者合作。甚至连面人老板汤汤建的苏宁碧玉店也要靠大门。

“现在要小心,就像atm面对大银行的取款一样,加六个密码来确认;大胆一点,比如苏宁的入口处有一个大门,结账的队伍是一个一个排列的,这样支付环境就有一个固定的静态场景,准确率基本上可以达到100%。大量的动态比较将是一个问题。”汤海龙说道。

理论上,机器视觉并不是不能在不合作的条件下捕捉动态人脸。在火车站抓获逃犯涉及多种技术,如人脸检测、特征提取和比较。该机器首先在一帧视频中对所有人脸进行帧,然后将它们与公安机关的照片数据库逐一进行比较。然而,问题是场景的改变需要同步调整和优化算法。

Jane 24最初使用外部技术,但后来选择了独立研发。

“这不是因为外部技术不好。在像机场这样的公共场所,一眼就能从茫茫人海中认出恐怖分子。产品非常好,但关键问题是:首先,我们需要优化我们的场景,任何算法都必须根据局部场景进行优化,以达到最佳效果。其次,他们的训练人群与我们不同。”创始人林杰透露。

同时,面子本身的局限性能否完全适用于零售业也是有争议的。“我们认为,外部特征不能被用作一个人的终生id,或绑定到财务支付,这是非常危险的。”申兰科技的创始人陈海波说。

他为自己的“无耻运动”感到非常自豪。他不刷脸,而是扫动静脉、动脉和毛细血管,并将每条血管的分叉点和点之间的位置关系作为特征值。

“我们的N值达到4亿(可与4亿数据相比)。简而言之,N值越高,算法和计算能力越强),加上4位数的手机号码,它已经实现了40亿。”

据公开数据显示,2017年上汤有20亿张人脸数据,有2亿人接受了培训,达到了9位数密码的年龄。

进入竞技场后,它不太可能靠在你的脸上。

“说到视觉技术,我会想到刷牙。事实上,这是最简单和最基本的功能。”林杰说,“进入市场后,你不能拿一张脸。很难通过姿势来辨认这个人,也很难知道他拿了什么东西。”

业内公认,视觉技术应用的终极表现是亚马逊go,它能捕捉你通过机器看到和拿走的东西,并在离开商店后自动扣款。当然,为了确保准确性,亚马逊go还使用了重力传感器、二维码和红外传感器等辅助技术。

神兰在2016年4月发布了无人值守零售解决方案。陈海波告诉宜邦电力网,人货关联算法极其复杂。“入院时收集的人的数据,包括人的大小、头到地面的距离和肩到地面的距离,是一个全面的数据,摄像机一直在跟踪用户。商品区有一个看不见的电子围栏,它会触发相机在进入后开始抓取。相机以每秒30帧的速度抓住手,当它接触到商品时,每秒需要120帧。与此同时,它会实时返回并推断出背景,这样摄像机就可以聚焦在商品上,更准确地判断商品是什么。”

AI视觉商业化:因何纷纷扎入零售场景(一)

“在整个过程中,有必要调动多个摄像头来协调监控,并实时调整每个摄像头的重量。如果商品和背景颜色相同,那么机器大脑就什么也做不了。”

你的计划是多少?

“零售毛利很低,每一笔投资都会非常谨慎。相应地,它必须在投资前看到效果。”汤海龙说道。

从安全到零售,计算机视觉公司作为服务提供商,显然察觉到了客户预算的急剧下降。

例如,公安系统的视频监控方案不适合普通零售商。“它使用公共安全内部网(一个本地化的服务器集群),并使用物理服务器来传输所有视频流。服务对象的特性决定了方案的设计。”一位视觉从业者说。

对于视频监控,普通零售商必须考虑:首先,在本地增加服务器需要数万元购买服务器,需要维护,还需要防止被盗、丢失和损坏;第二,视频流到云处理解决方案的网络带宽成本和云gpu服务成本都不低。至少传输一个720p或一个高清流,带宽小于4m,一台cpu服务器约500元。一年,gpu是每年3000元;第三,当压缩的视频流被上传到云中时,帧将会丢失和失真,导致较差的结果。

AI视觉商业化:因何纷纷扎入零售场景(一)

“政府项目可以说是免费的,以达到最佳效果,这与商业逻辑不同。”

硬件占了解决方案的大部分成本,包括图形处理器、摄像头和各种传感器。

在背景分析中,无论商店配备小型硬件处理站还是走向云,包括私有云、公共云或混合云,供应商都提供了一个开放的选择。Tupu负责零售产品的刘凯解释说,gpu是由客户需求决定的。云分析和处理的优势在于更加及时。刚到商店的客人可以立即被识别,模型和程序的更新也在云中完成。不需要人工干预,但网络传输要求高;在繁忙时间,本地化分析几乎不占用带宽,在本地分析后,在空闲时间将分析结果上传到服务器。

AI视觉商业化:因何纷纷扎入零售场景(一)

“根据客户的实际需求和资源的限制,没有最好的,只有最合适的。”刘凯说道。

相机包括数百台最初离线使用的普通相机、数千种深度版本以及由解决方案提供商独立设计的独家产品。

普通相机是单目、2d成像,而深度相机可以通过双目或3d结构光或红外模块实现3d效果,这样我们就可以知道物体离相机有多远,这当然更昂贵。

“我们现在使用2d相机通过算法模拟3d。当然,如果我们使用深度相机模块,它可以更准确,但成本太高。”一位产品经理说。

原始设备可以使用。“我们不会对已经投资的东西造成破坏性损害。我们需要超过200万像素的摄像头。超市现有的摄像头可以直接使用,也可以并联到我们的系统中。”汤海龙说道。

图普向天府超市提供的改造方案是:重新使用原有的摄像头,对接crm系统获取会员的头像和消费记录,自动识别vip,准确发送促销广告。

如何把握效果和成本的平衡是新手的必修课。

“如果我们不计算成本,我们的精确度已经提高了。”简·24的创始人林杰说。

简24是亚马逊go的国内追随者。亚马逊go于2016年底由亚马逊发布。主题是拿着它不排队就走,这引起了业界的震惊。今年年初,亚马逊从内部测试开始正式向公众开放,两年后,技术圈和零售圈的人意识到这只是一个“橱窗”,真正没有大规模复制的可能。

据公开报道,亚马逊在空 160平方米的房间里安装了数百台摄像机。rgb与深度相机相结合,使用红外传感器和重力传感器。谣传的成本高达数千万美元。

发布2.0版的林杰使用了“数百个”普通相机,这些相机的排列再多也不为过,他依靠算法迭代来提高精确度。

“还是有必要回到商业的本质。相机的价格和数量肯定对效果有影响。但是,在零售情况下,收回投资的成本太高,这种商业模式无法持续。”林杰说。

来源:搜狐微门户

标题:AI视觉商业化:因何纷纷扎入零售场景(一)

地址:http://www.shwmhw.com/shxw/41727.html