本篇文章1541字,读完约4分钟

在“全在人工智能”战略的指引下,百度交出了近年来最漂亮的成绩单。

根据截至3月31日的第一季度财务报告,百度第一季度总收入飙升31%,至209亿元(33.3亿美元),净利润为67亿元(11亿美元),每股收益为16.6元(2.6美元),均高于市场预期。

数据非常好,百度似乎正在走出低谷。

这得益于两个方面。第一,组织的优化,百度壮士们断了手腕,放弃了许多繁琐的业务;此外,这也是因为对人工智能的押注已经有了回报。

人工智能带来的利润直接反映在广告上。齐鲁表示,本季度,百度首次在广告系统丰朝部署了强化学习技术,这可以实现更准确的营销。这在工程上达到了一个新的里程碑。

强化学习不是一个新概念,那么它是什么呢?百度如何用它赚钱?

真正意义上的自学

强化学习是机器学习的一个分支,它对应于监督学习,或者以alpha go为例:

过去,使用监督学习的阿尔法围棋需要输入大量的人类棋手的棋谱和棋局数据,然后通过模拟完成“左打右打”,最后不断发现更科学的棋谱,也就是说,它实际上是在“模仿”人类。

与强化学习的最强版本alpha go zero不同,它不需要在人类游戏中画一只猫和一只老虎。在学习了基本规则和最终目标之后,你将开始“往下走”。如果你赢了,你会得到奖励,然后指导下一个决定;如果你输了,将会受到惩罚。在这个尝试-反馈-学习的过程中,自我进化完成了。

从某种角度来看,强化学习更接近智能生活的思维模式。通过不断的尝试和错误,我们可以从环境中获得反馈,从而获得更多的知识和数据。

那么,它能带来什么好处呢?显然,首先,没有必要在早期阶段输入大量数据,从而减少准备时间和成本。毕竟,高质量的大数据在任何时候都不可用;二是适应性强,真正意义上的“完全自学”,几乎可以应用于任何领域。理论上,如果计算能力保持不变,它可以解决任何问题。

当然,问题也在这里,因为它完全是“两眼一黑”的自我探索,所以强化学习的计算量远远超过监督式的自我学习;另外,它的过程是完全不可控的,所谓的“蝴蝶效应”导致结果的随机性,容易产生偏差。

百度是如何应用的?

回到百度本身,这个原则已经在上面提到过了,那么百度如何利用它来优化广告的效率呢?

如何实现它?

百度没有介绍太多,但原则很简单。在广告系统中加入强化学习模型,实时记录浏览、点击、转换等关键数据,并通过自学习优化投放,使广告更准确地匹配目标客户。

结果是,顾客的父亲可以把钱花在最前沿,花更少的钱,获得更准确的曝光率。当然,百度和谷歌过去一直这样做,但这是技术的升级。

为什么使用强化学习?

如前所述,它的优点在于在早期不需要输入大量的数据,所以可以直接上网,在线完成学习过程。

因为对于许多广告来说,它没有太多的数据可参考。虽然前人已经有了成功的案例,但时间、平台和目标群体的差异将导致以往经验的直接应用,而监督机器学习算法无法学习。

这时,强化学习是有用的,它可以分析广告本身的效果,而无需寻找其他大数据作为参考,即插即用,方便快捷。

据qubit报道,长安汽车发现点击率(Click Pass Rate)在使用后大幅上升,转换价格大幅下降,因此其日常预算增加了5倍。

然而,如上所述,强化学习有其自身的问题。如何优化模型,使最终结果更快、更可信,是百度将面临的技术考验。

正如facebook前工程师杰夫·哈默巴赫(jeff hammerbacher)的名言:“我们这一代最聪明的人都在思考如何让人们大量点击广告”,百度的技术可谓言之凿凿,最终的结果就是广告,这不可避免地会受到批评。

但事实上,在人类历史上,任何技术的初衷都是为商业服务,商业带来的资本也可以回馈技术的迭代。这个过程重复进行,社会和文明自然会进步。

除了竞争性的医疗广告。

来源:搜狐微门户

标题:百度 All in AI 还是 All in 广告?

地址:http://www.shwmhw.com/shxw/46101.html