本篇文章3061字,读完约8分钟
雷锋。为了让你在聊天时段地图中立于不败之地,谷歌使用机器学习技术,最近开发了一个工具,允许你通过自拍生成个人表情包,这个工具在谷歌自己的聊天软件allo上更新。
拍照、分享和再次检查——自拍已经成为许多人的日常习惯。我们与汽车自拍,美丽的衣服,旅行,和“早上好,我醒了~”自画像已经成为人类社会行为的一部分,长期以来一直被用来展示自己。对有些人来说,自拍展示了外表;另外,自画像显示了他们希望别人怎么想。也有一些人想展示双方。自画像是一种基于现实的直觉表达,而用漫画来表达自己比现实更温暖、更容易。
谷歌推出的机器学习驱动的聊天表达软件allo内置了机器学习驱动的聊天程序。它是网络和艺术家合作的产物。想象一下,在你的表情回复栏中有一个按钮——“用一个按钮自拍来改变你的表情”,它可以自动快速生成你的“漫画版”。轻触按钮,程序会提示你自拍。然后,谷歌的图像识别将识别你的脸,并将你的特征扫描到拉马尔·艾布拉姆斯(lamar abrams)绘制的工具包中。拉马尔·艾布拉姆斯是一位故事板画家和作家,他的代表作是广受好评的在线卡通史蒂文·环球系列。该工具包储存了数百只眼睛、鼻子、脸、发型和眼镜元素。谷歌表示,该工具包可以生成56.3万亿张不同的面孔。系统生成原始的卡通,你也可以进行调整:改变你的发型或眼镜。最后,机器将自动生成22个表达式。
这个工具起源于一个内部研究项目,它的目的是看看机器学习能否通过自拍生成一个即时的卡通人物。然而,正如谷歌用户体验项目负责人杰森·康威尔(jason cornwell)所指出的,制作某人的卡通图片并不是最终目标。"如何做一些既能表现自己的外表,又能展现自己个性的事情?"康威尔说:“这个问题很有趣。它不仅能呈现机器学习和计算机的视觉,还能表达人的表情。这就是詹妮弗加入我们为你提供艺术自我表达的原因。
著名艺术总监康维尔提到的詹妮弗·丹尼尔是理查德·特利时代第一个为《彭博商业周刊》创造著名景观的设计师,后来她为《纽约时报》制作了一系列视觉专栏。丹尼尔指出:“插图可以传达自画像无法表达的情感状态。”自画像是你的理想状态。相反,表达是你感情的升华和夸张。因此,这个表达被设计得很有趣:你可以吃披萨或者变成流口水的僵尸。康威尔说:“我们的目标不是一个精确的东西,我们是让用户创造他们喜欢的东西。”因此,用户测试尊重人们的感受,并问一个问题:你在这张图片中看到自己了吗?你的朋友能认出你吗?
谷歌将这个项目列为长期运营项目,目的是探索新方法,让机器学习得到越来越广泛的应用。据谷歌称,谷歌的机器学习水平领先世界。如果它能使机器学习成为应用程序和网站的一项基本功能,它的产品将击败竞争对手。按照谷歌的计划,allo已经成为各种新的机器学习应用的测试平台。康威尔说:“我们在allo平台上的实验旨在找出机器学习如何更好地传递信息,从在准确的时间表达准确的事件到在准确的时间表达准确的感受。”
这听起来有点吓人,好像所有人都想取代我们成为对话的必需品?然而,在实践中,应用几乎是不可避免的。当有人给你发信息时,所有人都会根据你的对话记录迅速回复。例如,如果你的朋友给你发了一张她的跳伞照片,系统会回答:“太好了!”。或者,如果你在一个小组中聊天,allo将使用机器学习弹出一系列定制的有趣动画来回复。这个想法是,即使你不在现场,你也可以像在现场一样提高你的表达能力。康威尔说:“我们在许多其他方面也在考虑同样的问题。艺术和机器学习将如何相遇?”然而,他拒绝透露谷歌的研究方向。与此同时,丹尼尔承认将会有新的表情符号,这些表情符号将由不同的艺术家创作,并且具有全新的风格。雷锋。(公开号码:雷锋。认为如果有这样一个新的表达包,它可以把自己变成一只可爱的狗?请让这一天快点到来!
丹尼尔指出,这个项目代表了艺术和工程的新交叉。毕竟,我们刚刚开始接触机器学习在艺术中的作用。如果达芬奇还活着,我们很难相信蒙娜丽莎会是什么样子。相反,也许这将是一个用户特定的形象,可以重塑一个神秘的女性形象,跨越不同的文化和时代。但是目前,我们还没有在惠特尼双年展上发现任何酷的东西,所以也许我们需要像谷歌这样的公司来打破僵局。丹尼尔作为一个成功解决了美国技术设计领域问题的人,一直直言不讳。关于与谷歌的合作,她评论道:“我对工程和艺术合作的交集以及这个合作平台感兴趣。”在这个平台上,我们不仅创建内容,还创建产品本身。
传统的计算机通过分析图像的像素,通过算法确定属性值,然后通过像素值评估颜色、形状或纹理来艺术地变换自拍。然而,现在人们在不同的背景下自拍,姿势也各不相同。尽管人们很容易区分一些定性特征,例如,不管光照如何,他们都可以区分眼睛的颜色。但是这对计算机来说是一个非常复杂的任务。这是因为当人们辨别眼睛的颜色时,他们不仅要观察眼睛的像素值,还要考虑周围的环境。
为了解决这个问题,我们研究了一种类似人眼特征选择的算法,代替传统的编码方法,来解释不同光照条件下眼睛的颜色。同时,我们可以从头开始创建一个大的神经网络,也许我们可以做到这一点。我们想找到一种更有效的方法来实现我们的目标,因为把脸变成卡通是一个漫长而重复的过程。
为了给你的朋友创造一个你期望的形象,我们和艺术团队一起创造了各种元素。例如,实验中使用了艺术家最初设计的发型。在人工干预下,训练网络为自拍匹配相应的动画。然后,人工判断输出表达式与输入照片的匹配程度,以了解工具的性能。在某些情况下,评估者认为有些风格没有被很好地表现出来,所以艺术家创造了更多的可以被神经网络识别的元素。
评估者对发型进行分类,左边的图标代表较近的。达成共识后,常驻艺术家拉马尔.艾布拉姆斯根据图片的相似性创造了表达方式。
避免恐怖谷效应在美学研究中,有一个著名的问题“恐怖谷效应”——这个假设认为,如果一个人的复制品几乎像一个真实的人,它会让人感到厌恶。在机器学习中,如果计算机想到你,它可能会变得比你想象的更复杂。
与精确复制一个人的外貌相比,获得一个低分辨率的模型,比如表情和贴纸,可以让团队探索如何通过返回图像来增强表情,这与其说是为了再现现实,不如说是为了打破规则。
该团队与艺术家拉马尔·艾布拉姆斯合作设计的组合超过56.3万亿元
协调计算机如何感知你、你如何看待自己以及你想如何展示自己之间的关系是一种艺术实践。这是一个定制的功能,包括不同的发型、肤色和鼻子形状,这非常重要。毕竟,卡通的定义是主观的。美学是由种族、文化和阶级来定义的,它会导致人们因彼此的差异而不自觉地排斥他人。因此,我们努力创造不同种族、年龄、男性、女性和雌雄同体的空。我们的团队将继续评估研究结果,以防止在系统培训中出现偏差。
没有所谓的“普遍美学”或“单调的你”来为身份和情感创造一个宽广的调色板。人们与父母交谈的方式不同于他们与朋友和同事交谈的方式。当你有很多社交角色时,仅仅制作一个虚拟的头像是不够的。为了解决这个问题,allo团队正在研究一系列艺术声音来帮助其他人扩展他们的声音。目前发布的第一个风格可能是一个自我涂黑风格,下一个将用于那些真诚的时刻,这可能更可爱。在那之后,也许他们会把你变成一只狗。如果表情符号扩展了交流的世界,最令人兴奋的不是这种技术和语言是如何进化的,而是人们对工具本身功能的看法。
雷锋得知allo已经在android系统中推出,并将很快在ios系统中推出。
viaco.design
雷锋文章版权所有。严禁擅自转载。详情请参考转载说明。
来源:搜狐微门户
标题:谷歌用 AI 让自拍一键变表情包,斗图从此立于不败之地
地址:http://www.shwmhw.com/shxw/61418.html