本篇文章2252字,读完约6分钟
随着越来越多的机器学习算法被人类所掌握,它们的构造方法变得越来越重要。
随着越来越多的机器学习算法被人类所掌握,它们的构造方法变得越来越重要。机器学习的基础是人类收集的数据。当人类赋予算法越来越多的控制权时,如果不综合考虑,人工智能将和它的创造者一样有偏见。
以貌取人是人工智能吗?
据英国《每日邮报》报道,几位中国学者最近宣布,人工智能在面部识别方面已经发展到了一个新阶段:它可以从照片中推断出女性的性格。换句话说,通过训练数据中的分数,人工智能可以推断出年轻人根据外貌判断女性的标准。
上海交通大学的三名研究人员通过百度收集了3954张女性照片,并描述了这些照片中的人物。研究者将所有这些情感标签分为两组:s+是一个积极的范畴,包括纯洁、温柔、甜蜜、天真、自然等。;S-是一个消极的范畴,包括做作、夸张、虚荣和卖弄风情。
实验中s+级和s-级女性的形象
他们将照片分成两类后,将它们输入到卷积神经网络中,其中2000张照片进入s+类,1954张照片进入s-类。
在将这些图片提供给神经网络之前,研究人员要求22名男大学生检查并确保标签准确无误。这些仅从外表得出的推论应该用来训练神经网络,直到这个神经网络也能从外表推断出个性。
在总共3954张照片中,80%用于神经网络训练,10%用于程序检查,其余10%用于测试最新的人工智能程序,最终测试准确率达到80%。
12月中旬,该团队在在线开源杂志arxiv上发表了这项研究成果,该杂志名为“迷人女性面孔心理印象的自动推断”
(对漂亮女性面孔的心理印象的自动影响)还没有在其他有影响力的科学期刊上发表。
《每日邮报》评论道:虽然我们承认机器确实有识别肖像的能力,但是当我们想到通过外表来判断个性的主观问题时,我们发现这项研究是不可接受的。
一个罪犯的外貌可以用机器来判断吗?
事实上,几个月前,这三位研究人员做了一个系统,通过外表来判断一个人是否会犯罪,这也引起了很大的争议。
这项研究收集了1856名年龄在18岁至55岁之间的中国公民的照片,其中730人是罪犯。当然,为了确保数据的准确性,这730名犯罪分子并不包括犯罪嫌疑人,而只包括那些已经被认定为罪犯的公民。
一些犯罪样本用于分析
所有收集到的中国公民的照片都被输入电脑进行统计。计算机通过四种算法准确分析这些照片中市民的面部特征,并根据分析结果推断出罪犯的常见面部特征:
那些嘴巴小、嘴唇微翘、眼睛紧闭的人比那些有其他特征的人更有可能成为罪犯。
这项技术遭到了一些反对者的强烈批评,他们认为这项技术只是最基础的研究,而且有偏见。如果把这项技术应用到现实世界中去鉴定罪犯,那将是一件可笑的事情,因为它很可能错误地识别罪犯,让好人得到他们的错误,让真正的罪犯逍遥法外。
俗话说:“人不可貌相,海水不可斗量。”光凭外表就把一个人说成是罪犯或说谎者是荒谬的。”
巧合的是,这一研究结果也发表在arxiv上,至今还没有被其他专业杂志正式发表。
为什么人工智能会受到公众的批评?
在2016年9月举行的一场名为“爱美”的选美比赛中,人工智能电脑收集了世界各地18-69岁的自画像照片,并对这些照片进行评判。当结果公布时,似乎发生了一些意外,因为机器人一点也不喜欢深色皮肤的人,所以所有深色皮肤的照片都被筛选掉了。这个机器人对深色皮肤的人有一些偏见,这在评论中引起了广泛的不满。
有些女人拍美女收集的自拍
虽然大多数参赛者都是白皮肤的人,但大多数由印度和非洲的黑皮肤人提交的照片都被筛选掉了。也许是因为大多数参赛者都是白人,人工智能算法假设白皮肤的人更漂亮,这导致了黑色照片的筛选。
人工智能美容大赛的首席科学官亚历克斯·扎沃伦科夫说:“如果你的数据库里没有足够的不同肤色的数据,人工智能电脑机器人将会得出有偏见的结果。”
真正的选美比赛
因此,如果我们想用一种算法来识别一组数据,如果某一类型的数据是不够的,它可能会产生一个有偏差的结果。
事实上,同样的问题已经反映在谷歌的深梦实验中。2015年6月,谷歌利用人工神经网络创建了能够识别不同图像内容并自行处理和绘制的深梦系统,为互联网开辟了又一个神奇的时代。我这么说的原因是因为这个人工智能系统真的坏了
梵高的《星月之夜》中的星星和建筑都被不知名的狗、汽车、鸟和眼镜占据了,这是一部恐怖电影的截图。这种超现代的绘画风格再怪异不过了。
这张美利坚合众国国旗的照片也不能幸免。它被深梦描绘成狗、昆虫和人的脚。当然,各种奇怪的图案、亮点和眼镜都是必不可少的。读完上面两张照片后,我记不起它们是什么了。这是洗脑!接下来的问题是,这个具有自我学习能力的高级智能系统是如何绘制出如此神奇的作品的?
谷歌自己回答了这个问题。最初,该算法是在开源数据库imagenet中训练的,其中包含数千张狗的照片,因此ai在其他情况下更容易识别狗的模式。
许多人工智能研究人员以前遇到过许多不同的问题,而这些问题直到现在还没有从本质上得到解决。首先,互联网的游戏性特别强,它是动态的而不是静态的,这在网络广告中更为明显。此外,互联网上的数据量远远大于语音和图像,但这类大数据的状态非常模糊,实际数据相当稀少。我们应该如何解释它?
回到谷歌深梦以前遇到的问题,很多人都观察过自己的孩子,他们一眼就能认出动物。以前,孩子们的经验可能只是从图画书里看到变形的动物图片,而机器只能输出大量有效的数据来实现图像识别。
因此,在让机器变得更聪明之前,我们应该先弄清楚人们是如何做这些事情的吗?
来源:搜狐微门户
标题:为“女性”看相?帮助甄别罪犯?别闹 人工智能还不是万能的
地址:http://www.shwmhw.com/shxw/55405.html