本篇文章1722字,读完约4分钟

雷锋。作者凯泽,金略奇志总经理。原文在集智。com。雷锋。com已被授权。

在昨天的《卷积:如何成为一个强大的神经网络——智湖》栏目中,热情的网民提出了这样一个问题:

本文中,卷积神经网络的组成比较直观,但数学原理没有深入探讨。本文将详细介绍卷积滤波的具体机制,当然不用担心数学问题,只要能掌握100以内的加减和1999年的乘法表。

在之前的微博神经网络讨论中,话题奇怪地转向了山雀(打算放过り),而王思域也做出了召唤柏木由纪的承诺,所以这一次,以柏木由纪的照片为例,我们将解释图像处理的基本规律。

01.暗中观察我们现在谈论的“人工智能”是弱人工智能,或者更确切地说,是一种辅助计算工具。因为神经网络,我们不能停止像卡茨那样思考。

因此,无论如何用神经网络解决任何问题,第一步也是最关键的一步是理解你的问题本身。反映在具体的应用中,有必要找出业务背后的逻辑关系,而不是把数据扔进黑箱,开始准备炼金术。如果你摸不清楚,再摸一次。

现在我们必须做一个物体识别程序。在上面的图片中,可以辨认出的物品不多,只有凉鞋、一条裤子和一个胸罩。我们用胸罩来做吧。作为一个入门程序,这么早处理彩色图片是不合理和不合适的。因此,我们应该做一些简化,把骨骼阶段从皮肤阶段剥离出来,把核心的数学原理公开展示出来,并把它们发挥出来。

经过“灰度->阈值”两步,彩色图像变成黑白。接下来,我们需要通过计算机视觉,所以我们面前的黑色不是黑色,你说的白色不是白色,但是像素值只有0或1。

02.看到图片的背景暂时放在一边,经过观察,我们可以看到,要从人的身上识别胸罩和裤子,实质上,我们是从白色的花中寻找黑色,实际上,我们是从0中寻找1。

我们需要整个胸罩吗?不,只是需要检测胸罩的边缘。就像下棋一样。金角银边上的烂肚皮,只要它围绕着眼睛,就会占据空气,从而控制着潜力。

卷积滤波器是一个小于图片大小的矩阵,这里设置为3×3。让我们把图片放大到像素级(猜猜是哪个部分),每个小方块后面都有一个0或1。当卷积核在输入图像上来回滚动和摩擦时,基本上有三个区域(橙色方框):

全白(肉)

全黑(胸罩)

黑白(身体和胸罩的边缘)

下面的对应关系也应该是显而易见的。

此时,我们的卷积核就像一根有趣的羽毛,扫过每个角落,搅动你的动态区域。

03.在上图中,我们已经看到了各种过滤器和相应的过滤器效果,如边缘检测,锐化,平均模糊和高斯模糊。

看第三个边缘检测卷积核,它的矩阵是:

然后取包含边的5x5区域,对应矩阵:

现在,这个3x3矩阵(过滤器)应该接触到5x5矩阵。当然,触摸不是为了酷,而是为了计算价值。计算方法如下:黄色方块和红色数字是卷积滤波器,计算方法是将重叠的对应元素相乘并相加。(注意:这不是真正的“矩阵乘法”)

因为这里的图像在垂直方向上没有变化,所以您只需要沿着顶部滑动过滤器,总共有三个计算:

1.

2.

3.

最终生成的完整要素图将是:

特征映射的单位位置对应于卷积核中心(8)的位置,特征映射有三个值:

-3:检测胸罩的边缘,并且卷积核位于胸罩外部

3.检测胸罩的边缘,并且卷积核位于胸罩内部

0:未检测到边缘特征

到目前为止,你应该已经明白为什么过滤器可以提取图片的特征。

张量流&神经网络算法高级应用类即将开始!从初级到高级,理论+实战,一站式深入了解张量流!

本课程面向深入学习的开发人员,教授如何使用张量流解决特定问题,如图像识别和文本分析。为期10周的课程将从张量流的原理和基本实践技能开始,逐步教会学生如何在张量流上构建cnn、自编码、rnn、gan等模型,最终掌握一套基于张量流的深度学习和发展的专业技能。

作为思想工作的高级技术专家,童达和白华川两位教师在构建大数据平台和开发深度学习系统方面有着丰富的经验。

时间:每周二和周四晚上20: 00到21: 00

课程时长:共20小时,10周完成,每周2次,每次1小时

在线教学地址:mooc.ai/

雷锋。(公开号码:雷锋。相关阅读:

基于弱监督学习的神经网络在图像分割中的应用

读完这篇文章,我了解了深度卷积神经网络在目标检测方面的进展

雷锋文章版权所有。严禁擅自转载。详情请参考转载说明。

来源:搜狐微门户

标题:禅与奶罩识别艺术(上)

地址:http://www.shwmhw.com/shxw/63105.html