卷积神经网络CNN完全指南!

投稿用户 • 2022年10月7日 am9:21 • 运营经验 • 阅读 144

抖店动销，抖店体验分提升。抖店任何业务可添加微信：ad07668

1】导论先来说一写题外话…研究生入学后就被导师逼着学习神经网络，一开始非常盲目，先是在网上搜了一大堆的资料，各种什么“一文读懂卷积神经纹网络”，“叫你三分钟搭建属于自己的神经网络框架”，“五分钟速读神经网络全解”，之类的文章层出不穷。看了太多导致的结果是，学了很久都没能真正意义上地入门。而后自己艰辛摸索

1】导论

先来说一写题外话…

研究生入学后就被导师逼着学习神经网络，一开始非常盲目，先是在网上搜了一大堆的资料，各种什么“一文读懂卷积神经纹网络”，“叫你三分钟搭建属于自己的神经网络框架”，“五分钟速读神经网络全解”，之类的文章层出不穷。看了太多导致的结果是，学了很久都没能真正意义上地入门。

而后自己艰辛摸索才慢慢了解了卷积神经网络的真谛。（好官方啊哈哈哈哈哈哈）

首先最需要明确的一点就是，卷积神经网络，也就是convolutional neural networks （简称CNN），现在已经被用来应用于各个领域，物体分割啦，风格转换啦，自动上色啦blahblah，但是！！CNN真正能做的，只是起到一个特征提取器的作用！所以这些应用，都是建立在CNN对图像进行特征提取的基础上进行的。

这篇文章呢，我不打算和传统介绍CNN的文章一样先介绍生物神经元、突触什么的，就直接从最简单的实例讲起。

废话不多说，开始。

拿到一张图片，要对它进行识别，最简单的栗子是，这张图是什么？

比如，我现在要训练一个最简单的CNN，用来识别一张图片里的字母是X还是O。

我们人眼一看，很简单嘛，明显就是X啊，但是计算机不知道，它不明白什么是X。所以我们给这张图片加一个标签，也就是俗称的Label，Label=X，就告诉了计算机这张图代表的是X。它就记住了X的长相。

但是并不是所有的X都长这样呀。比如说…

这四个都是X，但它们和之前那张X明显不一样，计算机没见过它们，又都不认识了。

（这里可以扯出机器学习中听起来很高冷的名词 “ 欠拟合 ”）

不认识了怎么办，当然是回忆看看是不是见过差不多的呀。这时候CNN要做的，就是如何提取内容为X的图片的特征。

我们都知道，图片在计算机内部以像素值的方式被存储，也就是说两张X在计算机看来，其实是这样子的。

其中1代表白色，-1代表黑色。

如果按照每像素逐个比较肯定是不科学的，结果不对而且效率低下，因此提出其他匹配方法。

我们称之为patch匹配。

观察这两张X图，可以发现尽管像素值无法一一对应，但也存在着某些共同点。

如上图所示，两张图中三个同色区域的结构完全一致！

因此，我们就考虑，要将这两张图联系起来，无法进行全体像素对应，但是否能进行局部地匹配？

答案当然是肯定的。

相当于如果我要在一张照片中进行人脸定位，但是CNN不知道什么是人脸，我就告诉它：人脸上有三个特征，眼睛鼻子嘴巴是什么样，再告诉它这三个长啥样，只要CNN去搜索整张图，找到了这三个特征在的地方就定位到了人脸。

同理，从标准的X图中我们提取出三个特征（feature）

我们发现只要用这三个feature便可定位到X的某个局部。

feature在CNN中也被成为卷积核（filter），一般是3X3，或者5X5的大小。

【2】卷积运算

说了那么久终于扯到了卷积二字！

但是！！胖友们！卷积神经网络和信号处理里面那个卷积运算！毛关系都没有啊！当初我还特意去复习了一下高数里的卷积运算！摔!

这些！！都和我们的CNN没有关系！！！

(二稿修改：经知友提醒，此处的确说得不对，卷积神经网络在本质和原理上还是和卷积运算有一定的联系的，只是之前本人才疏学浅未能看出它们二者实质相关联的地方，若有误导之处还请各位谅解，抱歉！）

好了，下面继续讲怎么计算。四个字：对应相乘。

看下图。

取 feature里的（1，1）元素值，再取图像上蓝色框内的（1，1）元素值，二者相乘等于1。把这个结果1填入新的图中。

同理再继续计算其他8个坐标处的值

9个都计算完了就会变成这样。

接下来的工作是对右图九个值求平均，得到一个均值，将均值填入一张新的图中。

这张新的图我们称之为 feature map （特征图）

可能有小盆友要举手问了，为什么蓝色框要放在图中这个位置呢？

这只是个栗子嘛。这个蓝色框我们称之为 “窗口”，窗口的特性呢，就是要会滑动。

其实最开始，它应该在起始位置。

进行卷积对应相乘运算并求得均值后，滑动窗便开始向右边滑动。根据步长的不同选择滑动幅度。

比如，若步长 stride=1，就往右平移一个像素。

若步长 stride=2，就往右平移两个像素。

就这么移动到最右边后，返回左边，开始第二排。同样，若步长stride=1，向下平移一个像素；stride=2则向下平移2个像素。

好了,经过一系列卷积对应相乘，求均值运算后，我们终于把一张完整的feature map填满了。

feature map是每一个feature从原始图像中提取出来的“特征”。其中的值，越接近为1表示对应位置和feature的匹配越完整，越是接近-1，表示对应位置和feature的反面匹配越完整，而值接近0的表示对应位置没有任何匹配或者说没有什么关联。

一个feature作用于图片产生一张feature map，对这张X图来说，我们用的是3个feature，因此最终产生3个 feature map。

至此，卷积运算的部分就讲完啦！~

【3】非线性激活层

卷积层对原图运算多个卷积产生一组线性激活响应，而非线性激活层是对之前的结果进行一个非线性的激活响应。

这是一个很官方的说法，不知道大家看到上面这句话是不是都觉得要看晕了。

嗯~ o(*￣▽￣*)o 其实真的没有那么复杂啦！

本系列的文章秉承着“说人话！”的原则，着力于用最简单通俗的语言来为大家解释书上那些看不懂的概念。

在神经网络中用到最多的非线性激活函数是Relu函数，它的公式定义如下：

f(x)=max(0,x)

即，保留大于等于0的值，其余所有小于0的数值直接改写为0。

为什么要这么做呢？上面说到，卷积后产生的特征图中的值，越靠近1表示与该特征越关联，越靠近-1表示越不关联，而我们进行特征提取时，为了使得数据更少，操作更方便，就直接舍弃掉那些不相关联的数据。

如下图所示：>=0的值不变

而<0的值一律改写为0

得到非线性激活函数作用后的结果：

【4】pooling池化层

卷积操作后，我们得到了一张张有着不同值得feature map，尽管数据量比原图少了很多，但还是过于庞大（比较深度学习动不动就几十万张训练图片），因此接下来的池化操作就可以发挥作用了，它最大的目标就是减少数据量。

池化分为两种，Max Pooling 最大池化、Average Pooling平均池化。顾名思义，最大池化就是取最大值，平均池化就是取平均值。

拿最大池化举例：选择池化尺寸为2×2，因为选定一个2×2的窗口，在其内选出最大值更新进新的feature map。

同样向右依据步长滑动窗口。

最终得到池化后的feature map。可明显发现数据量减少了很多。

因为最大池化保留了每一个小块内的最大值，所以它相当于保留了这一块最佳匹配结果（因为值越接近1表示匹配越好）。这也就意味着它不会具体关注窗口内到底是哪一个地方匹配了，而只关注是不是有某个地方匹配上了。这也就能够看出，CNN能够发现图像中是否具有某种特征，而不用在意到底在哪里具有这种特征。这也就能够帮助解决之前提到的计算机逐一像素匹配的死板做法。

到这里就介绍了CNN的基本配置—卷积层、Relu层、池化层。

在常见的几种CNN中，这三层都是可以堆叠使用的，将前一层的输入作为后一层的输出。比如：

也可以自行添加更多的层以实现更为复杂的神经网络。

而最后的全连接层、神经网络的训练与优化，更多内容将在下一篇文章中继续。

#今日头条小助手##深度学习#

抖店动销，抖店体验分提升。抖店任何业务可添加微信：ad07668

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 sumchina520@foxmail.com 举报，一经查实，本站将立刻删除。
如若转载，请注明出处：https://www.zg8899.cn/42654.html

投稿用户

二十大代表风采│“草帽书记”彭兴利只要村里好，我干啥都愿意!什么赚钱最快

上一篇 2022年10月7日 am9:11

《中国高科技成就绘本》上海面世_让科技成果触达青少年!是否触达什么意思

下一篇 2022年10月7日 am9:31

运营经验

「设计干货」客户要多、要大、要好看，能安排不？!产品排版效果图模板

作者：葱爷很多设计师理想的设计工作，可能都是做一些精致、优雅、高级的设计作品，但是在现实的工作中，大部分的客户都喜欢相对粗暴、接地气一点的设计。因为客户觉得这类设计简单、直接、文字和图片较大、信息较多、没有过多的技巧、版面空间利用充分，理论上来说效果会更好。但设计师喜欢把这类设计与丑、土、Low划等号，因为想要满足以上这些特点就很难做到好看了。不过，为

2022年10月7日
163 0
中信建投"摊牌"了！基金投顾上线整两年，如何破解"基金赚钱基民不赚钱"？!i问财智能投顾官网

时光飞逝，中信建投基金投顾试点落地已经整整两年了。两年来，基金投顾从无到有，从小到大，在助力居民财富保值增值，实现共同富裕方面发挥着越来越重要的作用。这其中，部分机构的尝试、探索与努力不容忽视，也积累了一些经验做法。基金投顾的展业情况如何？中信建投打法全曝光。2020年9月，中信建投作为首批机构

运营经验 2022年10月5日
152 0
运营经验

榆佳高交交通安全线上讲，安全路上你和我！南交

阳光讯（蒲婷记者李源）在第十一个122“全国交通安全日”来临之际，为提升广大司乘人员交通安全意识、法治意识和文明意识，进一步丰富交通参与者安全出行知识、提高自我防范保护能力，从源头预防和减少道路交通事故的发生。11月28日上午，高交榆佳大队组织邀请榆佳公司、北元化工集团、麻黄梁收费站、养护公司、佳县中沟村、张庄村村民等共同参与了122主题宣传

2022年12月10日
129 0
运营经验

雪莱周运_11月27日-12月3日星座运势,巨蟹座满月

白羊座作为思维敏捷的白羊座，你经常认为提前计划是浪费时间。虽然这通常是真的，但此时此刻，你必须仔细思考你现在在做什么，以及这些活动，尤其是相关人员，将把你带到哪里。秘密是什么？确保安排和思维灵活，足以应对经常发生的、经常发生的意外变化。金牛座对你来说

2022年12月11日
142 0
运营经验

在影视动画方面，中美动画角色性格有何区别？!人物角色用英语怎么说短语

角色是电影叙事表达中的重要组成部分，也是创作动画电影不可或缺的要素，角色的出彩对于整部电影来说至关重要。动画电影与真人电影相比能够在一定程度上突破物质对思想的束缚，运用电影技术完成一些更具有创造力的角色设置。对于角色性格的分析可以将角色分为“扁平人物”和“圆形人物”，本节通过中美对于角色类型设置的差异

2022年10月5日
171 0
那些有钱人一般都是干啥的!人力资源管理是干什么的

如果说后台有啥问题问得比较多，这个问题显然算一个，只是太俗了，一直没咋说。假期前稍微说点，跟大家说一下这些年碰到的，说不定对大家有所启发。咱们先把“有钱”标准定为“年入百万”吧，不过客观地讲，这个收入对于上班族来说是天花板级的存在，但是对于真正的那些有钱的来说，啥也不是。咱们本文还

运营经验 2022年10月5日
130 0
运营经验

引热议！69岁曾志伟与人妻女星合照脸贴脸，继吻大马女模后再被批，69岁

本文编辑剧透社：小彤未经授权严禁转载，发现抄袭者将进行全网投诉现年49岁的香港艺人姚乐怡曾是TVB电波少女一员，年轻时的她经常以性感的形象示人，因此也是给不少观众们留下了深刻的印象。直到在2012年，姚乐怡嫁给未婚夫吴俊匡之后，就开始慢慢淡出了幕前，将更多的重心放在家庭上面。之后姚乐怡在2015年顺利升级当妈，为老公吴俊匡诞下了一个女儿，虽然在升级

2022年12月5日
144 0
运营经验

刘家小飞的个人主页西瓜感剧全部视频（刘家小飞的个人主页视频）

文|老刀”机会总是留给那些有准备的人，和先知先觉并投入持续行动的人，这话没有毛病。以前是：十年河东，十年河西。现在是：一年河东，一年河西。也不是什么奇怪的事了。——摘自金卯刀《刀曰》01衡阳网红诞生的时间有一条分水岭，这个时间点我们说它是2019年比较合适。彼时，虽然快手、抖音、好看视频等短视频平台已经上线并虚位以待，但全民对它的认识

2022年5月21日
280 0
神州细胞第二款生物新药安平希全国上市会召开！新药研发的基本流程图

中证网讯（记者傅苏颖）9月17日，由中国临床肿瘤学会（CSCO）与神州细胞工程有限公司共同举办的“CSCO白血病·淋巴瘤高峰论坛暨安平希全国上市会”在北京、哈尔滨、武汉、上海、广州五城以线上线下相结合的方式召开，大会主题“重构希望，瑞享新生|构筑淋巴瘤治疗新希望”。中国工

运营经验 2022年9月21日
162 0
运营经验

工程师调试好帮手，南芯科技UFCS协议诱骗器方案登场！芯曌科技有限责任公司

前言快充产业长期存在协议不兼容的问题，尤其在各大手机品牌之间，快充协议众多，互不兼容，不同品牌的手机和充电器之间往往只能实现基本的小功率充电。这不仅严重影响了用户快充使用体验，造成资源浪费；也大大增加了产业链上下游研发风险与成本。而随着融合快充标准产业的不断壮大，UFC

2022年9月21日
136 0

卷积神经网络CNN完全指南!

相关推荐