通用卷积神经网络CCNN!

投稿用户 • 2022年10月6日 am2:51 • 运营经验 • 阅读 157

抖店动销，抖店体验分提升。抖店任何业务可添加微信：ad07668

来源：机器之心本文约2400字，建议阅读5分钟来自阿姆斯特丹自由大学、阿姆斯特丹大学、斯坦福大学的研究者提出了CCNN。在VGG、U-Net、TCN网络中…CNN虽然功能强大，但必须针对特定问题、数据类型、长度

来源：机器之心

本文约2400字，建议阅读5分钟

来自阿姆斯特丹自由大学、阿姆斯特丹大学、斯坦福大学的研究者提出了 CCNN。

在 VGG、U-Net、TCN 网络中… CNN 虽然功能强大，但必须针对特定问题、数据类型、长度和分辨率进行定制，才能发挥其作用。我们不禁会问，可以设计出一个在所有这些网络中都运行良好的单一 CNN 吗？

本文中，来自阿姆斯特丹自由大学、阿姆斯特丹大学、斯坦福大学的研究者提出了 CCNN，单个 CNN 就能够在多个数据集（例如 LRA）上实现 SOTA ！

1998 年 LeCun 等人提出卷积神经网络 (CNN)，这是一类广泛用于机器学习的深度学习模型。由于 CNN 具有高性能和高效率等特点，使其在跨序列、视觉和高维数据的多个应用程序中实现 SOTA 性能。然而，CNN（以及一般的神经网络）存在一个严重缺陷，这些架构必须针对特定应用进行定制，以便处理不同的数据长度、分辨率和维度。这反过来又导致大量特定于任务的 CNN 架构出现。

数据可以有许多不同的长度，例如图像可以是 32×32 或 1024×1024。标准 CNN 存在的问题是，它们的卷积核是局部的，这需要为每个长度定制一个精心选择的步长和池化层来捕获整个上下文自定义架构。此外，许多数据本质上是连续的，在不同的分辨率下具有相同的语义，例如图像可以在任意分辨率下捕获，并具有相同的语义内容，音频可以在 16kHz 或 44.1kHz 采样，但人耳听起来仍然是相同的。

然而，由于卷积核的离散性，传统的 CNN 不能跨分辨率使用。当考虑具有相同 CNN 的不同维度数据时，这两个问题会进一步加剧，例如序列（1D）、视觉（2D）和高维数据（3D、4D），因为不同的维度以不同的特征长度和分辨率运行，例如一秒音频的长度很容易达到 16000，这与基准数据集中的图像大小形成强烈对比。

在本文中，研究者提出了迈向通用 CNN 架构。其目标是构建一个单一的 CNN 架构，可以用于任意分辨率、长度和维度的数据。标准 CNN 需要特定于任务的架构，因为其卷积核的离散性将内核绑定到特定的数据分辨率，并且由于构建大型离散卷积核所需的大量参数，它们不适合对全局上下文进行建模。

因此，为了构建一个通用的 CNN 架构，关键是开发一个分辨率不可知的卷积层，该卷积层能够以参数有效的方式对远程依赖关系进行建模。该研究入选 ICML 2022 。

论文地址：

https://arxiv.org/pdf/2206.03398.pdf

代码地址：

https://github.com/david-knigge/ccnn

本文的贡献

该研究提出 Continuous CNN（CCNN）：一个简单、通用的 CNN，可以跨数据分辨率和维度使用，而不需要结构修改。CCNN 在序列 (1D)、视觉 (2D) 任务、以及不规则采样数据和测试时间分辨率变化的任务上超过 SOTA。
该研究对现有的 CCNN 方法提供了几种改进，使它们能够匹配当前 SOTA 方法，例如 S4。主要改进包括核生成器网络的初始化、卷积层修改以及 CNN 的整体结构。

连续核卷积

连续核卷积将小型神经网络

作为核生成器网络，同时将卷积核参数化为连续函数。该网络将坐标

映射到该位置的卷积核值：

（图 1a）。通过将 K 个坐标

的向量通过 G_Kernel，可以构造一个大小相等的卷积核 K，即

。随后，在输入信号

和生成的卷积核

之间进行卷积运算，以构造输出特征表示

，即

。

任意数据维度的一般操作。通过改变输入坐标 c_i 的维数 D，核生成器网络 G_Kernel 可用于构造任意维数的卷积核。因此可以使用相同的操作来处理序列 D=1、视觉 D=2 和更高维数据 D≥3。

不同输入分辨率的等效响应。如果输入信号 x 有分辨率变化，例如最初在 8KHz 观察到的音频现在在 16KHz 观察到，则与离散卷积核进行卷积以产生不同的响应，因为核将在每个分辨率下覆盖不同的输入子集。另一方面，连续核是分辨率无关的，因此无论输入的分辨率如何，它都能够识别输入。

当以不同的分辨率（例如更高的分辨率）呈现输入时，通过核生成器网络传递更精细的坐标网格就足够了，以便以相应的分辨率构造相同的核。对于以分辨率 r (1) 和 r (2) 采样的信号 x 和连续卷积核 K，两种分辨率下的卷积大约等于与分辨率变化成比例的因子：

CCNN：在 ND 中建模远程依赖关系

具有连续核卷积的残差块改进。该研究对 FlexNet 架构进行了修改，其残差网络由类似于 S4 网络的块组成。CCNN 架构如下图 2 所示。

基于这些观察，该研究构建了 FlexConv 的深度（depth-wise）可分离版本，其中通道（channel-wise）卷积是使用核生成器网络

生成的核计算的，之后是从 N_in 到 N_out 进行逐点卷积。这种变化允许构建更广泛的 CCNN—— 从 30 到 110 个隐藏通道，而不会增加网络参数或计算复杂度。

正确初始化核生成器网络 G_Kernel。该研究观察到，在以前的研究中核生成器网络没有正确初始化。在初始化前，人们希望卷积层的输入和输出的方差保持相等，以避免梯度爆炸和消失，即 Var (x)=Var (y)。因此，卷积核被初始化为具有方差 Var (K)=gain^2 /(in channels ? kernel size) 的形式，其增益取决于所使用的非线性。

然而，神经网络的初始化使输入的 unitary 方差保留在输出。因此，当用作核生成器网络时，标准初始化方法导致核具有 unitary 方差，即 Var (K)=1。结果，使用神经网络作为核生成器网络的 CNN 经历了与通道?内核大小成比例的特征表示方差的逐层增长。例如，研究者观察到 CKCNNs 和 FlexNets 在初始化时的 logits 大约为 1e^19。这是不可取的，这可能导致训练不稳定和需要低学习率。

为了解决这个问题，该研究要求 G_Kernel 输出方差等于 gain^2 /（in_channels?kernel_size）而不是 1。他们通过、

重新加权核生成器网络的最后一层。因此，核生成器网络输出的方差遵循传统卷积核的初始化，而 CCNN 的 logits 在初始化时呈现单一方差。

实验结果

如下表 1-4 所示，CCNN 模型在所有任务中都表现良好。

首先是 1D 图像分类 CCNN 在多个连续基准上获得 SOTA，例如 Long Range Arena、语音识别、1D 图像分类，所有这些都在单一架构中实现的。CCNN 通常比其他方法模型更小架构更简单。

然后是 2D 图像分类：通过单一架构，CCNN 可以匹配并超越更深的 CNN。

对 ND 进行远程依赖建模的重要性。原则上可以将所有任务视为不考虑 2D 结构的序列任务，该研究只需改变进入核生成器网络的坐标维数，就可以在多维空间上轻松定义 CCNN。有趣的是，该研究观察到，通过在 LRA 基准测试中考虑图像和 Pathfinder 任务的 2D 特性，可以获得更好的结果（上表 3）。

在具有 2D 图像的 PathFinder 中，最大的 CCNN 获得了 96.00% 的准确率，比之前 SOTA 高出近 10 个点，并在扁平图像上的表现明显优于 CCNN。

此外，在原始 2D 数据上训练的模型显示出比它们的序列对应物更快的收敛（图 3）。具有小卷积核的 2D CNN，例如 ResNet-18，由于中间池化层缺乏细粒度的全局上下文建模，无法解决 Pathfinder。

抖店动销，抖店体验分提升。抖店任何业务可添加微信：ad07668

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 sumchina520@foxmail.com 举报，一经查实，本站将立刻删除。
如若转载，请注明出处：https://www.zg8899.cn/40964.html

投稿用户

蕞简单的赚钱方法，就是你有一套赚钱系统!app赚钱最快的软件

上一篇 2022年10月6日 am2:41

练好这两个瑜伽动作，你离轮式就不远了！欲加之罪何患无辞意思是什么？

下一篇 2022年10月6日 am3:01

运营经验

购买追觅w10pro官翻机避雷！追觅和添可洗地机哪个好

题主自己住宿舍，本来地方不大，也不做饭，每周大清理一次，每天小清理，感觉卫生保持的还可以。但是后来养了一只猫主子，导致大部分时间都用在主子身上，犯了懒，所以就打算入一个扫拖一体的机器人，让老公挑选了一下，最终选了追觅w10pro，本来有顾虑买新机还是官翻机，闺蜜安利说追觅的官翻机很ok，只是

2022年9月21日
130 0
运营经验

百度输入法上线“AI侃侃”，可以叫早哄睡，情感虚拟人太贴心了！实时互动什么意思

随着生活节奏的不断加快，很多年轻人长时间处于高压力的生活节奏和工作中，内卷、焦虑、自卑已经成为年度流行词。长时间身处紧张状态下，容易诱发一系列的心理问题，如果压力不能及时释放出去，随时随地可能会被引爆，很大程度影响大家工作生活，严重的甚至会

2022年9月21日
195 0
运营经验

天蝎座的终结者星座！天顶天蝎

捉摸不透的水瓶座自我的水瓶和腹黑的天蝎，是有着很多的相似之处，但也有很多明显的区别，相遇后会发生很多奇妙的事情，天蝎本身的神秘特质，对于机智的水瓶，有着致命的吸引力，就像一个漩涡一样，牢牢地抓住水瓶的内心和探索欲，但是天蝎面对独立且捉摸不透的水瓶是很头疼的，很难了解水瓶内心的真实想法，并且水瓶的性格特别淡定和沉得住气，大山崩于前，面不改色，就这一点，就很让天蝎

2022年12月5日
169 0
运营经验

“悄悄”运营抖音商城后，这个品牌成交额提升4倍抖音商城怎么找店铺会员卡

抖店动销、抖店报白、过新手期、体验分提升、联系微信：ad07668“抖音电商921好物节期间，我们在抖音商城的单天成交就突破了千万，成交金额/订单数/成交人数较上周期均上升了约400%。”周大福营销总经理陈继娟向卡思透露。此外，她还补充了一组数据：整个活动期间，周大福店铺新增会员环比上涨超600%，其中抖音商城成为品牌新客的重要来源，占比超过90%。抖音商城正在为越来越多的品

2023年4月2日
140 0
运营经验

“抖音亲自下场推保养套餐、全国通存通兑”，会是修理厂的福音吗抖音本地店铺评价怎么删除掉

抖店动销、抖店报白、过新手期、体验分提升、联系微信：ad07668作者|宋全业来源|汽车服务世界（ID：asworld168）两年前我在大声疾呼汽车服务门店做抖音的时候，很多人嗤之以鼻，也有一部分老板重视了抖音，现在回过头来看，你会发现原来抖音现在这么重要。当然，即使到现在很多老板还认为抖音不重要，但耐不住自己门店的业绩持续下滑，盲目认为仅仅是疫情的原因，那么为什么别人的门店利润在增

2023年4月4日
107 0
运营经验

揭秘！众合图书是怎样“养成的”初稿、排版、封面、上架…!产品排版效果图

HELLO，各位小法师们！我是你们备考路上的贴心小帮手—众合图书小精灵备考路上从客观题到主观题，从精讲卷到冲刺卷，大家都少不了我的帮助！最近收到不少小法师们的疑问，想了解我的“诞生”经历。今天，趁着假期就跟大家一起揭秘下吧（不同样式的我）（我的爸爸妈妈们）01我的出生：是一封邮件刚开始我只是作者大大们多年经验和智慧的结晶，当你遇到我时，我可能墨香满满，一尘不染。而我的出生其实是一封封邮件

2022年10月7日
159 0
运营经验

刘家大姐的日常百家号视频（刘家大姐的日常好看视频）

夫妻白手起家挣了一百多万买别墅，可让人万万没想到的就是，丈夫竟然背着妻子在外面金屋藏娇，妻子文娇一气之下将家中的东西乱扔乱砸，不断的发泄心中的怒火，这到底是发生什么事情呢？丈夫为何会在婚内做出如此出格的事情呢？一、丈夫为何金屋藏娇？眼前非常愤怒的女人叫做文娇，当她听到别人说自

2022年5月15日
316 0
钠电相关公告三连发！百亿精细化工龙头联手七彩化学25亿投建钠离子正极材料项目，大股东却拟高位减持！深圳电目科技有限公司

财联社9月18日讯（编辑王舒蕾）总市值接近100亿元的美联新材下午公告，与七彩化学签署《战略合作协议》。双方暂定共同投资25亿元人民币，建设年产18万吨电池级普鲁士蓝（白）产业化项目，助推钠离子电池产业发展。公告显示

运营经验 2022年9月21日
168 0
运营经验

首发AI工程化数据解决方案，云测数据引领AI数据服务市场新变革!都是快报热线

2022年9月初,中国国际服务贸易交易会(简称“服贸会”)上,AI数据服务领域头部企业云测数据首次发布了面向AI工程化的新一代数据解决方案,成为AI数据服务市场步入成熟期的标志。这是云测数据第三次参加服贸会,有趣的是,我们可以通过市场引领者云测数据三年来在会上发布的成果进阶,以小窥大,探寻AI数据服务市场的发展脉络,进而解锁市场新趋势。三年三变化,引领AI数据服务市场新变

2022年10月6日
166 0
运营经验

入站两周增长1200w播放！B站新人UP主竟能爆款频出!B站怎么上首页

B站视频爆款如何打造？这篇文章作者将带你一步步拆解近期B站新人UP主的人设营销与爆款视频制作方案，助你了解人设IP的搭建与自媒体视频创作。在B站9月8日发布的第二季度财报中除了月活突破3亿大关以外，社区流量也有高增长，得益于Story-Mode竖屏模式的开放，在新一季度日均播放量同比增长超过400%，推动整个站内流量同比增长48%。来源-

2022年10月6日
154 0

通用卷积神经网络CCNN!

相关推荐