专栏名称: AI开发者

AI研习社，雷锋网旗下关注AI开发技巧及技术教程订阅号。

目录

相关文章推荐

宝玉xp · 转发微博-20250313022510 · 17 小时前

数据何规 · 中国AI司法案例报告：纠纷如何奠基AI规则 · 昨天

数据何规 · 中国AI司法案例报告：纠纷如何奠基AI规则 · 昨天

宝玉xp · 50位 a16z 合伙人对 2025 ... · 2 天前

机器之心 · “专为我开了一个新课题”，顶尖博士为什么偏爱 ... · 3 天前

宝玉xp · 这文章还是来自 @左耳朵耗子的博客…… ... · 3 天前

51好读 › 专栏 › AI开发者

专栏 | 卷积神经网络学习路线（十四） | CVPR 2017 ResNeXt（ResNet进化版）

AI开发者 · 公众号 · AI · 2020-01-28 17:00

正文

点击上方“蓝字”关注“AI开发者”

本文来自 @BBuf 的社区专栏 GiantPandaCV ，文末扫码即可订阅专栏。

前言

传统的卷积神经网络在提高性能时都是加深和加宽网络，但随着超参数数量的增加(如通道数，卷积核大小等)网络变得非常难调，且网络的计算开销和网络结构设计也变得越来越难，这一点我在介绍ResNet和DenseNet大型模型的时候已经提到过了。此外这些大模型针对性比较强，即在特定数据集上表现好的网络放到新数据集上就需要修改很多的参数才能工作良好，因此可扩展性比较一般。针对上述问题，Saining Xie, Ross Girshick, Kaiming He在CVPR2017上提出了ResNeXt。论文原文地址见附录。

贡献

网络结构更加简单和模块化。
大量减少了需要手动调节的超参数，扩展性更强。
和ResNet相比，相同的参数个数，结果更好。具体来说，一个101层的ResNeXt 网络，和 200 层的 ResNet 准确度差不多，但是计算量只有后者的一半。

方法

网络结构

ResNeXt的网络结构如Table1所示：

Table 1的左边网络为ResNet-50，Table 1的右边网络为ResNeXt-50，括号代表残差块，括号外面的数字代表残差块的堆叠次数，而代表的ResNeXt引入的卷积分组数，同时我们可以看到这两个网络的FLOPs基本一致，也即是说模型复杂度一致。那ResNeXt有什么优点呢？这要先从分组来说起。

ResNeXt残差模块

分组数在论文中又被称为基数(cardinality)，是对GoogleNet中分立合并思想和VGG/ResNet中堆叠思想的一种结合，ResNet的残差模块和ResNeXt的残差模块如Figure1所示。可以看到ResNeXt残差模块有32个基数(分组数)，并且每个被聚合的拓扑结构就完全一样，这里是的组件，这也是和Inception结构的最大区别。

然后论文从理论角度来分析了一下这个ResNeXt残差模块，用全连接层举例来讲，全连接层的公式可以表示为：

然后Figure2就清晰的展示了全连接层分离变化合并( split-transform-merge )的处理过程：

而ResNeXt残差模块实际上就是将其中的替换成了更一般的函数，用公式表示如下：

其中就是上一节提到的分组数/基数，而代表的是相同的拓扑结构，在Figure1中就是 1x1+3x3+1x1 卷积堆叠。

请到「今天看啥」查看全文

推荐文章

宝玉xp · 转发微博-20250313022510

17 小时前

数据何规 · 中国AI司法案例报告：纠纷如何奠基AI规则

昨天

数据何规 · 中国AI司法案例报告：纠纷如何奠基AI规则

昨天

宝玉xp · 50位 a16z 合伙人对 2025 年科技领域发展趋势的预测 -20250311095436

2 天前

机器之心 · “专为我开了一个新课题”，顶尖博士为什么偏爱去字节实习？

3 天前

宝玉xp · 这文章还是来自 @左耳朵耗子的博客…… //@程序员邹欣:他十-20250310101527

3 天前

机器之心 · 重磅 | Science：实用量子计算机已近在咫尺

8 年前

36氪 · 乐视再陷“迷局”，除了质押股权还能怎么走？

8 年前

公路商店 · 为什么上海老外总瞧不起北京老外

7 年前

气质女人 · 《欢乐颂2》：读书和不读书，女人究竟差在哪？

7 年前

分答 · 夏天晒黑后，3个步骤白回来，让肌肤状态不输范冰冰

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!