正文

cvpr2021首次！王言治教授和色拉布团队把gan压缩22倍，性能比原始模型还高

Charmve  Charmve  2022-12-29  614

关键词：

点击上方“迈微AI研习社”，选择“星标★”公众号

重磅干货，第一时间送达

来源：金庆 | 编辑：好困

【导读】王言治教授团队与美国色拉布公司（Snap Inc.）首次提出了一种GAN剪枝的方法，除了使压缩时间减少了四个数量级以外，还在远低于原始计算量的条件下，获得来比原有模型更好的性能，并且实现了更高的生成图片质量。论文已被CVPR 2021收录。

神经网络结构搜索有助于得到在计算机视觉任务中效果更好的深度神经网络，同时可以减小模型尺寸，提高运行效率，实现移动端高速处理。

近年来，深度神经网络在图像、语音、文本等领域的进展使得其广泛应用在不同功能的系统中，包括图像分类、目标识别、语义分割、语音处理等。

不同于判别式模型只需要得到比较简单的判断结果（如分类结果），生成式模型需要生成更加复杂的图像结构。

相比于前者，后者通常需要更大的计算量和更大规模的模型，这使得将生成式模型压缩以提高运行效率面临巨大挑战。

为此，美国东北大学王言治教授研究团队与美国色拉布公司（Snap Inc.）的创意视觉研究组共同提出了压缩与教学技术。论文已经被CVPR 2021会议收录。

论文地址：https://arxiv.org/abs/2103.03467
项目地址：https://dejqk.github.io/GAN_CAT/

通过将inception模块引入生成模型并进行神经网络结构搜索，从而使搜索空间扩展至包含多种不同核尺寸的卷积模块。

并且利用知识蒸馏用搜索过程中训练的大模型指导搜索出的小模型的训练过程，在远低于原始超大规模生成模型计算量的条件下实现优于原始超大规模生成模型的生成图片质量。

与原有的巨型生成模型相比，论文的方法得到的模型在压缩的同时可以生成更高质量的图片（FID越低图片质量越好），并且实现了SOTA的性能-效率取舍。

网络模型

实现高效率网络模型主要包括网络压缩和模型结构搜索两种方式。

相比于前者，后者通常获得的网络结构更多样，效果也更优，并且现代压缩算法通常也包含搜索步骤。

然而，直接将传统的用于压缩或搜索的方法用在生成模型中，通常会导致模型性能具有较大损失，特别是生成的图像画质通常较差，容易产生额外的噪点和花斑。

此外，生成模型因其计算量庞大，通常训练时间较长，直接使用网络搜索一般不容易得到最优解，使得网络结构优化面临更多的挑战。

而且，对于高复杂度的大型网络（如GauGAN），传统方法通常导致性能损失更为明显。

因此，研究出高速有效的网络结构搜索方法和训练方法，对于提高生成模型的性能-效率取舍具有重要意义。

为了保证压缩后的生成模型产生出高质量的图像，需要解决的几个主要问题是：

网络搜索空间需要足够广，使得搜索过程的自由度足够高；
网络搜索的过程需要足够快，使得搜索过程中遍历的备选模型尽可能多，迭代过程也尽可能快（如超参调优等）；
搜索出的模型的在训练时需要充分利用已有信息，尽量保证模型得到充分训练。

为了扩展网络搜索空间，传统方法通过在不同类型操作之间进行选择来实现网络结构搜索。

与之相比，近年来提出的AtomNAS算法通过引入Inception模块，将多种不同类型的神经层同时使用，在提升模型性能的同时，将搜索过程和训练过程合并，显著降低了模型搜索所需的额外计算开销。

受此启发，作者将多种不同核尺寸的卷积模块同时使用，并同时包含普通卷积模块与depthwise卷积模块，实现网络搜索空间的扩充。

所用的模块包含1x1、3x3、5x5三种不同核尺寸的卷积模块，并且同时使用了普通卷积模块与depthwise卷积模块。

用在生成模型中的Inception残差模块

该模块使用不同核尺寸的卷积模块，并且同时使用普通卷积模块与depthwise卷积模块，在搜索过程中有助于扩充搜索空间。

作者将这一模块用在大型网络GauGAN中，用来替代其中主干中的卷积层和第一个归一化层中使用的SPADE模块中的卷积网络。

将Inception模块用在GauGAN的SPADE模块中

此外，主干中的第二个卷积层和分支中的卷积层可以使用普通的归一化层，而不需要使用计算量很大的SPADE模块。

网络空间的扩展不仅使得搜索过程简单高效，而且可以提高网络的灵活度，使得模型在相同计算量下能实现更高性能。

网络搜索

在网络空间扩展的同时，提高网络搜索效率成为网络搜索的主要问题。参照传统的网络搜索办法，作者选择使用归一化层的权重模大小作为搜索依据。

论文提出的搜索过程直接参考目标计算量，使用半分法来确定网络压缩所需的权重阈值。

使用半分法根据目标计算量确定压缩阈值对网络进行压缩

首先根据训练好的网络中归一化层的权重大小预设搜索上界和下界，由此算出一个权重阈值对网络进行预压缩，根据预压缩所得网络的大小与目标大小的相对关系，调整上下界，直至所得网络大小满足要求。

相比于文献中提出的生成模型压缩方法，论文提出的方法可以使得压缩过程所需时间减少至少四个数量级。

不同压缩方法在不同数据集和不同生成模型上所需压缩时间比较

搜索出模型结构后，通常原有模型的权重无法直接使用，需要重新训练。由于模型较小，训练过程中可能会出现较难优化甚至不收敛的问题。

为使得训练结果较好，文献中提出先额外训练一个较大的模型作为导师，再使用此模型训练搜索出的小模型。然而这种方法增加了额外的训练开销，使得搜索和训练过程的更加冗长。

为此，作者提出使用用于搜索的原有大模型作为导师模型，相当于将用于搜索的模型再次利用，进行知识蒸馏。

这样，大模型不仅用来作为小模型的导师指导训练，也因为其本身的结构特征用作网络结构搜索。这种方法可以最大限度地利用大模型，减少训练开销和时间。

知识蒸馏

知识蒸馏技术通常包含直接蒸馏和间接蒸馏。

前者一般只利用网络的最终输出进行比较实现蒸馏的目的，后者则利用网络内部卷积层的中间结果进行比较，作为指导原则。作者则选取后者对搜索的结构进行训练。

然而，由于作为导师的大模型的中间层特征与经过搜索压缩后得到的作为学生的小模型的中间层特征的通道数存在差异，无法通过直接比较完成蒸馏的目的。

文献中引入一个额外的可训练的线性层，将学生模型的特征映射到导师模型特征的空间中。

这样做不仅会导致引入额外的训练层，增加训练复杂度，而且蒸馏办法较为间接，可能效果并非最优。

为此，作者采用一种更直接的办法，通过比较导师模型特征和学生模型特征，通过最大化二者相似度，实现蒸馏目的。

Hinton等人于2019年通过详细分析，比较了不同的相似度判断标准，并且提出一种称为中心化核对齐（CKA）的指标。

作者采用类似的核对齐（KA）指标，并且发现中心化对最终结果不具有决定性的影响。

如下图所示，作者通过计算导师模型特征与学生模型特征的核对齐指标并将其最大化作为损失函数进行训练，实现知识蒸馏的目的。

与传统的通过引入额外的训练线性层进行知识蒸馏相比（左图），论文提出一种直接比较特征相似度的方法进行蒸馏（右图）。

结果分析

作者在多个数据集和多种类型的网络上验证了论文提出的方法，并且与原有的大模型和文献中已有的生成模型进行了比较。

论文提出的方法在将生成模型计算量压缩数十倍的基础上，仍然可以获得比原有模型更好的性能（高mIoU或低FID），并且与文献中的方法相比，实现了SOTA的性能-效率取舍。

不同压缩方法在不同数据集和不同生成模型上性能比较

为了更直观地展示结果，作者在不同数据集和模型上将压缩模型生成的图片和原有模型生成的图片进行对比。

可以看到，论文提出的模型在远低于原有模型计算量的条件下，可以生成更高质量的图片。

‍

Horse2Zebra数据集上压缩CycleGAN模型

Map2Aerial数据集上压缩Pix2pix模型

Cityscapes数据集上压缩GauGAN模型

作者介绍

第一作者金庆，美国东北大学ECE系PhD一年级学生。

主要研究领域为Deep Learning algorithm，研究内容已经在发表在CVPR，AAAI等机器学习和计算机视觉会议中。

参考资料：

https://arxiv.org/abs/2103.03467

更多细节可参考论文原文，更多精彩内容请关注迈微AI研习社，每天晚上七点不见不散！

我的GitHub https://github.com/Charmve

推荐阅读

（更多“抠图”最新成果）

迈微AI研习社

微信号: MaiweiE_com

GitHub: @Charmve

CSDN、知乎: @Charmve

投稿: yidazhang1@gmail.com

主页: github.com/Charmve

如果觉得有用，就请点赞、转发吧！

2021年的ilsvrc竞赛获得冠军的队伍是由啥领导的团队

...西安电子科技大学人工智能学院再获佳绩，由学院焦李成教授、刘芳教授、屈嵘教授，团队博士生杨育婷、黄钟健、张俊、耿雪莉及游超共同指导的学生参赛队伍，共计获得4冠军、2亚军和1季军的优异成绩。所有获奖队伍也均收... 查看详情

neurips2021spotlight|准确快速内存经济，新框架mest实现边缘设备友好的稀疏训练...

...“星标★”公众号重磅干货，第一时间送达美国东北大学王言治教授、林雪教授研究组与威廉玛丽学院任彬教授研究组共同提出了一种稀疏训练新框架MEST，有望在边缘设备上实现准确、快速以及内存经济的稀疏训练。在剪枝技... 查看详情

微软华人团队刷新coco记录！全新目标检测机制达到sota｜cvpr2021

点击上方“迈微AI研习社”，选择“星标★”公众号重磅干货，第一时间送达来源|新智元作者 |袁路大家好，我是Charmve！【导读】在最近放出的CVPR2021论文中，微软的研究者提出了多重注意力机制统一目标检... 查看详情

中国团队包揽cvpr2021弱光人脸检测挑战赛前三名！高分夺冠论文已公开

点上方人工智能算法与Python大数据获取更多干货在右上方 ··· 设为星标 ★，第一时间获取资源仅做学术分享，如有侵权，联系删除转载于：新智元CVPR作为是全球计算机视觉顶会之一，近年来的论文接收率... 查看详情

cvpr2022|美团技术团队精选论文解读

...顶会CVPR2022近日在美国新奥尔良召开，今年美团技术团队有多篇论文被CVPR2022收录，这些论文涵盖了模型压缩、视频目标分割、3D视觉定位、图像描述、模型安全、跨模态视频内容检索等研究领域。本文将对6篇精选的论文... 查看详情

ai力量大集结！中国团队首次在nature子刊发布中国ai全景论文

　　AI力量大集结！中国团队首次在Nature子刊发布中国AI全景论文　　由AI青年科学家联盟牵头，15位国内大学教授和企业界AI领军人物合作在NatureMachineIntelligence上发布了AIinChina的全景报告。　　今年6月，由AI青年科学家联盟·... 查看详情

中国首次！2021年图计算挑战赛揭榜，华中科技大团队夺冠

点上方人工智能算法与Python大数据获取更多干货在右上方 ··· 设为星标 ★，第一时间获取资源仅做学术分享，如有侵权，联系删除转载于：新智元喜讯喜讯！ 8月13日，2021年图计算挑战赛GraphChallenge比... 查看详情

中国首次！2021年图计算挑战赛揭榜，华中科技大团队夺冠

论文速递cvpr2021-基于自适应原型学习和分配的小样本分割

【论文速递】CVPR2021-基于自适应原型学习和分配的小样本分割【论文原文】：AdaptivePrototypeLearningandAllocationforFew-ShotSegmentation获取地址：https://openaccess.thecvf.com/content/CVPR2021/papers/Li_Adaptive_Prototype_Learning_and_Alloc 查看详情

cvpr2021商汤自动驾驶！详述面向量产的3d目标与车道线检测

...开课，受益匪浅，值得学习，作为一次记录1.1团队介绍商汤科技自动驾驶团队依托公司为背景，以SenseParrots作为基础平台，进行超大规模的网络学习；在自动驾驶的核心技术方面，从视觉感知、激光雷... 查看详情

cvpr2021商汤自动驾驶！详述面向量产的3d目标与车道线检测

团队-游戏石头剪子布-需求分析

1引言1.1编写目的童年时期没有网络游戏，没有游戏机，只有一些随时随地都能玩的一些小游戏，例如《石头，剪刀，布》，制作这款游戏只为了怀念逝去的童年1.2背景小的时候没有什么高大上的电子游戏，平时只会和小伙伴一... 查看详情

cvpr2021录取结果|cvpr2021审稿结果(代码片段)

...总结持续更新Github上面：https://github.com/Sophia-11/Awesome-CVPR-Paper 2021持续论文集锦百度云请在【计算机视觉联盟】后台回复 CVPR2021往年论文集锦请在【计算机视觉联盟】后台回复 CVPR2019 2020持续论文集锦请在【计算机视觉联盟... 查看详情

华中科技大学张李军教授团队招募机器学习方向博士后

...#xff1a;AI求职华中科技大学国家海外青年高层次人才张李军教授团队长期从事模型预测控制、人工智能方法和能源优化及其在新能源汽车和微电网中的应用。重点研究智能交通系统的建模、学习和决策与控制技术。包括电动车能量... 查看详情

初学scrum及首次团队开发

一、初学scrum1.什么是scrumScrum在英语的意思是橄榄球里的争球。而在这里Scrum是一种迭代式增量软件开发过程，经常性的被用于敏捷软件开发。Scrum包括了一系列实践和预定义角色的过程骨架。Scrum中的主要角色包括同项目经理类... 查看详情

团队-游戏《石头，剪刀，布》-团队一阶段互评

学号：2015035107123得分：9原因：经常有不错的建议学号：2015035107124得分：8原因：非常积极，但还有很多不足学号：2015035107124得分：7原因：很认真，能够将不懂得地方及时弄懂学号：2015035107101得分：6原因：分给的任务及时完成... 查看详情

1.cvpr2021-papers-with-code-demo（cvpr2021论文下载）

CVPR2021-Papers-with-Code-Demo☪️论文下载：https://pan.baidu.com/share/init?surl=gjfUQlPf73MCk4vM8VbzoA密码：aicv 查看详情