正文

计算机视觉系列最新论文（附简介）

wujianming-110117  wujianming-110117  2023-04-05  518

关键词：

计算机视觉系列最新论文（附简介）

目标检测

1. 综述：深度域适应目标检测标题：Deep Domain Adaptive Object Detection: a Survey作者：Wanyi Li, Peng Wang链接：https://arxiv.org/abs/2002.06797
本文共梳理了40篇相关文献，由中科院自动化所学者发布。基于深度学习(DL)的目标检测已经取得了很大的进展，这些方法通常假设有大量的带标签的训练数据可用，并且训练和测试数据从相同的分布中提取。然而，这两个假设在实践中并不总是成立的。深域自适应目标检测(DDAOD)作为一种新的学习范式应运而生。本文综述了深域自适应目标检测方法的研究进展。
2. 深度学习中的异常实例检测：综述
标题：Anomalous Instance Detection in Deep Learning: A Survey作者：Saikiran Bulusu, Dawn Song链接：https://arxiv.org/abs/2003.06979
本文共梳理了119篇相关文献，由雪城大学学者发布。讨论多种异常实例检测方法，并分析了各种方法的相对优势和劣势。
3. 使用移动摄像机检测移动物体：全面综述标题：Moving Objects Detection with a Moving Camera: A Comprehensive Review作者：Marie-Neige Chapel, Thierry Bouwmans链接：https://arxiv.org/abs/2001.05238
本文共梳理了347篇相关文献。随着移动传感器的兴起，研究移动相机逐渐变为热门方向。本文对不同现有方法进行了识别，并将其分为一个平面或多个两类。在这两个类别中，将各类方法分为8组：全景背景减法，双摄像头，运动补偿，子空间分割，运动分割，平面+视差，多平面和按块分割图像。本文还对公开可用的数据集和评估指标进行了研究。
图像分类

4. 图像分类中的半监督，自我监督和无监督技术综述

标题：A survey on Semi-, Self- and Unsupervised Techniques in Image Classification

作者：Lars Schmarje, Reinhard Koch链接：https://arxiv.org/abs/2002.08721
本文共梳理了51篇相关文献。综述了标签较少的图像分类中常用的21种技术和方法。我们比较方法，并确定了三个主要趋势。
图像去噪

5. 图像去噪深度学习：综述标题：Deep Learning on Image Denoising: An overview作者：Chunwei Tian, Chia-Wen Lin链接：https://arxiv.org/abs/1912.13171
本文梳理了238篇相关文献，由哈尔滨工业大学、广东工业大学、清华大学学者共同发布。不同类型的处理噪声深度学习方法存在巨大差异，而目前很少有相关研究来进行相关总结。本文对图像去噪中不同深度学习技术进行了比较研究，分析不同方法的动机和原理，并在公共去噪数据集进行比较。研究包括：(1). 加白噪声图像的CNN；(2)用于真实噪声图像的CNN；(3)用于盲噪声去噪的CNN；(4)用于混合噪声图像的CNN。
图像分割

6. 使用深度学习进行图像分割：综述标题：Image Segmentation Using Deep Learning: A Survey作者：Shervin Minaee, Demetri Terzopoulos链接：https://arxiv.org/abs/2001.05566
本文梳理了172篇相关文献，对语义和实例分割文献进行了全面回顾，涵盖了的各种开创性作品，包括全卷积像素标记网络，编码器-解码器体系结构，多尺度以及基于金字塔的方法，递归网络，视觉注意模型以及对抗中的生成模型。
人脸识别

7. DeepFakes：面部操纵和伪造检测综述标题：DeepFakes and Beyond: A Survey of Face Manipulation and Fake Detection作者：Ruben Tolosana, Javier Ortega-Garcia

链接：https://arxiv.org/abs/2001.00179

本文梳理了105篇相关文献，本文对操纵人脸的图像技术（包括DeepFake方法）以及检测此类技术的方法进行了全面综述。论述了四种类型的面部操作：全脸合成、面部身份交换（DeepFakes）、面部属性操作以及面部表情操作。

姿态估计

8. 目标姿态回顾：从3D边界框检测器到完整的6D姿态估计器标题：A Review on Object Pose Recovery: from 3D Bounding Box Detectors to Full 6D Pose Estimators作者：Caner Sahin, Tae-Kyun Kim链接：https://arxiv.org/abs/2001.10609
本文梳理了206篇相关文献，由伦敦帝国理工学院学者发布。本文对3D边界框检测器到完整的6D姿态估计器的物体姿态恢复方法的进行了首次全面的综述。基于数学模型，将各类方法分为分类，回归，分类与回归，模板匹配和点对特征匹配任务。
行为/动作识别

9. 基于3D骨架的动作识别学习方法的研究

标题：A Survey on 3D Skeleton-Based Action Recognition Using Learning Method

作者：Bin Ren, Hong Liu链接：https://arxiv.org/abs/2002.05907
本文梳理了81篇相关文献，由北京大学学者发布。本文强调了动作识别的必要性和3D骨架数据的重要性，然后以数据驱动的方式对基于递归神经网络，基于卷积神经网络和基于图卷积网络的主流动作识别技术进行了全面介绍，这也是第一次对使用3D骨架数据进行基于深度学习的动作识别的全面研究。
人群计数

10. 基于CNN的密度估算和人群计数：综述标题：CNN-based Density Estimation and Crowd Counting: A Survey作者：Guangshuai Gao, Yunhong Wang链接：https://arxiv.org/abs/2003.12783
本文梳理了222篇相关文献，由北京航空航天大学学者发布，基于CNN的密度图估计方法，调研了220+工作，对人群计数进行了全面系统的研究。同时根据评估指标，在人群统计数据集上选择表现最好的三名，并分析其优缺点。
医学影像

11. 使用经典和深层神经网络进行的乳房组织病理学图像分析的全面综述标题：A Comprehensive Review for Breast Histopathology Image Analysis Using Classical and Deep Neural Networks作者：Xiaomin Zhou, Tao Jiang链接：https://arxiv.org/abs/2003.12255
本文梳理了180篇相关文献，由东北大学学者发布。对基于人工神经网络的BHIA技术进行了全面概述，将BHIA系统分为经典和深度神经网络以进行深入研究，分析现有模型以发现最合适的算法，并提供可公开访问的数据集。
12. 使用深度神经网络的医学图像配准：全面综述标题：Medical Image Registration Using Deep Neural Networks: A Comprehensive Review作者：Hamid Reza Boveiri, Ali Reza MehdiZadeh链接：https://arxiv.org/abs/2002.03401
本文梳理了117篇相关文献，对使用深度神经网络进行医学图像配准的最新文献进行了全面回顾，系统地涵盖了该领域的相关作品，包括关键概念，统计分析，关键技术，主要贡献，挑战和未来方向。
13. 迈向自动威胁检测：X射线安全成像中深度学习进展综述标题：Towards Automatic Threat Detection: A Survey of Advances of Deep Learning within X-ray Security Imaging作者：Samet Akcay, Toby Breckon链接：https://arxiv.org/abs/2001.01293
本文梳理了151篇相关文献，由英国杜伦大学学者发布。本文分常规机器学习和当代深度学习两类来回顾X射线安全成像算法。将深度学习方法分为有监督，半监督和无监督学习，着重论述分类，检测，分割和异常检测任务，同时包含有完善的X射线数据集。
14. 用于计算组织病理学的深度神经网络模型综述标题：Deep neural network models for computational histopathology: A survey作者：Chetan L. Srinidhi, Anne L. Martel链接：https://arxiv.org/abs/1912.12378
本文梳理了130篇相关文献，由多伦多大学学者发布。本文对组织病理学图像分析中使用的最新深度学习方法进行了全面回顾，包括有监督，弱监督，无监督，迁移学习等领域，并总结了几个现有的开放数据集。
三维重建

15. 外部形状对3D内部结构预测综述标题：A Survey On 3D Inner Structure Prediction from its Outer Shape作者：Mohamed Mejri, Cédric Pradalier链接：https://arxiv.org/abs/2002.04571
本文梳理了81篇相关文献，由北京大学学者发布。由于过去与骨架数据相关内容很少，本文是第一篇针对使用3D骨架数据进行基于深度学习的动作识别进行全面讨论的研究。本文突出了动作识别和3D骨架数据的重要性，以数据驱动的方式对基于递归神经网络、卷积神经网络和图卷积网络的主流动作识别技术进行了全面介绍。并介绍了最大的3D骨架数据集NTU-RGB+D及其新版本NTU-RGB+D 120，并论述了几种现有的顶级算法。
三维点云

16. 点云的无目标配准综述标题：Target-less registration of point clouds: A review作者：Yue Pan
本文对48篇文献进行了梳理，总结了无目标点云配准的基本工作，回顾了三种常用的配准方法，即基于特征匹配的方法，迭代最近点算法和随机假设，并分析了这些方法的优缺点，介绍它们的常见应用场景。链接：https://arxiv.org/abs/1912.12756
OCR：

17. 手写光学字符识别（OCR）：综合系统文献综述（SLR）标题：Handwritten Optical Character Recognition (OCR): A Comprehensive Systematic Literature Review (SLR)作者：Jamshed Memon, Rizwan Ahmed Khan链接：https://arxiv.org/abs/2001.00139
本文对142篇相关文献进行了梳理，总结了有关OCR的研究，综述了2000年至2018年之间发布的研究文章，介绍OCR的最新结果和技术，并分析研究差距，以总结研究方向。
深度depth相关：

18. 基于深度学习的单目深度估计：综述标题：Monocular Depth Estimation Based On Deep Learning: An Overview作者：Chaoqiang Zhao, Feng Qian链接：https://arxiv.org/abs/2003.06620
本文对119篇相关文献进行了梳理，由华东理工大学学者发布。随着深度神经网络的迅速发展，基于深度学习的单眼深度估计已得到广泛研究。为了提高深度估计的准确性，提出了各种网络框架，损失函数和训练策略。因此，本文综述了当前基于深度学习的单眼深度估计方法，总结了几种基于深度学习的深度估计中广泛使用的数据集和评价指标，同时根据不同的训练方式回顾了一些有代表性的现有方法：有监督，无监督和半监督。

CNN

19. 卷积神经网络的概述论文:分析、应用和展望标题：A Survey of Convolutional Neural Networks: Analysis, Applications, and Prospects作者：Zewen Li, Wenjie Yang, Shouheng Peng, Fan Liu链接：https://arxiv.org/abs/2004.02806
本文对119篇相关文献进行了梳理，由华东理工大学学者发布。本文旨在在卷积神经网络这个快速增长的领域中尽可能提供新颖的想法和前景，不仅涉及二维卷积，而且涉及一维和多维卷积。首先，本文简要介绍了CNN的历史并概述了CNN发展，介绍经典CNN模型，重点论述使它们达到SOTA的关键因素，并通过实验分析提供了一些经验法则，最后对一维，二维和多维卷积的应用进行了概述。
视觉常识/其他

20. 神经网络分类器的信息平面分析研究述评标题：On Information Plane Analyses of Neural Network Classifiers -- A Review作者：Bernhard C. Geiger链接：https://arxiv.org/abs/2003.09671 21. 低功耗深度学习和计算机视觉方法的概述标题：A Survey of Methods for Low-Power Deep Learning and Computer Vision作者：Abhinav Goel, George K. Thiruvathukal链接：https://arxiv.org/abs/2003.11066
22. 深度学习遇到数据对齐时：深度注册网络（DRN）评述标题：When Deep Learning Meets Data Alignment: A Review on Deep Registration Networks (DRNs)作者：Victor Villena-Martinez, Robert B. Fisher链接：https://arxiv.org/abs/2003.03167
23. 面向消费设备的无限制掌纹识别：文献综述标题：Towards Unconstrained Palmprint Recognition on Consumer Devices: a Literature Review作者：Adrian-S. Ungureanu, Peter Corcoran链接：https://arxiv.org/abs/2003.00737
24. 基于地面纹理的本地化功能-综述标题：Features for Ground Texture Based Localization -- A Survey作者：Jan Fabian Schmid, Rudolf Mester链接：https://arxiv.org/abs/2002.11948

25. 从观看到移动：视觉室内导航（VIN）学习综述标题：From Seeing to Moving: A Survey on Learning for Visual Indoor Navigation (VIN)作者：Xin Ye, Yezhou Yang链接：https://arxiv.org/abs/2002.11310

cvpr2022|美团技术团队精选论文解读

计算机视觉国际顶会CVPR2022近日在美国新奥尔良召开，今年美团技术团队有多篇论文被CVPR2022收录，这些论文涵盖了模型压缩、视频目标分割、3D视觉定位、图像描述、模型安全、跨模态视频内容检索等研究领域。本文将... 查看详情

计算机视觉论文总结系列：目标检测篇(代码片段)

👨‍💻作者简介：大数据专业硕士在读，CSDN人工智能领域博客专家，阿里云专家博主，专注大数据与人工智能知识分享。公众号：GoAI的学习小屋，免费分享书籍、简历、导图等资料，更有交... 查看详情

cvpr2020最新论文扫描盘点（上）

CVPR2020最新论文扫描盘点（上）最近计算机视觉三大顶会之一CVPR2020接收结果已经公布，一共有1470篇论文被接收，接收率为22%，相比去年降低3个百分点，竞争越来越激烈。这里整理来自Twitter、arXiv、知乎放出来的30篇最新CVPR... 查看详情

大道至简，何恺明最新一作火了：让计算机觉视觉通向大模型！

何恺明，清华大学本科，港中文博士来源|知乎，MLNLP编辑https://www.zhihu.com/question/498364155原问题：如何看待何恺明最新一作论文MaskedAutoencoders？论文链接：https://arxiv.org/pdf/2111.06377.pdf01回答一：查看详情

聊一聊计算机视觉中常用的注意力机制附pytorch代码实现(代码片段)

聊一聊计算机视觉中常用的注意力机制以及Pytorch代码实现注意力机制（Attention）是深度学习中常用的tricks，可以在模型原有的基础上直接插入，进一步增强你模型的性能。注意力机制起初是作为自然语言处理中的... 查看详情

清华&南开出品最新视觉注意力机制attention综述

...、卡迪夫大学RalphR.Martin教授合作，在ArXiv上发布关于计算机视觉中的注意力机制的综述文章。该综述系统地介绍了注意力机制在计算机视觉领域中相关工作清华计图胡事民团队的这篇注意力机制的综述火了！在上周的arXiv... 查看详情

时隔两年，cv大神何恺明最新一作：视觉预训练新范式mae！大道至简！

...E模型，将NLP领域大获成功的自监督预训练模式用在了计算机视觉任务上，效果拔群，在NLP和CV两大领域间架起了一座更简便的桥梁。CV大神何恺明又出力作！这次，何大神让BERT式预训练在CV上也能训的很好。论... 查看详情

读论文系列：objectdetectionspp-net

...inginDeepConvolutionalNetworksforVisualRecognitionMotivation神经网络在计算机视觉方面的成功得益于卷积神经网络，然而，现有的许多成功的神经网络结构都要求输入为一个固定的尺寸（比如224x224,299x299）࿰ 查看详情

视频+课件|视觉引导系列课程

附课件：查看详情

中国大学生计算机大赛二等奖智能中医-中e诊简介

1系列文章导航系列文章2【Python】计算机视觉手掌图片穴位识别（二）系列文章3【python-Unet】计算机视觉舌象舌头图片分割机器学习（三）系列文章4【python】计算机视觉~舌象图片中舌体倾斜判别（四）系... 查看详情

中国大学生计算机大赛二等奖智能中医-中e诊简介

计算机视觉系列教程2-1：图解直方图均衡化原理+python实战

...涉足：【机器人(ROS)】【机器学习】【深度学习】【计算机视觉】🔥专栏：《机器人原理与技术》《计算机视觉教程》《机器学习》《嵌入式系统》…🚀计算机视觉基础教查看详情

cvpr2021录取结果|cvpr2021审稿结果(代码片段)

....com/Sophia-11/Awesome-CVPR-Paper 2021持续论文集锦百度云请在【计算机视觉联盟】后台回复 CVPR2021往年论文集锦请在【计算机视觉联盟】后台回复 CVPR2019 2020持续论文集锦请在【计算机视觉联盟】后台回复 CVPR2020CVPR2021最新更新论文I... 查看详情

计算机视觉领域必读的9篇论文

参考技术A推荐下计算机视觉这个领域，依据学术范标准评价体系得出的近年来最重要的9篇论文吧：（对于英语阅读有困难的同学，访问后可以使用翻译功能）一、DeepResidualLearningforImageRecognition 摘要：Deeperneuralnetworksaremorediff... 查看详情

作者简介&系列文章

...2022考研一志愿上岸（085400），研究方向：计算机视觉、机器学习等。Python、OpenCV和Machinelearning正在学习中。📚系列文章：1️⃣OpenCV图像处理：基于Python的OpenCV图像处理。2️⃣牛客刷题：主要查看详情

图文详解神秘的梯度下降算法原理(附python代码)

...涉足：【机器人(ROS)】【机器学习】【深度学习】【计算机视觉】🔥专栏：《机器人原理与技术》《计算机视觉教程》《机器学习》《嵌入式系统》…目录1引例2数值解法3梯度下降算法查看详情

基于ssm框架开发汽车租赁系统开发与设计(附论文源码资料)

...截图7.源码截图8.数据库截图1.适用人群本课程主要是针对计算机专业相关正在做毕业设计或者是需要实战项目的Java开发学习者。2.你将收获提供：项目源码、项目文档、数据库脚本、软件工具等所有资料从零开始手把手教学... 查看详情

window10安装python3.7+selenium(附最新安装包)

一、了解python简介：Python是一种计算机程序设计语言。是一种动态的、面向对象的脚本语言，最初被设计用于编写自动化脚本(shell)，随着版本的不断更新和语言新功能的添加，越来越多被用于独立的、大型项目的开发。应用领... 查看详情