计算机视觉入门

gaiyuanzheng gaiyuanzheng     2022-11-01     698

关键词:

 

 第一节课: 计算机视觉整体概述

 

这学期正在上一节计算机视觉课程,有些不懂的知识上百度搜索发现关于计算机视觉的文章寥寥无几。 这节课主要讲解的是计算机视觉里面的图片识别,不会讲到识别一些正在运动的物体。

希望可以把自己学到的东西分享给大家。因为版权等问题,我无法将lecture notes放在这里,但是我会把自己所理解的东西写下来。

 

1. 什么是计算机视觉(Computer Vision)?

老师给出的定义:  Enable machines to “see” the visual world as we do. (可以让机器像我们一样看见并且识别东西). 个人理解计算机视觉也就是我们平常说的人脸识别,车牌号识别,自动驾驶里面的树,人各种交通符号的识别,以及各种人们想要识别的东西都可以通过算法来识别出来。另外计算机视觉是人工智能(AI)的一个分支。

计算机视觉包含三点:

1. Measurement(测量): 通过visual data计算这个3D世界的不同属性。

2. Perception&interception(认知和翻译): 通过使用一些算法和representation(讲解)可以使机器认知一些物体,人,景色以及运动的东西。

3. Search&organization(搜索和整理): 通过一些算法来和visual data 挖掘,搜索和交互。

 

下图就是典型的计算机视觉技术分析出来一个公园里面的各种信息: 

技术分享图片

 

下图为计算机视觉以及其相关的科目:

技术分享图片

 

下图为图片和模型之间的关系,应该很清楚的表示了从图片到模型属于视觉,反之则为图像:

技术分享图片

 

 

 2. 为什么计算机视觉很难实现?

  提到几点:

    1. 真是的世界比我们看到的图片中的要复杂得多(从3D世界到2D图片)。

    2. 从图片还原出来当时的过程(process)是不可能的.    

    3. 物体的运动(比如奔跑中的人照片可能是模糊的).

    4. 物体多元化,比如椅子可以有很多种很多不同颜色不同品牌等等...

    5. 光源,物体的动作,背景杂乱的影响等等都会影响。见下图

      技术分享图片

 

3. 现在的科学技术已经做到了哪些?

1. 图片分类(Image classification),下图

 技术分享图片

 

2. 人脸识别(Face detection), 这个很好理解就不放图了

3. 物体识别(Object classification),下图

技术分享图片

 

4. 脸部匿名化(face anonymization),其实就是变脸...

5. 交互式系统(比如xbox的kinect)

6. 自动驾驶中的人,树,和其他一些交通指示牌。

7. 动作的捕捉(motion capture),见下图

技术分享图片

 

8. 还有很多不一一列举了...

 

4. 计算机视觉的运用(Applications)

机器人学,自动驾驶,图片搜索,医学领域图片等等,平时用的美图秀秀和那个什么把人脸变成狗脸的faceu都是计算机视觉领域。

 

5. 总结

总之计算机视觉是一个新兴的领域,非常有用,有趣但是很难。。。 这堂课我们会讲解图片构成,原理,如何变化以及如何识别。 运用的语言是Matlab(上这节课之前我是一点都不会matlab[哭~])。

 

 


计算机视觉入门(代码片段)

 一、掌握知识  (一)计算机视觉之OpenCV图片读取与展示、图片写入、图片质量控制、像素操作几何变换、图片特效、图像美化、机器学习机器学习:视频分解图片、图片合成视频  (二)计算机视觉之TensorFlow:手写... 查看详情

计算机视觉入门及资料汇总

目录:(未完,持续更新)零、好的博客汇总:一、计算机视觉论文及代码汇总:二、特征提取算法汇总:三、深度学习与计算机视觉汇总:四、C和C++入门汇总:五、数据集汇总:  零、好的博客汇总:(1)jsxyhelu:https... 查看详情

零基础小白,如何入门计算机视觉?

计算机视觉是人工智能技术的一个重要领域,打个比方(不一定恰当),我认为计算机视觉是人工智能时代的眼睛,可见其重要程度。计算机视觉其实是一个很宏大的概念,下图是有人总结的计算机视觉所需要的技能树。 如... 查看详情

计算机视觉入门必看书籍

计算机视觉入门必看书籍周围有许多朋友问我,想要入门学习计算机视觉,要什么好书推荐?我今天就向大家介绍一本非常适合初学者学习的书籍。广告深度学习与图像识别:原理与实践作者:魏溪含,涂铭,张修鹏京东《深度... 查看详情

计算机视觉入门:我推荐你这样学习!

近年来,计算机视觉取得了很大进展。这些是我将在这里提到的主题内容:技术:人脸检测:Haar,HOG,MTCNN,Mobilenet面部识别:CNN,Facenet对象识别:alexnet,inceptionnet,resnet迁移学习:在一个新主题上用很少的资源重新训练大型... 查看详情

计算机视觉入门培训

计算机视觉入门培训引入计算机视觉的基本概念计算机视觉五大技术计算机视觉主要应用领域计算机视觉落地场景一、引入二、计算机视觉的基本概念What?计算机视觉的概念计算机视觉是使用计算机及相关设备对生物视觉的... 查看详情

学习了哪些知识,计算机视觉才算入门

参考技术A要学习以下计算机视觉的知识才能算入门:1.图像生成.(包括成像原理,相机内参数外参数及光学畸变矫正方法,光照,阴影和颜色空间)2.早期视觉.(包括低通滤波的平滑,中值滤波,高通滤波的图像增强,图... 查看详情

计算机视觉方面快速入门的重要工具之一:opencv

...的学院与专业。而在人工智能领域,数字图像处理与计算机视觉占据着重要的地位,人脸识别、刷脸支付、无人驾驶等词汇都是数字图像处理与计算机视觉领域的重要成果。图像处理和计算机视觉技术与 查看详情

《入门图像处理》计算机视觉入门

主要分为2个部分:opencv入门+tensorflow入门、穿插numpy+matplotlib入门知识1.安装tensorflow1.10和opencv3.3.1:安装tensorflow和opencv:pipinstall--upgrade--ignore-installedtensorflow==1.10-ihttps://pypi.douban.com/simple/pipinstallpython-opencv-ihttps://pypi.douban.com/simple/... 查看详情

网友:java岗,自学一个月跳槽计算机视觉,其实入门很简单

...基本上都离不开,发展趋势、岗位高薪、职业兴趣。计算机视觉行业真相:竞争压力小,需求量极大图片来源Boss直聘利用计算机视觉技术,我们可以进行:车辆检测& 查看详情

计算机视觉opencv初入门(代码片段)

 下面就一个例子简单体会一下cv2的简单应用例子:问题设置场景:一个文件夹里面包含了许多文件,要把所有是图片的找出来,并且展示。同时修改图片的名字(格式随便自己定)注:笔者这里定义格式为1-9  images... 查看详情

萌新的计算机视觉入门1--retinex算法

   算法的基本原理是认为人眼观看的图像S是由两部分组成,即入射光图像L与反射图像R相乘得到,因为R与图像轮廓信息相关,所以问题变为从S中提取R。其中的关键便是根据L的特征对L进行合适的建模。  最基础的算法... 查看详情

opencv入门级图像处理教程,从小白到视觉算法工程师

OpenCV是一个开源的计算机视觉和机器学习软件库。OpenCV主要为开发计算机视觉程序提供一组公共的底层结构和加强商业产品中机器的感知能力。OpenCV使用BSD许可证,它可以被商用并可以修改源代码。OpenCV库有超过2500个已优化的算... 查看详情

python基础语法入门(代码片段)

...课程:李宁《PythonPygame游戏开发入门与实战》李宁《计算机视觉OpenCVPython项目实战》1李宁《计算机视觉OpenCVPython项目实战》2李宁《计算机视觉OpenCVPython项目实战》3上一节课,我们了解了基础环境如何配置,这一节我... 查看详情

python基础语法入门(代码片段)

...课程:李宁《PythonPygame游戏开发入门与实战》李宁《计算机视觉OpenCVPython项目实战》1李宁《计算机视觉OpenCVPython项目实战》2李宁《计算机视觉OpenCVPython项目实战》3上一节课,我们了解了基础环境如何配置,这一节我... 查看详情

pygame入门之环境配置(代码片段)

...课程:李宁《PythonPygame游戏开发入门与实战》李宁《计算机视觉OpenCVPython项目实战》1李宁《计算机视觉OpenCVPython项目实战》2李宁《计算机视觉OpenCVPython项目实战》3前两节和大家一起了解了python的基础,今天我们就来了... 查看详情

pygame入门之环境配置(代码片段)

...课程:李宁《PythonPygame游戏开发入门与实战》李宁《计算机视觉OpenCVPython项目实战》1李宁《计算机视觉OpenCVPython项目实战》2李宁《计算机视觉OpenCVPython项目实战》3前两节和大家一起了解了python的基础,今天我们就来了... 查看详情

tensorflow实战计算机视觉之mnist数据集

计算机视觉方向使用深度学习主要是卷积神经网络,可以参考这篇文章:零基础入门深度学习(4)-卷积神经网络MNIST机器学习入门:http://www.tensorfly.cn/tfdoc/tutorials/mnist_beginners.html卷积神经网络改善MNIST数据集识别准确率M... 查看详情