机器学习--入门介绍(代码片段)

胜天半月子 胜天半月子     2022-12-23     614

关键词:


两个定义

Machine Learning(机器学习)

定义一:ARTHUR SAMUL

  • 什么是机器学习?

ARTHUR SAMUEL对机器学习的定义:

显著式编程⭐

什么是显著式编程?
举例:我们要编程序让计算机自动区别菊花和玫瑰,如果我们人为的告诉计算机菊花是黄色,玫瑰是红色,所以计算机看到黄色识别为菊花、看到红色识别为玫瑰。

如果我们同时给计算机一堆菊花和玫瑰的图片,然后编写程序让计算机自己去总结菊花和玫瑰的区别,只要我们的程序没有问题,计算机很有可能通过大量的图片,也能总结出菊花是黄色的,玫瑰是红色的这个规律。计算也有可能总结出菊花的花瓣很长、玫瑰的而花瓣很圆等等规律!

我们实现并不越是计算机必须总结什么规律。而是让计算机自己挑出最能区分菊花和玫瑰的一些规律。
让计算机自己总结的规律的编程方法叫做非显著式编程

  • 总结
  • 显著式编程
  • 非显著式编程


我们规定了行为和收益函数后,让计算机自己去找最大化收益函数的行为。
一开始,计算机采用随机化的行为,但是只要程序编的足够好,计算机是可能找到一个最大化收益函数的行为模式的


定义二:Tom Mitshell


  • 举例一



显著式编程是无法达到这一目的的,因为显著式编程定死了程序的输入和输出,识别率不会随着训练样本的增加而变化

  • 举例二

如果程序编写的机器学习程序的足够好,机器人在运行的过程中,收集的行为越多,机器人就可以通过以往的行为和经验进行学习,从而在规定的时间内获得更多的咖啡。




一、机器学习的分类

划分的标准? ==> 经验E

监督学习



我们把告诉计算机每一个训练样本是什么的过程:为训练样本打标签

经验E ==》 训练样本标签的集合

我们把这一类输入计算机训练数据同时加上标签的机器学习称为监督学习(Supervised Learning)

分类一

传统的监督学习

每一个训练数据都有对应的标签

非监督学习

所有的训练数据都没有对应标签

为什么可能通过没有标签的训练数据获得类别信息?

  • 解释


半监督学习⭐⭐

训练数据中一部分有标签一部分没有标签

该领域获得越来越多的关注,是因为随着网络的发展,网络中存在大量的数据,但是标注数据是成本巨大的工作。

  • 举例

分类二

另一种分类是基于标签的固有属性

分类问题

回归问题

标签是连续的数值

分类和回归问题的界限其实是非常模糊的,因为连续和离散问题的定义也是可以相互转换的,一个解决分类问题的机器学习模型稍加改造可以解决回归问题,反之亦然!

强化学习

Reinforcement Learning
让计算机通过与环境的互动逐渐强化自己的行为模式



总结



二、机器学习算法过程

  • 观察数据,总结规律

第一步:特区特征(Feature Extraction)

特征提取:通过训练样本获得的,对机器学习任务有帮助的多维度数据





为什么不重点研究提取特征?
因为不同任务提取特征方式不同,例如图像、语音、点云等,因为不同媒质的属性不同导致提取特征的方式千变万化


第二步:特征选择(Feature Selection)



如何基于两个特征构建算法呢?
支持向量机

  1. 线性内核
  2. 多项式核
  3. 高斯径向基函数核
    (可以简单认为三种不同算法)

把这两个特征组成的二维平面叫做特征空间(Feature Space),如果多个特征,则可以高于二维。

一旦画出这条线,机器学习的过程已经完成了。
因为只要有一个细胞的数据通过特征分析以及落点区域即可判断细胞类别。

维度

人眼对于超过三维的世界缺乏想象力

标准

对某一区域的划分标准不一样的

所以我们不能得出一个绝对意义的好和坏的标准。,
如何针对不同应用场景选择合适的机器学习算法,甚至构造新的机器学习算法解决目前无法解决的应用场景,这是涉及到理论与实践的重要科学问题!


三、没有免费午餐定理

因此没有任何情况下都最好的机器学习算法

  • 举例

对错的概率都是一半







目前流行的机器学习算法都会做这样的预测


道理是从以前的事实中来的
我们可以通过类比推广到未来的预测

  • 总结

不对特征空间的先验分布有假设,所有算法的表现都一样
再好的算法也有犯错的风险
没有放之四海而皆准的最好算法


总结

学习这门课程可以做什么?

  • 人脸识别
  • 五子棋程序对战(强化学习)
  • 性别和年龄识别
  • 水果识别
  • 人脸特征点检测
  • 语种识别
  • 视频行为识别

微软开源的机器学习入门课程(代码片段)

导读微软开源的ML-For-Beginners入门机器学习的课程目前在GitHub上已经有将近15k颗星。课程是专门针对机器学习的入门教程,一共包含了12周24节课程,主要是基于Scikit-learn来介绍的。课程介绍每节课程主要包含了以下几个内... 查看详情

机器学习:从入门到晋级(代码片段)

摘要:什么是机器学习,为什么学习机器学习,如何学习机器学习,这篇文章都告诉给你。目前,人工智能(AI)非常热门,许多人都想一窥究竟。如果你对人工智能有所了解,但对机器学习(MachineLearning)的理解有很多的困惑... 查看详情

机器学习入门三------线性回归(代码片段)

...方法。本模块会先直观介绍线性回归,为介绍线性回归的机器学习方法奠定基础。人们早就知晓,相比凉爽的天气,蟋蟀在较为炎热的天气里鸣叫更为频繁。数十年来,专业和业余昆虫学者已将每分钟的鸣叫声和温度方面的数据... 查看详情

机器学习入门四------降低损失(代码片段)

...失:迭代方法介绍了损失的概念。在本单元中,您将了解机器学习模型如何以迭代方式降低损失。迭代学习可能会让您想到“HotandCold” 查看详情

简单易懂|机器学习如何快速入门?(代码片段)

1 什么是机器学习机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。2 机器学习工作流程1.获取数据2.数据基本处理3.特征工程4.机器学习(模型训练)5.模型评估结果达到要求,上线服务没有达到要... 查看详情

python机器学习入门——科学计算库(numpy)(代码片段)

目录Numpy优势Numpy效率ndarray介绍ndarray与Python原生list运算效率对比N维数组-ndarrayndarray的属性ndarray的形状,ndarray的类型基本操作生成数组的方法生成0和1的数组:生成数组的方法从现有数组生成生成固定范围的数组生成随机数组使用... 查看详情

机器学习入门:多变量线性回归(代码片段)

...的两个小技巧。本文分享自华为云社区《【跟着小Mi一起机器学习吧!】多变量线性回归(一)》,原文作者:Skytier。1 多维特征既然是多变量线性回归,那么肯定是存在多个变量或者多个特征的情况啦。就拿之前研究的线... 查看详情

机器学习入门05——pandas使用(代码片段)

文章目录系列文章5Pandas5.1Pandas介绍5.2Pandas数据结构1Series创建SeriesSeries属性2DataFrame创建DataFrameDataFrame属性重置索引设置某列值为新索引3MultiIndex5.3基本数据操作1索引操作直接操作loc和iloc2赋值操作3排序5.4运算1算数运算2逻辑运算3... 查看详情

python机器学习入门——科学计算库(pandas)(代码片段)

目录Pandas介绍Pandas数据结构SeriesSeries的创建Series的属性DataFrameDataFrame的创建DataFrame的属性DatatFrame索引的设置基本数据操作索引操作赋值操作排序DataFrame排序Series排序DataFrame运算算术运算逻辑运算逻辑运算符号逻辑运算函数统计... 查看详情

markdown机器学习入门(代码片段)

查看详情

人工智能介绍(代码片段)

...,用于比对两个句子的相似性,因此接触了一下机器学习。其中主要是看李宏毅老师的机器学习视频课程。但是机器学习太过于复杂,对于我来说,我估计还没有入门,只是看到机器学习这个大殿。这篇文章&#... 查看详情

机器学习svm算法入门(代码片段)

目录1SVM算法简介1.1SVM算法导入1.2SVM算法定义1.2.1定义1.2.2超平面最大间隔介绍1.2.3硬间隔和软间隔1.2.3.1硬间隔分类1.2.3.2软间隔分类1.3小结2SVM算法api初步使用1SVM算法简介1.1SVM算法导入在很久以前的情人节,大侠要去救他的爱... 查看详情

3天快速入门python机器学习(黑马xxx)(代码片段)

目录一、机器学习概述1.1人工智能概述1.1.1介绍1.1.2机器学习、深度学习能做些什么1.1.3人工智能阶段课程安排1.2什么是机器学习1.2.3数据集构成1.3机器学习算法分类1.3.1分类1.3.2小练习1.3.3机器学习算法分类1.4机器学习开发流程1.5... 查看详情

spark学习10_1sparkmllib入门与相关资料索引(代码片段)

...eans聚类算法SVM算法其他算法实例的文件目录位置资料Spark机器学习库(MLlib)中文指南关于spark机器学习的知乎专栏Spark入门实战系列--8.SparkMLlib(上)--机器学习及SparkMLlib简介基本Kmeans算法介绍及其实现sparkMLlib概念1:相关系数... 查看详情

tensorflow简明入门教程(代码片段)

通过实践教程体验Google开源机器学习库的强大功能。机器学习不能在热了,有几个重量级的针对经验丰富的数据科学家和对神经网络感兴趣的新手平台。TensorFlow是其中之一,TensorFlow是Google一年前开源的一个机器学习库。在这篇... 查看详情

深度学习入门案例波士顿房价预测(代码片段)

人工智能,机器学习,深度学习做个简单介绍:三者的关系如图1所示,即:人工智能>机器学习>深度学习。深度学习设计框架:环境查看importpaddleimportnumpyasnpimportosimportmatplotlibimportmatplotlib.pyplotaspltimpor... 查看详情

波士顿房价预测——机器学习入门级案例(代码片段)

一、数据处理1.1数据集介绍本实验使用波士顿房价预测数据集,共506条样本数据,每条样本包含了13种可能影响房价的因素和该类房屋价格的中位数,各字段含义如下表所示:字段名类型含义CRIMfloat该镇的人均犯... 查看详情

机器学习入门机器学习简介|附加小练习(代码片段)

目录1.机器学习是什么2.机器学习、深度学习和人工智能的区别与联系3.机器学习的应用4.机器学习分类4.1监督学习4.2无监督学习4.3半监督学习4.4强化学习5.小练习5.1第一题5.2第二题5.3第三题1.机器学习是什么用老师上课的一张图我... 查看详情