python机器学习01_机器学习概述

ZackSock ZackSock     2022-12-26     364

关键词:

一、前言

近年来,人工智能一词频繁出现在我们的视野。从深蓝到阿法狗,人工智能已经成为未来趋势。而机器学习又是人工智能的一大重要分支,所以学习机器学习也是一个很好的选择。本系列文章将使用通俗的语言讲解机器学习,并使用scikit-learn模块实现常用的机器学习算法。

二、机器学习

机器学习是从数据中提取知识的科目,它是计算机技术与概率论、统计学等数学理论的结合。简单来说,机器学习就是寻找一个函数。我们给定一个输入,它就可以输出我们想要的内容。我们可以看几个实际的例子。

现在人脸识别、语音识别、自动驾驶等技术都比较热门,我们可以分别看看这三种技术的输入、函数、输出是什么。

对于人脸识别,输入是人脸的图像,输出是这个人的姓名或者其它标识,而函数我们好像无法描述;对于语音识别,输入是声音信号,输出是文字,函数我们同样无法描述;对于自动驾驶,输入是各种传感器的数据,四周的图像等,输出是下一步操作(转方向盘、踩油门、刹车),函数我们依旧无法描述。


可以发现,机器学习通常要找的函数是非常复杂的,这些函数很难描述,也正因为人难以描述,所以需要机器学习。

三、监督学习和非监督学习

3.1、学习方式

我们需要大量的历史数据来驱动寻找函数的过程。根据数据的的不同,我们通常有两种不同的学习方式。分别是监督学习和非监督学习。

对于监督学习,数据需要包含特征值和目标值两个部分。 而对于非监督学习,目标值的存在不是必要的。下面我们用两个例子区分一下监督学习和非监督学习。

3.2、监督学习

假如有一个射箭任务,我们的目标就是命中靶心,经过多次有效练习,我们可以很精准命中靶心。我们可以把这个任务理解为监督学习。

3.3、非监督学习

现在有另外一个任务,有一堆重量分别是10kg、20kg、30kg,单大小一样的铁球混合在一起,让你胡乱用力丢,最后我们可以看到下图的效果:

图中绿色为10kg、蓝色为20kg、黄色为30kg,为了区分

可以发现绿色集中在外圈,蓝色集中在中间,而黄色则离人最近。虽然我们通过肉眼无法知道球的重量,但是通过抛球后的圈,我们可以猜测各个球的重量。

四、机器学习算法

4.1、函数集(function set)

在上面我们提到,机器学习是要寻找一个函数。但是光说寻找一个函数如同大海捞针,无从下手。为了有更明确的目标,我们可以把函数的范围进一步缩小,比如我们假定我们要找的函数形式如下:
y = w x + b y = wx + b y=wx+b
其中x是输入,y是输出,w和b是我们函数的参数。因为不同的w和b可以确定不同函数,所以我们把上面有未知w和b的函数叫函数集。

在确定好函数集后,我们就可以在函数集寻找一个最优的函数(最优的一组w和b)。具体寻找方式会在后面讲解。

4.2、算法

机器学习算法在机器学习中起到了非常重要的作用,在我们确定了使用的算法时,就相当于确定了函数集。之后只需要在函数集中找到最优的函数即可。

各个算法有各自的优点 ,适用不同的任务。因此我们只有熟悉各个算法的特点,才能很好的运用各个算法。

下面是我们会学到的几个算法:

  1. k近邻
  2. 决策树
  3. 随机森林
  4. 朴素贝叶斯
  5. 线性回归
  6. 逻辑回归
  7. 支持向量机
  8. 神经网络
  9. 聚类

这里没有全部列出,后续会详细介绍。今天的内容就分享到这,更多内容可以关注“新建文件夹X”。

01_机器学习简介

...ow。有了基础之后,学习书籍推荐:机器学习(周志华)、Python数据分析与挖掘实战、机器学习系统设计、面向机器智能TensorFlow实践、TensorFlow技术解析与实战。(不建议直接去读) 学习概要:   查看详情

零基础学python--机器学习:人工智能与机器学习概述

@TOC一、机器学习与人工智能、深度学习了解机器学习定义以及应用场景说明机器学习算法监督学习与无监督学习的区别说明监督学习中的分类、回归特点说明机器学习算法目标值的两种数据类型说明机器学习(数据挖掘)的开发流... 查看详情

:机器学习系统概述

 🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃🎁欢迎各位→点赞👍+收藏⭐️+留言&... 查看详情

1_机器学习概述—全流程(代码片段)

...分类方法5scikit-learn算法备忘单(重点)6Ubuntu安装Python37机器学习算法(Top10)8机器学习开发流程8.1数据收集与存储8.1.1机器学习可用公开数据集8.2数据预处理(数据清洗和转换)8.3特征工程8.3.1类型特征转... 查看详情

01-机器学习_(python数据类型详解)

python数据类型详解 目录1、字符串2、布尔类型3、整数4、浮点数5、数字6、列表7、元组8、字典9、日期 1、字符串1.1、如何在Python中使用字符串a、使用单引号(‘)用单引号括起来表示字符串,例如:str=‘thisisstring‘;printstr;... 查看详情

python机器学习笔记(代码片段)

Python机器学习笔记一机器学习概述1.1人工智能概述1.1.1机器学习与人工智能、深度学习关系机器学习和人工智能、深度学习的关系机器学习是人工智能的一个实现途径深度学习是机器学习的一个方法发展而来达特茅斯会议(Da... 查看详情

python机器学习笔记(代码片段)

Python机器学习笔记一机器学习概述1.1人工智能概述1.1.1机器学习与人工智能、深度学习关系机器学习和人工智能、深度学习的关系机器学习是人工智能的一个实现途径深度学习是机器学习的一个方法发展而来达特茅斯会议(Da... 查看详情

1.机器学习概述

Python开发环境以及基本库的安装:    Piplist            什么是机器学习:机器学习是一种能够赋予机器学习的能力,让机器想人一样的去做出决策以此让它完成直接编程... 查看详情

[python]-机器学习python入门《python机器学习手册》-01-向量矩阵和数组

《Python机器学习手册——从数据预处理到深度学习》这本书类似于工具书或者字典,对于python具体代码的调用和使用场景写的很清楚,感觉虽然是工具书,但是对照着做一遍应该可以对机器学习中python常用的这些库有更深入的理... 查看详情

机器学习基础教程笔记---机器学习概述(代码片段)

目录机器学习概述1.1人工智能概述1.1.1机器学习与人工智能、深度学习1.1.2机器学习、深度学习能做些什么1.1.3人工智能阶段课程安排1.2什么是机器学习1.2.1定义1.2.2解释1.2.3数据集构成1.3机器学习算法分类学习目标分析1.2中的例子... 查看详情

机器学习_1:环境搭建

...备介绍一下机器学习的环境搭建。    1、python环境我们使用python作为编程环境,其丰富的库可以帮助我们减少很多负担,关于python版本,2或者3都可以,我们这里选择python2 &nbs 查看详情

机器学习基础教程笔记---机器学习概述(代码片段)

目录机器学习概述1.1人工智能概述1.1.1机器学习与人工智能、深度学习1.1.2机器学习、深度学习能做些什么1.1.3人工智能阶段课程安排1.2什么是机器学习1.2.1定义1.2.2解释1.2.3数据集构成1.3机器学习算法分类学习目标分析1.2中的例子... 查看详情

机器学习算法集成学习-1强学习器的融合学习

..._CSDN博客-数据分析师领域博主目前进度:第四部分【机器学习算法】集成学习*前言引入:我们 查看详情

机器学习入门系列01,introduction简介

我们将要学习什么东东?什么是机器学习?有右边这样非常大的音频数据集,写程序来进行学习,然后可以输出音频“Hello”有右边这样非常大的图片数据集,写程序来进行学习,然后可以识别左边这样图,识别为正确的物种。... 查看详情

『sklearn』机器学习概述

机器学习概述 SKLearn相关模块   老师扯得闲篇  查看详情

阅读宋立恒《ai制胜:机器学习极简入门》第1章:机器学习概述(代码片段)

...建和训练三、机器学习该如何学(一)AI时代首选Python(二)PyCharm可视化编辑器和Anaconda大礼包1、PyCharm 查看详情

python机器学习《机器学习python实践》整理,sklearn库应用详解(代码片段)

TableofContents1  初始1.1  初识机器学习1.2  python机器学习的生态圈1.3  第一个机器学习项目1.3.1  机器学习中的helloworld项目1.3.2  导入数据1.3.3  概述数据1.3.4  数据可视化1.3.5  评估算法1.3.5.1  分离评估数据集1.3.5.2  创... 查看详情

决策树专题_以python为工具python机器学习系列

决策树专题_以python为工具【Python机器学习系列(十一)】文章目录1.关于信息熵的理解2.信息增益3.信息增益比4.基尼指数5.DecisionTreeClassifier()与DecisionTreeRegressor()6.决策树分类-葡萄酒分类_DecisionTreeClassifier7.决策树回归-加... 查看详情