机器学习实战读书笔记——机器学习概览

哈喽喔德 哈喽喔德     2023-03-14     541

关键词:

机器学习的应用示例

  • 分析生产线上的产品图像来对产品进行自动分类
    • 图像分类问题,使用卷积神经网络CNN
  • 通过脑部扫描发现肿瘤
    • 语义分割,图像中的每个像素都需要被分类,也是用CNN
  • 自动分类新闻、恶意评论标记、长文总结
    • 自然语言处理(NLP),更具体的是文本分类,可以使用循环神经网络(RNN)、CNN或者Transformer
  • 基于很多性能指标预测来年收入
    • 回归问题,需要回归模型进行处理,例如线性回归或多项式回归、SVM回归、随机森林回归或i在人工神经网络;如果考虑过去的性能指标,可以使用RNN、CNN或者Transformer
  • 让应用对语音命令做出反应
    • 语音识别,一般使用RNN、CNN或者Transformer处理
  • 检测信用卡欺诈
    • 异常检测
  • 基于客户的购买记录对客户分类,针对每一类客户设定不同的市场策略
    • 聚类问题
  • 基于以前的购买记录给客户推荐可能感兴趣的产品
    • 推荐系统,可以使用人工神经网络训练
  • 为游戏建造智能机器人
    • 通常通过强化学习(RL)解决

机器学习系统的类型

  • 是否在人类的监督下训练
    • 有监督学习
    • 无监督学习
    • 半监督学习
    • 强化学习
  • 是否可以动态地进行增量学习
    • 在线学习
    • 批量学习
  • 是简单的将新数据点和已知数据点进行匹配还是对训练数据进行模式检测然后建立一个预测模型
    • 基于实例的学习
    • 基于模型的学习

有监督学习

在该类学习中,提供给算法的包含所需解决方案的训练集称为标签,分类任务和回归问题是典型的有监督学习。有一些重要的有监督学习算法:

  • K近邻算法
  • 线性回归
  • 逻辑回归
  • 支持向量机SVM
  • 决策树和随机森林
  • 神经网络


无监督学习

无监督学习的训练数据都是未经标记的,有以下重要算法:

  • 聚类算法
  • K均值算法
  • DBSCAN
  • 分类聚类分析HCA
  • 异常检测和新颖性检测
  • 单类SVM
  • 孤立森林
  • 可视化和降维
  • 主成分分析PCA
  • 核主成分分析
  • 局部线性嵌入
  • T分布随机近邻嵌入
  • 关联规则学习
  • Apriori
  • Eclat


半监督学习

由于通常给数据做标记是非常耗时和昂贵的,因此会有很多未标记的数据而很少有已经标记的数据。这称为半监督学习。大部分半监督学习算法是无监督算法和有监督算法的结合。

强化学习

其学习系统能够观察环境、做出选择,执行动作并获得回报。所以必须自行学习什么是最好的策略,从而随着时间的推移获得最大的回报。

批量学习

在批量学习中,系统无法进行增量学习——即必须使用所有可用数据进行训练。因此通常都是离线完成:先训练系统然后投入其生产环境。

如果希望批量学习系统学习新数据,只能在之前的训练数据集的基础上加上新数据重新训练系统的新版本,然后取代旧系统。

在线学习

可用循序渐进的给系统提供训练数据,逐步累积学习成果,这种提供数据的方式可以是单独的,也可以是小批量的小组数据进行训练。在线学习中,模型经过训练并投入生产环境,然后随着新数据的进入而不断学习。

在线学习系统的一个重要参数是其适应不断变化的数据的速度,即学习率。如果学习率过高,系统会迅速适应新数据,但同时会更快忘记旧数据。反过来如果学习率过低,系统会有更高的惰性,面对新数据中的噪声和离群值更不敏感。

基于实例的学习

系统用心学习给好的示例,然后通过使用相似度度量来比较新实例和已经学习的实例(或其子集),从而泛化新实例。

基于模型的学习

从一组示例集中实现泛化的另一种方法就是构建这些示例的模型,然后使用该模型进行预测。

《机器学习实战》读书笔记2:k-近邻(knn)算法

声明:文章是读书笔记,所以必然有大部分内容出自《机器学习实战》。外加个人的理解,另外修改了部分代码,并添加了注释1、什么是K-近邻算法?简单地说,k-近邻算法采用测量不同特征值之间距离的方法进行分类。不恰当... 查看详情

机器学习实战——机器学习概览

机器学习的应用示例分析生产线上的产品图像来对产品进行自动分类图像分类问题,使用卷积神经网络CNN通过脑部扫描发现肿瘤语义分割,图像中的每个像素都需要被分类,也是用CNN自动分类新闻、恶意评论标记、长... 查看详情

《机器学习》读书笔记一序言部分

...考文档:http://www.a-site.cn/article/429982.html《陆汝铃:六问机器学习》  参考文献:《机器学习》---周志华    文章摘自《机器学习》序言部分  在人工智能发展早期,机器学习技术内涵几乎全部是符号学习,从二十世纪... 查看详情

机器学习常见性能指标《机器学习实战》笔记

均方根误差平均绝对误差 查看详情

《机器学习系统设计》读书笔记

1、scipy中的工具包如下:(会用到的有:stats、interpolate、cluster、signal)  查看详情

《python深度学习》第一章读书笔记

...深度学习》读书笔记第一章什么是深度学习1.1人工智能、机器学习与深度学习人工智能的简洁定义:努力将通常由人类完成的智力任务自动化。机器学习与数理统计密切相关。机器学习(尤其是深度学习)呈现出相对较少的数学理论... 查看详情

《机器学习实战》知识点笔记目录

  从今天起,开始学习《机器学习实战》,并记录学习到的知识点。            --2017-12-311,第2章KNN算法笔记_函数classify0  查看详情

视觉机器学习读书笔记--------bp学习

反向传播算法(Back-PropagtionAlgorithm)即BP学习属于监督式学习算法,是非常重要的一种人工神经网络学习方法,常被用来训练前馈型多层感知器神经网络。一、BP学习原理1、前馈型神经网络   是指网络在处理信息时,... 查看详情

机器学习实战笔记-1基础

机器学习基础什么是机器学习机器学习能让我们从数据集中受到启示。换句话说。我们会利用计算机来彰显数据背后的真实含义。简单的说机器学习就是把无序数据转换成实用的信息。关键术语特征(属性):对一类物体我们关心... 查看详情

机器学习实战——机器学习概览

机器学习的应用示例分析生产线上的产品图像来对产品进行自动分类图像分类问题,使用卷积神经网络CNN通过脑部扫描发现肿瘤语义分割,图像中的每个像素都需要被分类,也是用CNN自动分类新闻、恶意评论标记、长... 查看详情

《机器学习》读书笔记-第一章引言

...大学。 第一章引言 1.1学习问题的标准描述: 机器学习的定义:如果一个计算机程序针对某类任务T的用P衡量的性能根据经验E来自我完善,那么我们称这个计算机程序在从E中学习,针对某类任务T,它的性能用P来衡量... 查看详情

视觉机器学习读书笔记--------svm方法

...于分类和回归分析。一、基本原理   SVM是一个机器学习的过程,在高维空间中寻找一个分类超平面,将不同类别的数据样本点分开,使不同类别的点之间的间隔最大,该分类超平面即为最大间隔超平面,对应的分类器... 查看详情

[读书笔记]机器学习:实用案例解析

第8章PCA:构建股票市场指数有监督学习:发掘数据中的结构,并使用一个信号量评价我们在探索真实情况这项工作是否进行得很好。无监督学习:发掘数据中的结构,但没有任何已知答案指导主成分分析(PrincipleComponentsAnalysis,P... 查看详情

[读书笔记]机器学习:实用案例解析

第7章 优化:密码破译优化简介:最优点(optimum),优化(optimization)本章研究的问题:构建一个简单的密码破译系统,把解密一串密文当做一个优化问题。优化方法:网格搜索(gridsearch),主要问题是1、步长的选择;2、... 查看详情

ai圣经prml《模式识别与机器学习》-读书笔记汇总贴

AI圣经PRML《模式识别与机器学习》-读书笔记汇总贴本文章主要来记录学习《PatternRecognitionandMachineLearning》的学习笔记,主要是按照课本的内容来,按照课本的章节一节一节慢慢整理题目,包括后面一些有必要的习题&#... 查看详情

机器学习读书笔记------支持向量机

一、间隔与支持向量   给定训练样本集D={(x1,y1),(x2,y2),...,(xm,ym)},yi∈{-1,+1},分类学习最基本的想法就是基于训练集D在样本空间中找到一个划分超平面,将不同类别的样本分开。在众多划分超平面之间,我们需要找出一... 查看详情

《机器学习实战》学习笔记:logistic回归(代码片段)

欢迎关注WX公众号:【程序员管小亮】【机器学习】《机器学习实战》读书笔记及代码总目录https://blog.csdn.net/TeFuirnever/article/details/99701256GitHub代码地址:https://github.com/TeFuirnever/Machine-Learning-in-Action——————————... 查看详情

《机器学习实战》学习笔记——k近邻算法

1.numpy中一些函数的用法学习shape()用法:shape :tupleofintsTheelementsoftheshapetuplegivethelengthsofthecorrespondingarraydimensions.。  shape返回一个元组,依次为各维度的长度。shape[0]:第一维长度,shape[1]:第二维长度。  tile()用法:numpy.tile 查看详情