python深度学习之路-4监督学习(代码片段)

Vax_Loves_1314 Vax_Loves_1314     2022-11-24     765

关键词:

【Python深度学习之路】-4 监督学习

4.1 了解监督学习(分类)

  1. 监督学习:根据积累的经验数据对新的数据或将来的数据进行预测,或者进行分类的一种学习方式。

  2. 无监督学习:对积累的经验数据中所存在的结构,以及关联性进行分析的学习方式。

  3. 强化学习:通过设定报酬、环境等条件来实现学习效果最大化的一种学习方式。

  4. 监督学习的分类:

    • 回归:通过读取现存数据中的关联性,并根据这些关联性来实现数据预测的一种算法。(针对连续性的值)
    • 分类:以数据预测为目的对离散值进行预测。
  5. 二分分类与多元分类

    • 二元分类:又叫二值分类,二项分类。二元分类是指分类的类别有两种的分类问题。它可以对数据是“属于/不属于”两个分组中哪一组的问题进行判断。此外,如果能够用直线对类别进行划分,就称为“线性分类”,否者,就是“非线性分类”。
    • 多元分类:又叫多项分类。多数情况下无法用直线对类别进行分类,分类的类别有三种及以上。
  6. 分类的流程:

    1. 数据的预处理,数据的整理、操作;
    2. 模型的选取,分类器的选择;
    3. 模型的训练 :选择超参数进行调校,参数的调校;
    4. 使用模型进行预测(推理):使用未知数据对模型的精读进行检验,将模型嵌入到Web服务等实际应用中。
  7. 数据的准备 使用scikit-learn.datasets模块的make_classification()函数

# 导入需要使用的模块
from sklearn.datasets import make_classification

# 创建数据X和标签y
X, y = make_classification(n_sample=xx, n_classes= xx, n_features = xx, n_redundant=xx, random_state=xx)
  • n_sample:需要准备的数据的数量。
  • n_classes:分类数量。如果不指定,默认值为2。
  • n_features:数据的特征量的个数。
  • n_redundant: 分类时不需要的特征量(额外的特征量)的个数。
  • random_state:随机数的种子(决定随机数生成规律的因素)
  1. Classifier虚构分类器:
# 导入需要使用的模块
# 以模型为单位进行模块的导入
from sklearn.linear_model import LogisticRegression
from sklearn.svm import LinearSVC,SVC
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier

# 构建模型
model = Classifier()  # Classifier()需要更换为实际的模型
# 对模型进行训练

model.fit(train_X,train_y)

# 使用模型对数据进行预测
model.predict(test_X)

# 模型的准确率
# 准确率是使用(模型预测的分类与实际的分类相同的数据的数量)/(数据的总数量)公式计算出来的
model.score(test_X,test_y)

Classifier()举例:

from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.datasets import make_classification

# 创建数据X和标签y
X, y = make_classification(n_samples=100,  n_features = 2, n_redundant=0, random_state=42)

# 将数据划分为用于学习的部分和用于评估的部分
train_X, test_X, train_y, test_y = train_test_split(X, y, random_state=42)

# 构建模型
model = LogisticRegression(random_state=42)

# 对模型进行训练
model.fit(train_X,train_y)

# 使用模型对数据进行预测
model.predict(test_X)

# 模型的准确率
# 准确率是使用(模型预测的分类与实际的分类相同的数据的数量)/(数据的总数量)公式计算出来的
model.score(test_X,test_y)

python深度学习之路-2.1机器学习的流程(代码片段)

2.1机器学习的流程简介进行机器学习的整体流程:数据收集。数据清洗(清洗重复或缺失的数据,以提高数据的精读)。运用机器学习算法对数据进行学习(获取基准)。使用测试数据进行性能评测。将机... 查看详情

python深度学习之路-1机器学习概论

【Python深度学习之路】-1机器学习概论1.1机器学习简介机器学习火热的原因是:人类无论如何也做不到在短时间内实现从大量数据中自动地计算出正确结果的操作。所谓机器学习:通过对数据进行反复的学习,来找出... 查看详情

python深度学习之路-1机器学习概论

【Python深度学习之路】-1机器学习概论1.1机器学习简介机器学习火热的原因是:人类无论如何也做不到在短时间内实现从大量数据中自动地计算出正确结果的操作。所谓机器学习:通过对数据进行反复的学习,来找出... 查看详情

python深度学习之路-1机器学习概论

【Python深度学习之路】-1机器学习概论1.1机器学习简介机器学习火热的原因是:人类无论如何也做不到在短时间内实现从大量数据中自动地计算出正确结果的操作。所谓机器学习:通过对数据进行反复的学习,来找出... 查看详情

python深度学习之路-2.1机器学习的流程(代码片段)

2.1机器学习的流程简介进行机器学习的整体流程:数据收集。数据清洗(清洗重复或缺失的数据,以提高数据的精读)。运用机器学习算法对数据进行学习(获取基准)。使用测试数据进行性能评测。将机... 查看详情

吴恩达深度学习笔记(代码片段)

监督学习简介文章目录监督学习简介前言一、监督学习常见应用二、基础知识1.数据类型2.学习次序3.常用符号4.二分分类(logistics)5.梯度下降法6.导数和流程图(略)7.logistics中的梯度下降7.向量化的必要性8.向量... 查看详情

python深度学习之路-3.1性能评价指标(代码片段)

1.理解混淆矩阵所谓混淆矩阵,是指将模型对各个测试数据的预测结果分为真阳性、真阴性、假阳性和假阴性并对符合各个观点的预测结果的数量进行统计的一种表格。其中,真阳性和真阴性表示机器学习模型的回答是正... 查看详情

深度学习基础——基本概念和术语整理(代码片段)

...目录1.人工智能(AI)、机器学习(ML)和深度学习(DL)1.1人工智能1.2机器学习1.3深度学习1.4人工智能、机器学习和深度学习的关系2监督学习与无监督学习3.深度神经网络(deepneuralnetworks,DNN)4... 查看详情

[人工智能-深度学习-54]:什么是非监督式学习以及常见的非监督式学习的模式(代码片段)

..._文火冰糖的硅基工坊_CSDN博客本文网址:[人工智能-深度学习-54]:什么是非监督式学习以及常见的非监督式学习的模式_文火冰糖(王文兵)的博客-CSDN博客目录第1章机器学习的种类第2章监督学习(Supervisedlearning)第... 查看详情

python深度学习之路时间序列数据(代码片段)

1.datetime类型对于时间序列数据进行处理时,需要使用表示时间的方法。在P樱桃红中提供了datetime数据类型来对日期和实践进行处理。指定datetime。datetime(年,月,日,时,分,秒,毫秒),将返回包... 查看详情

半监督学习总结(代码片段)

半监督学习Semi-supervisedLearning简介半监督深度学习无标签数据预训练,有标签数据微调利用从网络得到的深度特征来做半监督算法MakeNetworkworkinsemi-supervisedfashionPseudo-Label:TheSimpleandEfficientSemi-SupervisedLearningMethodforDeepNeuralNetwor 查看详情

半监督学习总结(代码片段)

半监督学习Semi-supervisedLearning简介半监督深度学习无标签数据预训练,有标签数据微调利用从网络得到的深度特征来做半监督算法MakeNetworkworkinsemi-supervisedfashionPseudo-Label:TheSimpleandEfficientSemi-SupervisedLearningMethodforDeepNeuralNetwor 查看详情

深度学习必知概念(代码片段)

...之外的其他机器学习形式评估机器学习模型的规范流程为深度学习准备数据特征工程解决过拟合处理机器学习问题的通用流程机器学习4个分支监督学习supervisedlearning最常见的机器学习类型。给定一组样本(通常是人工标准&#x... 查看详情

python深度学习之路产生随机数(代码片段)

随机数的生成1.设置种子计算机是根据被称为“种子(seed)”的数据来生成随机数的。所谓种子,是指在生成随机数的过程中所使用的初始值,如果种子的值固定不变,生成的随机数序列也是不变的。通过使用相同的随... 查看详情

机器学习入门机器学习简介|附加小练习(代码片段)

目录1.机器学习是什么2.机器学习、深度学习和人工智能的区别与联系3.机器学习的应用4.机器学习分类4.1监督学习4.2无监督学习4.3半监督学习4.4强化学习5.小练习5.1第一题5.2第二题5.3第三题1.机器学习是什么用老师上课的一张图我... 查看详情

《异常检测——从经典算法到深度学习》15通过无监督和主动学习进行实用的白盒异常检测(代码片段)

《异常检测——从经典算法到深度学习》0概论1基于隔离森林的异常检测算法2基于LOF的异常检测算法3基于One-ClassSVM的异常检测算法4基于高斯概率密度异常检测算法5Opprentice——异常检测经典算法最终篇6基于重构概率的VAE异常检... 查看详情

机器学习之基础知识(全)(代码片段)

...1.2.3小结1.3人工智能主要分支1.3.1 人工智能、机器学习和深度学习1.3.2主要分支介绍1.3.3人工智能发展必备三要素1.3.4拓展:GPU和CPU对比1.4机器学习工作流程1.4.1什么是机器学习1.4.2机器学习工作流程1.4.3获取到的数据集介绍1.4.... 查看详情

pytorch深度学习50篇·······第三篇:非监督学习(代码片段)

兄弟萌,我咕里个咚今天又杀回来了,有几天时间可以不用驻场了,喜大普奔,终于可以在有网的地方码代码了,最近驻场也是又热又心累啊,抓紧这几天,再更新一点的新东西。今天主要讲一下非监... 查看详情