sklearn|学习总结

ykit ykit     2023-04-15     247

关键词:

1 简介

scikit-learn,又写作sklearn,是一个开源的基于python语言的机器学习工具包。它通过NumPy, SciPy和Matplotlib等python数值计算的库实现高效的算法应用,并且涵盖了几乎所有主流机器学习算法
 
SKlearn官网:http://scikit-learn.org/stable/index.html
 

2 SKlearn 常用模块

sklearn中常用的模块有预处理、分类、回归、聚类、降维、模型选择。

 

预处理(Preprocessing):特征提取和归一化

常用的模块有:preprocessing,feature extraction

常见的应用有:把输入数据(如文本)转换为机器学习算法可用的数据。

 

分类(Classification):识别某个对象属于哪个类别

常用的算法有:SVM(支持向量机)、nearest neighbors(最近邻)、random forest(随机森林)

常见的应用有:垃圾邮件识别、图像识别。

 

回归(Regression):预测与对象相关联的连续值属性

常见的算法有:SVR(支持向量机)、 ridge regression(岭回归)、Lasso

常见的应用有:药物反应,预测股价。

 

聚类(Clustering):将相似对象自动分组

常用的算法有:k-Means、 spectral clustering、mean-shift

常见的应用有:客户细分,分组实验结果。

 

降维(Dimensionality Reduction):减少要考虑的随机变量的数量

常见的算法有:PCA(主成分分析)、feature selection(特征选择)、non-negative matrix factorization(非负矩阵分解)

常见的应用有:可视化,提高效率。

 

模型选择(Model Selection):比较,验证,选择参数和模型

常用的模块有:grid search(网格搜索)、cross validation(交叉验证)、 metrics(度量)

它的目标是通过参数调整提高精度。

 

附:算法选择路径

 
技术图片
 
 
 
 
 
——————————————————
本文仅用于学习
内容来自 https://www.jianshu.com/p/4e11af8d7c78

sklearn监督学习(代码片段)

本系列博文是根据SKlearn的一个学习小结,并非原创!                     1.直接学习TensorFlow有点不知所措,感觉需要一些基础知识做铺垫。                     2.之前机... 查看详情

机器学习实战基础(十六):sklearn中的数据预处理和特征工程特征选择之filter过滤法总结

 过滤法总结到这里我们学习了常用的基于过滤法的特征选择,包括方差过滤,基于卡方,F检验和互信息的相关性过滤,讲解了各个过滤的原理和面临的问题,以及怎样调这些过滤类的超参数。通常来说,我会建议,先使用... 查看详情

ubuntu14下auto-sklearn安装调试总结

...运用为主,原理之后空了再深究2.原理篇2.1什么是auto-sklearn图1:Auto-sklearn框架结构(图摘自2015年的论文,此时只支持分类,现在的版本添加了回归)Auto-sklearn是一个自动化机器学习框架,结构如图1所... 查看详情

ubuntu14下auto-sklearn安装调试总结

...运用为主,原理之后空了再深究2.原理篇2.1什么是auto-sklearn图1:Auto-sklearn框架结构(图摘自2015年的论文,此时只支持分类,现在的版本添加了 查看详情

机器学习sklearn----初识kmeans(代码片段)

文章目录概述KMeans中几个概念KMeans工作过程KMeans使用示例导入相关模块生成原始数据通过KMeans分类KMeans常用属性分类结果展示KMeans中的predict方法总结概述KMeans是一种无监督学习的方法。他是一种分类算法。用于探索原始数据ÿ... 查看详情

机器学习基础一文带你用sklearn做特征工程(代码片段)

使用sklearn做特征工程特征工程是什么?有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度... 查看详情

sklearn机器学习基础(day02基础入门篇)(代码片段)

文章目录基本算法使用(Sklearn)算子API调用分步曲数据分析分步曲分类算法KNN算法网格优化KNN案例(预测facebook签到位置)数据清洗KNN处理预测完整代码朴素贝叶斯算法决策树案例可视化决策树随机森林回归与聚类算... 查看详情

sklearn—总结

fromsklearnimportdatasetsimportmatplotlib.pyplotaspltimportmatplotlib.patchesaspchimportpandasaspdimportlxmlir=datasets.load_iris()#加载iris数据集x=ir.data[:,0]#萼片长数据y=ir.data[:,1]#萼片宽数据species=ir.target#分 查看详情

gbdt总结文档

...理解。GBDT的用途,优势GBDT的结构和算法流程GBDT如何训练Sklearn的GBDT使用,参数意义 GBDT的用途,优势:GBDT(GradientBoostingDecisionTree)又叫MART(MultipleAdditiveRegre 查看详情

sklearn库学习----逻辑回归(logisticregression)使用详解(代码片段)

文章目录为什么需要逻辑回归重要参数penalty参数示例L1,L2的效果对比处理多多分类问题总结为什么需要逻辑回归逻辑回归是由线性回归演变而来的一个分类算法,所以说逻辑回归对数据的要求比较高。对于分类器来说&#x... 查看详情

机器学习线性回归 - Sklearn

】机器学习线性回归-Sklearn【英文标题】:MachineLearninglinerRegression-Sklearn【发布时间】:2019-08-0110:31:17【问题描述】:我是机器学习领域的新手,在学习回归方面我有一些疑问1:在练习sklearn学习回归模型预测方法时出现以下错误... 查看详情

预处理数据的方法总结(使用sklearn-preprocessing)(代码片段)

预处理数1.标准化:去均值,方差规模化Standardization标准化:将特征数据的分布调整成标准正太分布,也叫高斯分布,也就是使得数据的均值维0,方差为1.标准化的原因在于如果有些特征的方差过大,则会主... 查看详情

『sklearn』机器学习概述

机器学习概述 SKLearn相关模块   老师扯得闲篇  查看详情

sklearn学习笔记

主要记python工具包sklearn的学习内容:链接点击这里。一、Regression  1.1.GeneralizedLinearModels  1.2.LinearandQuadraticDiscriminantAnalysis  1.3.Kernelridgeregression 二、Classification三、Clustering四、Dimensionalityreduction五、 查看详情

『sklearn』学习器设计

机器学习问题是一个搜索优化问题 思路实例——人工智能西洋棋学习器   查看详情

sklearn学习笔记之开始

...kit-learn已经成为Python重要的机器学习库了。scikit-learn简称sklearn,支持包括分类、回归、降维和聚类四大机器学习算法。还包含了特征提取、数据处理和模型评估三大模块。??sklearn是Scipy的扩展,建立在NumPy和matplotlib库的基础上。... 查看详情

机器学习sklearn库浅学习(代码片段)

目录一.sklearn简介(1)介绍:(2)Scikit-learn(sklearn)特点:(3)通用学习模式:二.数据集与数据预处理(1)数据集(sklearn.datasets)(2)常 查看详情

sklearn学习笔记3

ExplainingTitanichypothesiswithdecisiontreesdecisiontreesareverysimpleyetpowerfulsupervisedlearningmethods,whichconstructsadecisiontreemodel,whichwillbeusedtomakepredictions.Themainadvantageofthismode 查看详情