machinelearning——unsupervisedlearning(机器学习之非监督学习)

author author     2022-08-29     804

关键词:

  前面,我们提到了监督学习,在机器学习中,与之对应的是非监督学习。无监督学习的问题是,在未加标签的数据中,试图找到隐藏的结构。因为提供给学习者的实例是未标记的,因此没有错误或报酬信号来评估潜在的解决方案。这区别于监督学习和强化学习无监督学习。
  无监督学习是密切相关的统计数据密度估计的问题。然而无监督学习还包括寻求,总结和解释数据的主要特点等诸多技术。在无监督学习使用的许多方法是基于用于处理数据的数据挖掘方法。
  我们来看两张图片:
                                                                        技术分享技术分享
  从图中我们可以看到:非监督学习中没有任何的标签或者是有相同的标签或者就是没标签。所以我们已知数据集,却不知如何处理,也未告知每个数据点是什么。别的都不知道,就是一个数据集。针对数据集,无监督学习就能判断出数据有两个不同的聚集簇。 这是一个,那是另一个,二者不同。无监督学习算法可能会把这些数据分成两个不同的簇。所以叫做聚类算法。事实证明,它能被用在很多地方。
  聚类应用的一个例子就是在百度新闻中。如果你以前从来没见过它,你可以到这个 URL 网址http://news.baidu.com/去看看。百度新闻每天都在,收集非常多,非常多的网络的新闻内容。 它再将这些新闻分组,组成有关联的新闻。所以百度新闻做的就是搜索非常多的新闻事件, 自动地把它们聚类到一起。所以,这些新闻事件全是同一主题的,所以显示到一起。
                                                                              技术分享
从这张网页截图中可以看到,百度新闻收集了大量的新闻,然后把他们聚成不同的类,例如:房产,互联网......在每个大类(大标签)下,又聚成了不同的小类。
  我们再看一个例子:一个 DNA 微观数据的例子。
                                                                                          技术分享
其基本思想是输入一组不同个体,对其中的每个个体,你要分析出它们是否有一个特定的基因。技术上,你要分析多少特定基因已经表达。所以这些颜色,红,绿,灰等等颜色,这些颜色展示了相应的程度,即不同的个体是否有着一个特定的基因。你能做的就是运行一个聚类算法,把个体聚类到不同的 类或不同类型的组(人)……
  所以这个就是无监督学习,因为我们没有提前告知算法一些信息,比如,这是第一类的人,那些是第二类的人,还有第三类,等等。我们只是说,这是有一堆数据。我不知道数据里面有什么,我不知道谁是什么类型,我甚至不知道人们有哪些不同的类型,这些类型又是什么。但你能自动地找到数据中的结构吗?就是说你要自动地聚类那些个体到各个类,我没法提前知道哪些是哪些。因为我们没有给算法正确答案来回应数据集中的数据,这就是无监督学习。

machinelearning

MachinelearningPrefaceDefinitionT:TaskE:ExperienceP:PerformanceSequence:T->E->PSupervisedlearningDefinitionGivetherightanswertoeachexampleofthedataset(calledtrainingdata).TypeRegression:gettheco 查看详情

machinelearning-basics

  近几年来热门的神经网络(NeuralNetwork)和深度学习(DeepLearning)是机器学习(MachineLearning)的分支.在计算机科学的定义中,学习可以理解为:"Acomputerprogramissaidtolearnfrom experienceEwithrespecttosomeclassoftasksTandperformancemeasure  查看详情

machinelearning-第7周

SVMsareconsideredbymanytobethemostpowerful‘blackbox‘learningalgorithm,andbyposingacleverly-chosenoptimizationobjective,oneofthemostwidelyusedlearningalgorithmstoday.SupportVectorMachinesLargeMarginCla 查看详情

machinelearning第十一周笔记:photoocr

...Marcovaldo’sblog(http://marcovaldong.github.io/)刚刚完毕了Cousera上MachineLearning的最后一周课程。这周介绍了machinelearning的一个应用:photoOCR(optimalcharacterrecognition,光学字符识别),以下将笔记整理在以下。PhotoOCRProblemDescriptiona 查看详情

machinelearning(带修莫队)(代码片段)

MachineLearning区间出现次数的mex用桶暴力求mex#pragmaGCCoptimize(2)#pragmaGCCoptimize(3,"Ofast","inline")#include<bits/stdc++.h>#defineintlonglong#definefifirst#definesesecond#definep 查看详情

machinelearning课堂笔记之modelandcostfunction

   查看详情

noteforcoursera《machinelearning》1|whatismachinelearning?

WhatisMachineLearning?TwodefinitionsofMachineLearningareoffered.ArthurSamueldescribeditas:"thefieldofstudythatgivescomputerstheabilitytolearnwithoutbeingexplicitlyprogrammed."Thisisanolder,informaldef 查看详情

跟google学machinelearning[1]

时至今日,我才发现machineLearning的应用门槛已经被降到了这么低,简直唾手可得。我实在找不到任何理由不对它进入深入了解。如标题,感谢Google为这项技术发展作出的贡献。当然,可能其他人做了99%,Google只做了1%,我想说,真... 查看详情

machinelearning学习笔记———modelandcostfunction

ModelandCostFunctionModelRepresentation|模型表示Toestablishnotationforfutureuse,we’lluse(x^{(i)})todenotethe“input”variables(livingareainthisexample),alsocalledinputfeatures,and(y^{(i)})todenotethe“ou 查看详情

导航-机器学习(machinelearning)

1逻辑回归2决策树3支持向量机4提升方法5聚类准备在近期复习巩固一下基本机器学期算法的原理和实现,写一些笔记,方便以后自己回顾。1逻辑回归(1)理论推导(2)python实现 查看详情

machinelearning之logisticregression

整理自AdrewNg的machinelearning课程week3 目录:二分类问题模型表示decisionboundary损失函数多分类问题过拟合问题和正则化什么是过拟合如何解决过拟合正则化方法 1、二分类问题什么是二分类问题?垃圾邮件/非垃圾邮件?诈骗... 查看详情

machinelearning

一、ReinforcementLearning强化学习  抛弃人类经验”和“自我训练”并非AlphaGoZero最大的亮点,其关键在于采用了新的reinforcementlearning(强化学习的算法),并给该算法带了新的发展。AlphaGoZero仅拥有4个TPU,零人类经验,其自我训... 查看详情

stp494/stp598:machinelearning

PredictingthePriceofRoundCutDiamondsSTP494/STP598:MachineLearningIntroduction1Data1DataSource.................................................1DataPreparation.......................................... 查看详情

machinelearning|andrewng|coursera吴恩达机器学习笔记

Week1:MachineLearning: AcomputerprogramissaidtolearnfromexperienceEwithrespecttosomeclassoftasksTandperformancemeasureP,ifitsperformanceattasksinT,asmeasuredbyP,improveswithexperienceE. Supe 查看详情

machinelearning—监督学习与非监督学习

斯坦福大学的MachineLearning课程(讲师是AndrewNg)公开课是学习机器学习的“圣经”,以下内容是听课笔记。一、何谓机器学习MachineLearningisfieldofstudythatgivescomputerstheabilitytolearnwithoutbeingexplicitlyprogrammed.也就是说机器学习不需要制定... 查看详情

goodreads:machinelearning(part3)

Inthe firstinstallment ofthisseries,wescrapedreviewsfromGoodreads.Inthesecondone,weperformedexploratorydataanalysisandcreatednewvariables.Wearenowreadyforthe“maindish”:machinelea 查看详情

pythonai-machinelearning-program3(代码片段)

查看详情

这就是machinelearning(代码片段)

...英文课。对于我们计算机科学与技术方向来说,就是MachineLearning、DistributedSystemandParallelComputing和FundamentalsofImageAnalysis选 查看详情