机器学习 - 概念/建议

     2023-03-13     212

关键词:

【中文标题】机器学习 - 概念/建议【英文标题】:Machine-Learning - Concept / Recommendations 【发布时间】:2014-09-13 19:41:32 【问题描述】:

您好,我是机器学习的新手,因此正在寻找文本分类解决方案。有人可以向我推荐一个用 java 编写的不错的框架吗?我考虑过使用 WEKA,但也听说过 MALLET。哪个更好,主要区别在哪里?

我的目标是对未标记的文本进行分类。因此,我准备了大约 18 个主题和每个主题 100 篇文字供学习。

你会建议做什么?也希望有一个很好的小例子或提示如何继续。

【问题讨论】:

要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是题外话,因为它们往往会吸引固执己见的答案和垃圾邮件。相反,请描述问题以及迄今为止为解决该问题所做的工作。 【参考方案1】:

你有一个非常小的文本数据集,你可以使用任何库——这并不重要。更高级的选项将需要比您有意义的更多数据,因此这不是一个值得考虑的问题。处理文本分类问题的简单方法是使用Bag of Words 模型和线性分类器。 Weka 和 MALLET 都支持这一点。

就我个人而言,我发现 Weka 很痛苦,而 MALLET 记录不充分/已经过时,所以我使用 JSAT。有一个做垃圾邮件分类的例子here。

(偏见警告,我是 JSAT 的作者)。

【讨论】:

非常感谢您的回复。我将看看JSAT。你会说什么,分钟是多少。文本数据集充分学习? 它总是取决于问题。【参考方案2】:

由于您的任务相当简单,而且您提到您是 ML 的新手,因此我建议您使用 weka,因为它易于使用并且拥有庞大的用户社区。​​p>

否则,您可以查看一些 Java 中的通用机器学习框架:

Datumbox - 用于快速开发机器学习和统计应用程序的机器学习框架 ELKI - 用于数据挖掘的 Java 工具包。 (无监督:聚类、异常值检测等) H2O - 支持对存储在 HDFS 中的数据进行分布式学习的 ML 引擎。 htm.java - 使用 Numenta 的皮层学习算法的通用机器学习库 java-deeplearning - 适用于 Java、Clojure、Scala 的分布式深度学习平台 JAVA-ML - 通用 ML 库,具有适用于 Java 中所有算法的通用接口 JSAT - 用于分类、回归和聚类的大量机器学习算法。 Mahout - 分布式机器学习 Meka - 多标签分类和评估方法的开源实现(Weka 的扩展)。 Apache Spark 中的 MLlib - Spark 中的分布式机器学习库 Neuroph - Neuroph 是轻量级 Java 神经网络框架 ORYX - 简单的实时大规模机器学习基础架构。 RankLib - RankLib 是一个学习排名算法的库 RapidMiner - RapidMiner 集成到 Java 代码中 Stanford 分类器 - 分类器是一种机器学习工具,它将获取数据项并将其放入 k 个类别中的一个。 WalnutiQ - 人脑的面向对象模型 Wek​​a - Weka 是用于数据挖掘任务的机器学习算法集合

来源:Awesome Machine Learning

【讨论】:

机器学习|机器学习概念理解与基本知识

机器学习概念理解与基本知识1、机器学习是什么在数据上通过算法总结出规律模式,应用在新数据上做预测。2、机器学习基本概念2.1、不同类型的问题监督学习:分类问题(选择)、回归问题(计算)无监督学习:聚类问题(... 查看详情

机器学习概念

 机器学习概念:机器学习是一门从数据中研究算法的科学学科。机器学习直白来讲,是根据已有的数据,进行算法选择,并基于算法和数据构建模型,最终对未来进行预测。来看看大佬对机器学习的定义吧,美国卡内基梅隆... 查看详情

andrewng机器学习课程笔记之应用机器学习的建议

AndrewNg机器学习课程笔记(五)之应用机器学习的建议版权声明:本文为博主原创文章,转载请指明转载地址http://www.cnblogs.com/fydeblog/p/7368472.html 前言学习了AndrewNg课程,开始写了一些笔记,现在写完第5章了,先把这5章的内... 查看详情

机器学习的基本概念[更新]

1.传统算法与机器学习的区别机器学习:让机器去学习  传统算法:让机器去执行2.人类学习的过程人类的学习过程是一个典型的经验学习的过程。3.机器学习的过程机器学习的过程和人类学习的过程是极为相似的。 &nb... 查看详情

000机器学习的概念原理

一:机器学习之间的关系1.人工智能,机器学习,深度学习  下面是一个历史发展,也是一个包含的关系。   2.人工智能  像人一样思考,像人一样行动。、  下面是所包含的部分。   3.机器学习  重要的是... 查看详情

机器学习——概念

机器学习的大概概念你们可以上百度查找—https://baike.baidu.com/item/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/217599?fr=aladdin 我当初学机器学习的时候用的是jupyterlab安装jupyterlabpipinstall-ihttps://pypi.tuna.tsinghua.edu.cn/simp 查看详情

machinelearning-机器学习概念篇

一、何为机器学习   对于没有了解过机器学习的人来说,机器学习是很神秘的,如果只是按照字面意思来理解可能会认为是机械性的学习,认为是一种概念,当然这个名称也是有误导性的。在不了解机器学习前&... 查看详情

斯坦福2014机器学习笔记一----基本概念

  一、纲要    机器学习的定义    监督学习(supervisedlearning)和无监督学习(unsupervisedlearning)    回归问题(regressionproblem)与分类问题(classificationproblem)    鸡尾酒宴问题    单变量线性回归问题   二... 查看详情

机器学习概念_2

降低损失:减少模型预测和标签之间的误差迭代方法:在训练机器学习模型时,首先对权重和偏差进行初始猜测,然后反复调整这些猜测,直到获得损失可能最低的权重和偏差为止  查看详情

机器学习的基本概念

目录机器学习定义基本概念机器学习之常见应用框架机器学习、数据分析、数据挖掘区别与联系机器学习分类【重要】机器学习开发流程【重要】机器学习之商业场景  一、机器学习定义MachineLearning(ML)isascientificdisciplinetha... 查看详情

machinelearn机器学习及其基础概念简介

机器学习及其基础概念简介作者:白宁超2016年12月23日21:24:51摘要:随着机器学习和深度学习的热潮,各种图书层出不穷。然而多数是基础理论知识介绍,缺乏实现的深入理解。本系列文章是作者结合视频学习和书籍基础的笔记... 查看详情

机器学习初探——机器学习的基本概念

机器学习机器学习研究的主要内容:使计算机从数据中产生“模型”的算法。机器学习的基本术语我们认为将一组数据可以抽象画表示为一个向量Xi,D={X1,X2,X3..Xm}表示包含m个示例的数据集,每一个Xi是由一系列属性描述所构成的... 查看详情

机器学习的基本概念

目录机器学习定义基本概念机器学习之常见应用框架机器学习、数据分析、数据挖掘区别与联系机器学习分类【重要】机器学习开发流程【重要】机器学习之商业场景??一、机器学习定义MachineLearning(ML)isascientificdisciplinethatdealswith... 查看详情

机器学习

1、基本概念:训练集,测试集,特征集,非监督学习,半监督学习,分类,回归2、概念学习:概念学习是指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数。3、小例子    概念定义在实例(instance)... 查看详情

机器学习入门-基本概念

1、机器学习分为监督学习和非监督学习。首先学习监督学习。2、标签,即y值,结果,以通过机器学习过滤垃圾邮件为例,标签为邮件是垃圾邮件,或不是垃圾邮件3、特征,即x值,输入变量,通常有多个特征,如根据发件人、... 查看详情

深度学习,机器学习所涵盖的100多个基本概念总结

目录一、基础算法二、经典算法三、机器学习四、优化算法五、特殊技巧 查看详情

机器学习概念

机器学习就是把无序的数据转换成实用的信息。机器学习的主要任务就是分类,通过通过训练数据训练算法,终于能够将实际的数据分到合适的类别中监督学习算法:预測目标变量的值k-means算法。线性回归朴素贝叶斯算法,局... 查看详情

机器学习基础概念笔记

...见算法:K-均值、最大期望算法、DBSCAN、Parzen窗设计 机器学习应用步骤:收集数据——准备输入数据——分析输入数据 查看详情