机器学习的建议

megachen megachen     2023-01-20     327

关键词:

机器学习的建议

开始设计一个机器学习系统

  • 在刚刚开始入手一个机器学习项目的时候, 应该着手于如何将快速实现机器学习算法, 并立刻使用交叉验证的数据集合进行验证, 计算出损失值(J_cv), 而不是在一开始设计的时候就考虑很多的因素, 比如是否需要更多的特征, 或者需要更多的样本, 实际上, 在没有一个已经实现了的机器学习算法的情况下, 是否需要更多的特征或者更多的样本是未知的, 因此建议先实现一个简单粗暴的机器学习算法, 发现其中的问题, 有哪些地方可以优化, 应该朝那个方向优化, 是需要更多的特征, 还是更多的样本, 还是修改学习率, 还是修改正则化参数。

第一次快速实现了一个简单的机器学习算法之后

  • 绘制出学习曲线, 也就是说上面提到的误差值与样本数量或者特征数量关系
    • 假设我们现在有100个样本, 3个特征, 将其中60个划分为训练样本, 20个划分为交叉验证样本, 20个划分为测试样本
    • 我们的目标是画出(J_train), (J_cv)与样本数量的学习曲线
    • 写一个for循环, 将输入的样本数量从1一直迭代到60, 在每一个循环中, 我们都计算出模型的参数(也就是生成一个模型), 计算训练误差值(J_train), 将这个误差保存到列向量中, 同时计算出交叉验证误差(J_cv), 也保存到另外一个列向量中。
    • 在回顾一个一遍, 在for循环中, 我们通过输入训练样本获取到了模型, 接着再一次将训练样本输入到模型中得到一个误差值, 这个就是训练误差; 接着将交叉验证样本输入到模型中, 得到一个误差值, 这个就是交叉验证误差
    • 画出学习曲线
    • 从学习曲线的结果来看, 主要还是看(J_cv)的变化, 因为(J_train)的结果可能会比较乐观
    • 注意点: 在绘制学习曲线的时候, (J_train), (J_cv)都是必要求的, 值得注意的是, 这里的(J_train)和在训练的时候使用到的(J_train)还是有一点区别的, 后者是在不点迭代更新参数产生的误差, 当这个值达到了我们的阈值则表示我们的参数已经训练好了, 也就是我们的模型出来了, 这里更加强调训练的概念; 而前者则更加强调测试的概念, 也就说从训练集中出来的模型在使用训练集中的数据进行测试。

机器学习 - 概念/建议

】机器学习-概念/建议【英文标题】:Machine-Learning-Concept/Recommendations【发布时间】:2014-09-1319:41:32【问题描述】:您好,我是机器学习的新手,因此正在寻找文本分类解决方案。有人可以向我推荐一个用java编写的不错的框架吗... 查看详情

[机器学习]coursera笔记-机器学习应用的建议-part2

序言   机器学习栏目记录我在学习MachineLearning过程的一些心得笔记,包括在线课程或Tutorial的学习笔记,论文资料的阅读笔记,算法代码的调试心得,前沿理论的思考等等,针对不同的内容会开设不同的专... 查看详情

[机器学习]coursera笔记-机器学习应用的建议-part1

序言  机器学习栏目记录我在学习MachineLearning过程的一些心得笔记,包括在线课程或Tutorial的学习笔记,论文资料的阅读笔记,算法代码的调试心得,前沿理论的思考等等,针对不同的内容会开设不同的专栏... 查看详情

斯坦福2014机器学习笔记七----应用机器学习的建议

一、纲要  纠正较大误差的方法  模型选择问题之目标函数阶数的选择  模型选择问题之正则化参数λ的选择  学习曲线二、内容详述  1、纠正较大误差的方法  当我们运用训练好了的模型来做预测时,发现会有较... 查看详情

机器学习深度学习的理论与实战入门建议整理

...这份文档时想必你的脑海中一直萦绕着这么一个问题,“机器学习/深度学习要怎么学呢?(怎么入门,又怎么进一步掌握?)”。关于这个问题其实并没有一个标准答案,有的人可能适合自底向上的学,也就是先从理论和数学... 查看详情

斯坦福机器学习视频笔记week6关于机器学习的建议adviceforapplyingmachinelearning

我们将学习如何系统地提升机器学习算法,告诉你学习算法何时做得不好,并描述如何‘调试‘你的学习算法和提高其性能的“最佳实践”。要优化机器学习算法,需要先了解可以在哪里做最大的改进。我们将讨论如何理解具有... 查看详情

大型不平衡数据的机器学习模型建议

】大型不平衡数据的机器学习模型建议【英文标题】:Machinelearningmodelsuggestionforlargeimbalancedata【发布时间】:2016-09-1902:17:44【问题描述】:我有分类问题的数据集。我总共有50节课。Class1:10,000examplesClass2:10examplesClass3:5examplesClass4:... 查看详情

关于机器学习场景中用户分类的建议

】关于机器学习场景中用户分类的建议【英文标题】:Adviceonclassifyingusersinmachinelearningscenario【发布时间】:2017-04-2619:47:00【问题描述】:我正在寻找一些关于根据注册过程的答案将用户分为不同组的问题的建议。想法是这些分... 查看详情

机器学习很枯燥,不想继续学了怎么办?或许,这些建议值得一看

  本文介绍的是我在机器学习方面的 实际经历,想以此给大家提供些建议与思路,供各位参考。希望通过一些途径,来提高机器学习的兴趣:(1)参与打卡活动:45天机器学习实战(2)加入专门的微信群(3)建立机... 查看详情

c站最全python机器学习深度学习库总结(内含大量示例,建议收藏)(代码片段)

C站最全Python机器学习、深度学习库总结(内含大量示例,建议收藏)前言python常用机器学习及深度学习库介绍总结与分类python常用机器学习及深度学习库总结分类更多前言目前,随着人工智能的大热,吸引了... 查看详情

coursera应用机器学习的建议

一、经验风险最小化1、有限假设类情形对于Chernoffbound不等式,最直观的解释就是利用高斯分布的图象。而且这个结论和中心极限定律没有关系,当m为任意值时Chernoffbound均成立,但是中心极限定律不一定成立。随着模型复杂度... 查看详情

价值连城知名深度强化学习pieterabbeel的采访给机器学习深度学习和机器人学研究者从业者的建议

...谢你Pieter今天来参加访谈我想很多人觉得你是一个知名的机器学习深度学习和机器人学研究者我希望能让观众们听一听你的故事你是如何最终走上了现在的道路的呢?这是个好问题其实如果你问14岁的我这个问题我要立志做什么问... 查看详情

机器学习模型的实用建议

高方差/偏差的解决策略高方差就是模型的训练误差与验证误差相去甚远,一般由于模型过拟合使得训练误差很低而验证误差很高;高偏差就是模型的训练误差与验证误差非常逼近但是都很高,往往由于模型欠拟合使得两者误差... 查看详情

初学机器学习的几点建议

...这大半年的接触和了解,结合找工作需要现对于如何入门机器学习提几点自己的看法。如果你以后要想干算法工程师、机器学习工程师,那么请你好好看一下我下面说的话。 2018年05月18日17:51:41=========================================... 查看详情

机器学习研究者的养成指南,吴恩达建议这么读论文

 如何成为一名高效的机器学习研究者,然后在这个领域取得一些成就?在此之前,我们需要养成什么样的习惯?近日,一篇发布在Reddit机器学习版块的帖子引发了众人的讨论。近日,一位网友在Reddit上发... 查看详情

[机器学习]coursera笔记-机器学习应用的建议-part3

序言  机器学习栏目记录我在学习MachineLearning过程的一些心得笔记,包括在线课程或Tutorial的学习笔记,论文资料的阅读笔记,算法代码的调试心得,前沿理论的思考等等,针对不同的内容会开设不同的专栏... 查看详情

关于用啥机器语言算法对用户登录时间进行分类的建议

】关于用啥机器语言算法对用户登录时间进行分类的建议【英文标题】:Suggestionsonwhatmachinelanguagealgorithmtoclassifywhattimeauserlogsin关于用什么机器语言算法对用户登录时间进行分类的建议【发布时间】:2017-12-1623:21:00【问题描述】... 查看详情

机器学习9种回归算法及实例总结,建议学习收藏(代码片段)

我相信很多人跟我一样,学习机器学习和数据科学的第一个算法是线性回归,它简单易懂。由于其功能有限,它不太可能成为工作中的最佳选择。大多数情况下,线性回归被用作基线模型来评估和比较研究中的新... 查看详情