数据挖掘2022年2023届秋招宏瓴科技公司机器学习算法工程师笔试题

BetterBench BetterBench     2022-10-23     643

关键词:

1 简介

公司:宏瓴科技有限公司
岗位:机器学习算法工程师
笔试时间:2022-9-28
以下答案全是自己总结,这些点对于我来说太难了,我对自己总结的答案也没有信心,题目中说要用公式去表示,我都不知道如何去写。

2 题目

请在题目下方作答。

1. 什么是贝叶斯误差?什么是贝叶斯最优分类器?(以如下的二分类问题为例尽量用公式作答)- (10分)
二分类器:f:X -> Y=0,1

答:
(1)是指在现有特征集上,任何可以基于特征输入进行随机输出的分类器所能达到的最小误差。
(2)贝叶斯最优分类器为最小化总体风险,只需在每个样本上选择某个条件使得条件风险最小的类别标记时的判定准则。

2. 当我们拿到一个新的(之前没有参考文献)监督学习问题的训练数据的时候,在开始训练之前,为什么需要关心这个问题的贝叶斯误差?有可能通过理论分析直接得到贝叶斯误差的真实值么?如果能,请把计算公式写下来;如果不能,如何用工程办法大致去估计一个贝叶斯误差的替代值? - (10分)

答:
(1)因为理想模型是假设预先知道生成数据的真实概率分布的,但是实际的数据分布中存在一些噪声扰动的,与理想状态并不符合,在监督学习中x到y的映射可能内在是随机的,或者y可能是包括x在内还有其他变量的确定性函数。使用贝叶斯误差,就是能从预先知道的真实分布中预测出现的误差。
(2)不能通过理论分析直接得到贝叶斯误差的真实值,因为这是一个理论值。工程办法是用人类误差当做贝叶斯误差的替代值。

3. 假设我们拿到了训练集和测试集两个标定好的数据集,其中测试集的数据分布与(落地场景中)真实分布一致,但是数据量不大,训练集的数据量大,但是不能保证其分布跟真实分布一致(往后的所有问题中出现的训练集和测试集都做以上假设)。
为了利用好这两个数据集训练出在落地场景中表现尽可能好的深度学习模型,我们应该用以下哪一种数据集划分方式进行训练,为什么?(把一个数据集一分为二的时候,无论两个子集各自占比多少,都假设其数据分布与原数据集一致)- (10分)

a) 训练集 | 测试集
训练集用于训练模型参数,测试集用于测试模型准确率,同时根据测试集上的表现来选择网络超参,比如学习率,网络深度等

b) 9/10的训练集 | 1/10的训练验证集 || 测试集
在训练集上使用留一交叉验证的方式,划分出训练集和训练验证集,在训练集上训练模型参数,用训练验证集上的错误率来选择网络超参

c) 训练集 | 训练验证集 || 测试验证集 | 测试集
把训练集拆分成两部分:大部分用于训练网络参数,少部分保留出来作为训练验证集;测试集也拆分成两部分:测试验证集和最终的测试集

答:选择c,因为当训练集和测试集分布不一致时,构造和测试集分布近似相同的验证集,保证线下验证根线上测试分数不会出现抖动。

还有三个问题忘了

数据挖掘2022年2023届秋招奇虎360机器学习算法工程师笔试题(代码片段)

公司:奇虎360岗位:机器学习算法工程师笔试时间:2022年10月9号1选择题1、E(X2)E(X^2)E(X2)的计算PX=1=2/3,PX=0=1/6,PX=-1=1/6解析:E(X2)=12∗2/3+02∗1/6+(−1)2∗1/6=2/3+1/6& 查看详情

数据挖掘2022年2023届秋招kanaries雾角科技算法岗笔试题(代码片段)

Kanaries雾角科技算法岗位笔试笔试时间:2022年10月13号时长:120分钟几乎是刷过的算法题,最后一题是难度题,其他都是中等题目。1、LeetCode2038.如果相邻两个颜色均相同则删除当前颜色(1)题目总共有n个... 查看详情

数据挖掘2022年2023届秋招爱玩特智能量化研究员岗笔试题(代码片段)

公司:爱玩特智能岗位:量化研究员时间:2022年10月17号,线下开卷笔试1题目笔试说明1、编程要求语言:Python结果汇总至Excel,表一至表五代码分块汇总至一个python文件、要求注释完整2、数据说明数据库... 查看详情

我的cv算法岗上岸之路(2023届秋招)

 Datawhale干货 作者:记忆的迷谷@知乎,整理:极市平台来源丨https://zhuanlan.zhihu.com/p/576729164导读 在卷成麻花的2022年,一个没有上述背景、没有名校撑腰的普通科班小硕能入坑中大厂的CV算法岗吗?作者亲... 查看详情

数据挖掘恒生金融有限公司2023届秋招数据etl工程师笔试题解析(代码片段)

公司:恒生科技笔试时间:2022年9月24号岗位:数据ETL工程师时间:120分钟1不定项选择题1、SQL修改表结构的关键词是A.alterB.createC.descD.rename答案:A2、正确的是A.一个表中,主键可以唯标识一行记录B.一个事... 查看详情

2023届秋招提前批信息汇总(持续更新ing)

 实时更新的文档:2023届秋招提前批信息汇总(持续更新ing)(qq.com)公司投递链接面试网站工作地点截止时间互联网及私企(软件)网易游戏网易游戏(互娱)校园招聘官网https://www.mianshi.online/广州深圳、杭州、... 查看详情

米哈游2023届秋招开启校招唯一专属内推码eytuc

爆个猛料很猛的米哈游7月又有新岗位啦!!!!不打卡弹性工作。抓紧金7银8面试机会,年中岗位多、急、需求量大,offer流程快。现招:技术(算法、前端、后台、大数据、安卓ios测试,C++,游戏开发,客户端开发,Unity开发,引... 查看详情

一个高考失利人的2022届秋招复盘,目前收到腾讯字节百度阿里京东的offer

文章目录一个高考失利人的2022届秋招复盘,目前收到腾讯字节百度阿里京东的offer前言本人情况和秋招结果战绩大学时间线安排大一大二举一些面试例子数据结构和算法如何考?如何学习这部分知识网络原理如何考?如何学习这部分... 查看详情

自动驾驶决策规划-控制方向2023届秋招总结

隔了这么久,终于打算好好总结一些自己的秋招历程了。。1.基本情况985本硕,研究方向是深度强化学习与机器人控制。今年秋招投递的岗位主要是自动驾驶的决策规划或控制岗位,当然前期也投递了一些机器人公司... 查看详情

2023届秋招回顾,寒气逼人。。。

作者:OliQ来源:https://www.cnblogs.com/yuanchuziwen/p/16770895.html一、自我介绍就叫我OliQ吧(《白鲸》式的开局)!我来自杭州的一所双非一本学校,是一名普通的本科生,专业【软件工程】。1.1初学编程事实上,我... 查看详情

偷偷盘点一下23届秋招薪资(代码片段)

...者丨库森来源丨程序员库森(ID:Coolsen88)2023届秋招形式比起前几年严峻了很多,大厂缩招、小厂停招,寒气逼人。我根据牛客网、offershow小程序、脉脉、qq微信群等渠道收集汇总了一波2023届秋招技术岗薪资... 查看详情

如何看待2022届秋招嵌入式开发岗位薪资大涨?

大家好,我是无际。最近在网上看到了关于2022届嵌入式开发岗位薪资大涨的帖子,比如说像海康、大华、汇顶、联发科等公司的招聘。普遍年薪达到25W,甚至有40W的,直逼互联网。虽然不知道是不是网友吹牛逼的... 查看详情

新出炉|2022秋招洞察&2023春招趋势解读

...据支持。(完整报告可在公众号"Hollis"后台回复"秋招"即可获得)本文档中包含了行业洞察、职位洞察、城市、薪资、学历以及2023春招趋势。PS:因为每个读者的具体情况不同,所 查看详情

2023届秋招,我重新认清了自己

仅记录个人经历,充满主观感受,甚至纯属虚构,仅供参考,杠就是你对本想毕业再写,但是考虑到等毕业了,24秋招的提前批就快开始了,大概就来不及了,正好现在有点时间,陆陆续续的写... 查看详情

2023届秋招技术岗内推专场来啦~内推名额等待优秀的你

2023届秋季校园招聘开始啦!作为一个过来人,深知找工作的无奈和奔走的劳累。我是本次校招推星官,小伙伴们赶快准备简历,然后找我内推吧。23届毕业找工作的同学可以注意一下,和博主一起共事的内推... 查看详情

2023届秋招技术岗内推专场来啦~内推名额等待优秀的你

2023届秋季校园招聘开始啦!作为一个过来人,深知找工作的无奈和奔走的劳累。我是本次校招推星官,小伙伴们赶快准备简历,然后找我内推吧。23届毕业找工作的同学可以注意一下,和博主一起共事的内推... 查看详情

2023秋招——快手数据研发一二面面经(代码片段)

🌼今天来总结一下快手数据研发的一、二面,在面试中进步,在总结中成长!对往期内容感兴趣的小伙伴可以参考下面👇:链接:2022暑期实习字节跳动数据研发面试经历-基础数仓.链接:2022百度大数据开发... 查看详情

2023秋招——快手数据研发一二面面经(代码片段)

🌼今天来总结一下快手数据研发的一、二面,在面试中进步,在总结中成长!对往期内容感兴趣的小伙伴可以参考下面👇:链接:2022暑期实习字节跳动数据研发面试经历-基础数仓.链接:2022百度大数据开发... 查看详情