2022字节跳动数据仓库实习面经(代码片段)

柳小葱 柳小葱     2022-11-30     576

关键词:

👊先和大家说一下情况,3月4号面试的字节跳动数据研发岗位直接把我挂了,我满脸疑惑,但是抱着学习和提升自我的心态,打电话问问hr,像看看面试官给我面试的评价,hr说,面试官就两行,第一句肯定,第二句说我专业知识基础不够。以下是我上次的面试经历👇:

👍今天是字节另一个团队的面试官来面我,好像是抖音电商部门,通知我来面试。以下就是面试中的问题。

1. 面试问题

  • 自我介绍
  • 我看你的项目中用过flink,你能和我讲讲你对flink中的状态的理解吗?(我从流处理速度快的原理和checkpoint的角度对state进行了说明)
  • flink中的状态可以存储在内存中,还可以存储在哪里?说说你的理解?(不仅可以存储在内存,还可以存储在磁盘上,存在内存中计算较快,但容易丢失,state会不定期写入在硬盘上,准备进行checkpoint)
  • 你在滴滴实习的时候也做做过数据仓库开发,你们的数据仓库是如何设计的,分层了吗?(介绍了一个数仓的建设,然后说用的维度建模,分为ods、dwd、dws和app)
  • 说一下为什么要分层?刚才你提到了dwd和dws层,请问他们有什么区别?(从dwd和dws的定义来说,也说了他们俩没有很明确的区别,也可以在中间加另外的层,只要结构清晰,不冗余就行,不绝对。)
  • 现在有这样一个场景,业务部门需要进行修改数仓的操作,换句话说说,如何避免经常发生修改数仓的操作?(我从业务理解的角度和数仓开的经验角度来说,主要是要将dwd和dws层的表里的指标考虑周到,这样子就不需要经常根据业务修改数仓了,因为里面的指标够齐全,表够宽。)
  • 我看你的flink实战项目中有一个计算每小时的成交量的指标,你是如何实现的?(用1小时的滚动窗口进行分组,然后group by统计每小时的成交量。)
--看看sql
--这里涉及到flink的窗口函数,tumble滚动窗口。
INSERT INTO buy_cnt_per_hour
SELECT HOUR(TUMBLE_START(ts, INTERVAL '1' HOUR)), COUNT(*)
FROM user_behavior
WHERE behavior = 'buy'
GROUP BY TUMBLE(ts, INTERVAL '1' HOUR);

  • 你说你用的是滚动窗口,你确定吗?(肯定确定,这里想考我滚动和滑动窗口的理解。)
  • 你会flink sql吗?有过开发实时数据仓库的项目吗?(我使用过flink sql也做过flink数据的开发,但是实际的数据仓库项目没有正式接触过,因为我们部门主要以批处理为主,数据仓库的理论没有较大差别,可能在flink开发中时间、窗口、watermark等设置需要额外注意。)
  • 我看你这里经常写博客,而且有一定的访问量,说说你写博客的历程吧。(如实说明即可,体现自己爱学习的,爱探索的性格)
  • 你觉得你应该如何评价你自己?(自己回答)
  • sql题,我们有一张表,存储关于用户和客服交流的信息,字段有 call_id,user_id,start_time,end_time,prov_id,call_type,请你求出各天呼入数量top5的省份,call_type=2为呼入。
# 1,这里有一个小插曲,本来是求各天的top5,然后我和面试官沟通一些题目的细节,然后面试官说,就求今天的吧,不用那么麻烦
select tmp1.prov_id,tmp1.call_num
from(
select date(start_time) start_date,prov_id,count(1) call_num
from table1
where call_type='2'
group by date(start_time),prov_id
having date(start_time)=date(now()))tmp1
order by tmp1.call_num desc
limit 5
  • 反问:你这边有啥想问的吗?我问了一些关于面试官部门业务的一些事情。

2. 总结

这个部门的面试和上个部门的面试感觉差不多,自我感觉还不错,没有一点都不会的问题,但是回想上个部门挂的原因可能是觉得我对大数据组件原理的理解大于对数据仓库建模的理解吧,但拒绝我的终将使我更强大,面试时长大概40多分钟,面试完20分钟后,就收到了2面的邀请。

3. 温馨提示

其实大厂面试把你挂掉,很正常,你首先需要去反思自己的问题,但也可能是不喜欢你说的某一句话、可能是觉得你不太适合这个岗位,可能是觉得你过于自信不好交流,无论是啥,你都可以厚着脸皮打电话问hr,面试官给你的评价(挂你的原因),这不丢人,自己可以根据面试官的评价及时弥补自己的缺点。

2023秋招——快手数据研发一二面面经(代码片段)

...趣的小伙伴可以参考下面👇:链接:2022暑期实习字节跳动数据研发面试经历-基础数仓.链接:2022百度大数据开发工程师实习面试经历.链接:2022暑期实习字节跳动数据研发面试经历-data部门链接:2021年暑假滴滴数据开发面试& 查看详情

2023秋招——快手数据研发一二面面经(代码片段)

...趣的小伙伴可以参考下面👇:链接:2022暑期实习字节跳动数据研发面试经历-基础数仓.链接:2022百度大数据开发工程师实习面试经历.链接:2022暑期实习字节跳动数据研发面试经历-data部门链接:2021年暑假滴滴数据开发面试& 查看详情

字节跳动(抖音)android客户端实习3+1面经(代码片段)

很多朋友知道我在字节担任面试官,做公号的初衷之一也是希望能多一个为团队网络人才的渠道。但是一段时间下来发现真正找我咨询、内推的人并不多,不少同学对字节的面试有所忌惮,总担心准备不够。实际上字... 查看详情

字节跳动抖音android客户端实习3+1面经(已oc)(代码片段)

前言今日份收到一个粉丝分享来得字节抖音客户端的实习面经,他自己说这次没有面试成功的话,可能还在经历迷茫的找工作。机遇巧合通过学长的内推,前往字节跳动进行了面试。我就废话不多说了,直接进入... 查看详情

2023秋招——快手数据研发一二面面经(代码片段)

...趣的小伙伴可以参考下面👇:链接:2022暑期实习字节跳动数据研发面试经历-基础数仓.链接:2022百度大数据开发工程师实习面试经历.链接:2022暑期实习字节跳动数据研发面试经历-data部门链接:2021年暑假滴滴数据开发面试&#x... 查看详情

2023秋招——快手数据研发一二面面经(代码片段)

...趣的小伙伴可以参考下面👇:链接:2022暑期实习字节跳动数据研发面试经历-基础数仓.链接:2022百度大数据开发工程师实习面试经历.链接:2022暑期实习字节跳动数据研发面试经历-data部门链接:2021年暑假滴滴数据开发面试&#x... 查看详情

字节跳动前端日常实习三轮技术面经

一面项目:描述项目某个功能的实现react的特点为什么要使用redux+immutable,redux和全局变量的区别diff算法react-redux的工作原理和相关源码还有一些项目的细节然后是基础知识:实现一个百度搜索框,包括垂直左右居中,自适应的... 查看详情

字节跳动面经分享(android客户端)(代码片段)

...双非学校,且非科班生,有三个App上架,大三在读9月1号投了字节的简历,9月中旬参加了笔试,9月底收到字节面试邀请10月初参加了第一轮面试,10月中旬参加了二面,10月27日参加了三面10月28日offermail一面(60分钟)前15分钟个人介绍,什么时... 查看详情

2022暑期实习字节跳动数据研发面试经历

🌟今天下午面试两家,字节跳动数据研发一面和百度三面,百度那边突然不面了,hr说下个星期再看看,是直接过了还是再来一面,需要和部门商量一下,先来总结一下字节跳动的面试,对百度面... 查看详情

字节跳动实习后端日常实习的三次面试+hr面面经

...#xff0c;目前大三上学期,方向是Java后端;投递的是字节跳动日常实习的后端实习。本来打算明年3月份春招投递,不过最近参加了字节跳动训练营,他们给了一个内推机会,就直接投了(被迫投递 查看详情

字节跳动面经——图形图像算法实习

目录项目:C++:图形学:编程题:项目:1.项目的目的2.项目的创新性3.你的职责4.项目细节,具体每个部分怎么实现的,用了哪些技术C++:1.重载和重写2.参数传递时,传值、传引用和传指针的区别3.指针和引用的区别4.函数返回... 查看详情

字节跳动面经——实习算法岗

目录一面二面三面一面一面是一个特别和蔼的面试官,我们用Q来代表面试官。A表示我。A:面试官,你好Q:你好,先坐一下自我介绍吧A:好的,balabala。(这个地方大家千万不要紧张,放平心态,在下面先准备好自我介绍,上去... 查看详情

字节跳动后端开发实习面经一二三面+hr面(已offer)

*号表示没答上一面(1h)1.问之前的实习2.redis的基本数据结构,string的底层3.binlog存储日志的格式,statement造成主备不一致的过程4.多机房部署mysql会有什么问题,解决数据同步问题的方案5.http和https的区别*6.utf... 查看详情

2022秋招蚂蚁金服数据研发一面(代码片段)

...;:链接:2022年秋招快手数据开发一、二面链接:2022暑期实习字节跳动数据研发面试经历-基础数仓.链接:2022百度大数据开发工程师实习面试经历.链接:2022暑期实习字节跳动数据研发面试经历-data部门链接:2021年暑假滴滴数据开发面试... 查看详情

2022字节pico软件开发实习生面经一面+二面+hr面(已offer)(代码片段)

个人背景:四非本科科班,大三已退役菜鸡ACMer,零项目(只有课程demo),零实习,八股全靠背四月中旬才意识到金三银四已经快结束了,收收心,准备了一下简历海投了好多大厂。不过到目前... 查看详情

2022字节pico软件开发实习生面经一面+二面+hr面(已offer)(代码片段)

个人背景:四非本科科班,大三已退役菜鸡ACMer,零项目(只有课程demo),零实习,八股全靠背四月中旬才意识到金三银四已经快结束了,收收心,准备了一下简历海投了好多大厂。不过到目前... 查看详情

字节跳动八进八出,offer到手,发现项目不重要算法才最重要(代码片段)

...#xff0c;本人刚刚大三结束,去年十二月的时候是投递了字节的视频架构的实习,共三轮技术面+一轮hr面,成功拿到offer实习了五个月。今年秋招提前批是投了抖音架构,共三轮技术面+一轮hr面,已经成功拿... 查看详情

字节跳动实习生删库高操作(代码片段)

...6月24日消息,脉脉用户“程序员。白胜”在社交媒体称,字节跳动一名实习生删除了公司所有lite模型,在脉脉上引发关注。这名用户随后在回复中称“实习生直接delete父目录,还加了skiptrash”。lite全称TensorFlowLite是一种用于移... 查看详情