hive面试题系列第三题-用户留存问题(代码片段)

一只懒得睁眼的猫 一只懒得睁眼的猫     2023-02-21     274

关键词:

视频讲解地址:https://www.bilibili.com/video/BV1Rd4y1T7iU/?spm_id_from=333.788&vd_source=aa4fb0436f6d978af872cafb81a01178

Hive面试题系列第三题-用户留存问题

题目:求用户1日、3日、7日留存率
概念问题:
第N日活跃用户留存率:以基准日的活跃用户数为主,第N日后依然活跃的用户占基准日活跃用户的比例
第1日留存率(即次日留存):(以基准日当天活跃的用户中,基准日之后的第1天还活跃的用户数)/基准日当天总活跃用户数;
第3日留存率:(以基准日当天活跃的用户中,基准日之后的第3天还活跃的用户数)/基准日当天总活跃用户数;
第7日留存率:(以基准日当天活跃的用户中,基准日之后的第7天还活跃的用户数)/基准日当天总活跃用户数。
表结构:

  1. create table user_log(
  2.  userid bigint,           
    
  3.  time string              
    
  4. )
  5. row format delimited
  6. FIELDS TERMINATED BY ‘|’
  7. LINES TERMINATED BY ‘\\n’;
    用户表数据:
  8. 1 2019-07-11 01:44:27
  9. 1 2019-07-12 02:44:27
  10. 1 2019-07-14 03:44:27
  11. 1 2019-07-16 04:44:27
  12. 1 2019-07-17 05:44:27
  13. 1 2019-07-18 06:44:27
  14. 1 2019-07-19 07:44:27
  15. 1 2019-07-21 08:44:27
  16. 2 2019-07-11 01:44:27
  17. 2 2019-07-12 02:44:27
  18. 2 2019-07-13 04:44:27
  19. 2 2019-07-14 06:44:27
  20. 2 2019-07-15 07:44:27
  21. 2 2019-07-16 12:44:27
  22. 2 2019-07-17 13:44:27
  23. 2 2019-07-18 23:44:27
  24. 3 2019-07-11 02:44:27
  25. 3 2019-07-13 03:44:27
  26. 3 2019-07-14 06:44:27
  27. 3 2019-07-17 07:44:27
  28. 3 2019-07-19 09:44:27
  29. 3 2019-07-20 10:44:27
  30. 3 2019-07-21 11:44:27
  31. 3 2019-07-22 12:44:27

hive面试题系列第一题-连续登录问题(代码片段)

视频讲解地址:https://www.bilibili.com/video/BV1iV4y1x7yo?spm_id_from=333.999.0.0&vd_source=aa4fb0436f6d978af872cafb81a01178Hive面试题系列第一题-连续登录问题题目:求连续7天登录的用户表结构:CREATETABLElogtable(u 查看详情

hive面试题系列第六题-互为好友问题(代码片段)

视频讲解地址:https://www.bilibili.com/video/BV1at4y1J7Bq/?spm_id_from=333.788&vd_source=aa4fb0436f6d978af872cafb81a01178Hive面试题系列第六题-互为好友问题题目:根据用户好友列表user_table,求互为共同好友的人有多少对。表结构:c 查看详情

hive面试题系列第六题-互为好友问题(代码片段)

..._id_from=333.788&vd_source=aa4fb0436f6d978af872cafb81a01178Hive面试题系列第六题-互为好友问题题目:根据用户好友列表user_table,求互为共同好友的人有多少对。表结构:createtableuser_table(user_idstring,friendsstring)rowformatdelimitedFIELDSTERMINA... 查看详情

hive面试题系列第六题-互为好友问题(代码片段)

..._id_from=333.788&vd_source=aa4fb0436f6d978af872cafb81a01178Hive面试题系列第六题-互为好友问题题目:根据用户好友列表user_table,求互为共同好友的人有多少对。表结构:createtableuser_table(user_idstring,friendsstring)rowformatdelimitedFIELDSTERMINA... 查看详情

hive面试题系列第四题-pv累加趋势图问题(代码片段)

视频讲解地址:https://www.bilibili.com/video/BV1L14y1b7Ur/?spm_id_from=333.788&vd_source=aa4fb0436f6d978af872cafb81a01178Hive面试题系列第四题-pv累加趋势图问题题目:求每个用户截止到每月月底(累计到该月)的总 查看详情

hive面试题系列第四题-pv累加趋势图问题(代码片段)

视频讲解地址:https://www.bilibili.com/video/BV1L14y1b7Ur/?spm_id_from=333.788&vd_source=aa4fb0436f6d978af872cafb81a01178Hive面试题系列第四题-pv累加趋势图问题题目:求每个用户截止到每月月底(累计到该月)的总 查看详情

hive面试题系列第五题-uv累加趋势图问题(代码片段)

视频讲解地址:https://www.bilibili.com/video/BV1114y1b7eP/?spm_id_from=333.788&vd_source=aa4fb0436f6d978af872cafb81a01178Hive面试题系列第五题-uv累加趋势图问题题目:每个用户访问店铺shop_id的商品时都会产生一条访问日志࿰ 查看详情

hive面试题系列第五题-uv累加趋势图问题(代码片段)

视频讲解地址:https://www.bilibili.com/video/BV1114y1b7eP/?spm_id_from=333.788&vd_source=aa4fb0436f6d978af872cafb81a01178Hive面试题系列第五题-uv累加趋势图问题题目:每个用户访问店铺shop_id的商品时都会产生一条访问日志࿰ 查看详情

hive面试题系列第一题-连续登录问题(代码片段)

...from=333.999.0.0&vd_source=aa4fb0436f6d978af872cafb81a01178Hive面试题系列第一题-连续登录问题题目:求连续7天登录的用户表结构:CREATETABLElogtable(uidint,dtstring)ROWFORMATDELIMITEDFIELDSTERMINATEDBY‘|’LINESTERMINATEDBY‘\\n’;用户表数据:1|2018-0... 查看详情

hive面试题系列第一题-连续登录问题(代码片段)

...from=333.999.0.0&vd_source=aa4fb0436f6d978af872cafb81a01178Hive面试题系列第一题-连续登录问题题目:求连续7天登录的用户表结构:CREATETABLElogtable(uidint,dtstring)ROWFORMATDELIMITEDFIELDSTERMINATEDBY‘|’LINESTERMINATEDBY‘\\n’;用户表数据:1|2018-0... 查看详情

hive面试题系列第二题-行转列问题(代码片段)

..._id_from=333.788&vd_source=aa4fb0436f6d978af872cafb81a01178Hive面试题系列第二题-行转列问题题目:求语文课程成绩大于英语课程成绩的学生的学号表结构:createtablescore_table(idint,stuidint,coursestring,scorebigint)rowformatdelimitedFIELDSTERMINATEDB... 查看详情

hive面试题系列第七题-同时在线问题(代码片段)

视频讲解地址:https://www.bilibili.com/video/BV1Tg411r7Jz/?spm_id_from=333.788&vd_source=aa4fb0436f6d978af872cafb81a01178Hive面试题系列第七题-同时在线问题题目:计算主播最高同时在线人数(pcu)表结构:cre 查看详情

hive面试题系列第七题-同时在线问题(代码片段)

视频讲解地址:https://www.bilibili.com/video/BV1Tg411r7Jz/?spm_id_from=333.788&vd_source=aa4fb0436f6d978af872cafb81a01178Hive面试题系列第七题-同时在线问题题目:计算主播最高同时在线人数(pcu)表结构:cre 查看详情

hive面试题系列第二题-行转列问题(代码片段)

视频讲解地址:https://www.bilibili.com/video/BV1BG4y1v7Ps/?spm_id_from=333.788&vd_source=aa4fb0436f6d978af872cafb81a01178Hive面试题系列第二题-行转列问题题目:求语文课程成绩大于英语课程成绩的学生的学号表结构:createtablesco 查看详情

ccf系列题解--2016年4月第三题路径解析(代码片段)

问题描述  在操作系统中,数据通常以文件的形式存储在文件系统中。文件系统一般采用层次化的组织形式,由目录(或者文件夹)和文件构成,形成一棵树的形状。文件有内容,用于存储数据。目录是... 查看详情

面试题:hive-sql查询连续活跃登录用户思路详解(代码片段)

文章目录创造数据登录日志去重一、思路一1.1、分组排序1.2、日期减去计数值得到结果,用户连续登陆情况下,每次相减的结果都相同1.3、根据user_id和dis分组,得到用户的开始、结束时间、连续登录天数1.4、连续登录超过... 查看详情

面试题:hive-sql查询连续活跃登录用户思路详解(代码片段)

文章目录创造数据登录日志去重一、思路一1.1、分组排序1.2、日期减去计数值得到结果,用户连续登陆情况下,每次相减的结果都相同1.3、根据user_id和dis分组,得到用户的开始、结束时间、连续登录天数1.4、连续登录超过... 查看详情

百度用户增长sql面试题(代码片段)

...接:牛客SQL大厂真题——某音短视频.链接:京东数据分析SQL面试题.🌰话不多说,让我们开始今日份的学习吧。目录1.题 查看详情