数据挖掘恒生金融有限公司2023届秋招数据etl工程师笔试题解析(代码片段)

BetterBench BetterBench     2023-03-17     629

关键词:

公司:恒生科技

笔试时间:2022年9月24号

岗位:数据ETL工程师

时间:120分钟

1 不定项选择题

1、SQL 修改表结构的关键词是

A. alter
B. create
C. desc
D. rename

答案:A

2、正确的是

A. 一个表中,主键可以唯标识一行记录
B. 一个事务中的某条sql 命提交时,其他sql命令可以不提交
C. 一个关系表的外键必定是另一个表的主键
D. 回滚可以在任务失败时,回到操作是五千的数据状态

答案:A,C,D

解析:

B错误

4、数据集市和数据仓库的区别

解析:

(1)数据仓库:基于整个企业的数据模型建立,面向企业范围内的主题;
数据集市:按照某一特定部门的数据模型建立的,由于每个部门有自己特定的需求,因此,他们对数据集市的期望也不同。 部门主题与企业主题之间可能存在关联,也可能不存在。

(2)数仓存储整个企业内非常详细的数据;数据集市数据详细程度低一些,包含概要和综合数据多一些。
(3)数据集市的数据组织一般采用星形模型。大型数仓的数据组织,星形或雪花形都可以。
(4)数据集市较少保留历史数据。

6、正确的是

A. 事务特性为原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持久性(Durability)
B. 可重复读会导致脏读
C. 序列化级别最高
D. SQL可以动态调整事务隔离级别

答案:A,C,D

7、为了检查查询,而又不增加数据的存储空间,常用的方法是创建

答案:视图

9、数据仓库常见的模型分为

A. 星型模型
B. 雪花型模型

答案:A,B

10、典型的元数据包括

A. 数据仓库的表结构
B. 数据仓库表的属性
C. 数据仓库的数据源
D. 源数据到数据仓库的映射
E. 数据模型的规格说明
F. 抽取日志
G. 访问数据的公共例行程序

答案:ABCDE是正确的,F,G不知道是否正确

解析:

元数据(Metadata)是关于数据的数据。在数据仓库系统中,元数据是描述数据仓库内数据的结构和建立方法的数据,可将其按用途的不同分为两类:技术元数据(Technical Metadata);业务元数据(Business Metadata)

技术元数据:
  技术元数据是存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库使用的数据,它主要包括以下信息:数据仓库结构的描述,包括仓库模式、视图、维、层次结构和导出数据的定义,以及数据集市的位置和内容;业务系统、数据仓库和数据集市的体系结构和模式,汇总用的算法,包括度量和维定义算法,数据粒度、主题领域、聚集、汇总、预定义的查询与报告;由操作环境到数据仓库环境的映射,包括源数据和它们的内容、数据分割、数据提取、清理、转换规则和数据刷新规则、安全(用户授权和存取控制)。

业务元数据:
  业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的数据。业务元数据主要包括以下信息:使用者的业务术语所表达的数据模型、对象名和属性名;访问数据的原则和数据的来源;系统所提供的分析方法以及公式和报表的信息;具体包括以下信息:

企业概念模型:这是业务元数据所应提供的重要的信息,它表示企业数据模型的高层信息、整个企业的业务概念和相互关系。以这个企业模型为基础,不懂数据库技术和SQL语句的业务人员对数据仓库中的数据也能做到心中有数。
多维数据模型:这是企业概念模型的重要组成部分,它告诉业务分析人员在数据集市当中有哪些维、维的类别、数据立方体以及数据集市中的聚合规则。这里的数据立方体表示某主题领域业务事实表和维表的多维组织形式。业务概念模型和物理数据之间的依赖:以上提到的业务元数据只是表示出了数据的业务视图,这些业务视图与实际的数据仓库或数据库、多维数据库中的表、字段、维、层次等之间的对应关系也应该在元数据知识库中有所体现。

2 SQL编程题

1、连接查询

答案:

SELECT * FROM A JOIN B ON A.ID = B .ID

2、删除重复行,只保留一条记录

delete from 表名
where
重复字段名 in (
SELECT a.重复字段名from(
select 重复字段名
from 表名
group by 重复字段名 having count(1) > 1
) a
)
and
id(只保留id最小的一个) not in (
SELECT b.id from(
select min(id) as id
from 表名
group by 重复字段名 having count(1)>1
) b
)

3、将竖表Table_A转换为横表Table_B

(1)方法一:聚合函数[max或sum]配合case语句

select 姓名,
sum (case 课程 when '语文' then 成绩 else 0 end) as 语文,
sum (case 课程 when '数学' then 成绩 else 0 end) as 数学,
sum (case 课程 when '英语' then 成绩 else 0 end) as 英语
from Table_A
group by 姓名

(2)方法二:使用pivot

select * from Table_A pivot (max(成绩)for 课程 in(语文,数学,英语)) 临时表

PIVOT用于将列值旋转为列名(即行转列),在SQL Server 2000可以用聚合函数配合CASE语句实现

PIVOT的一般语法是:PIVOT(聚合函数(列) FOR 列 in (…) )AS P

参考:https://www.cnblogs.com/liushen/p/3333936.html

3 业务应用SQL编程题

1、 理财数据库,表结构如下

说明:除了Fund表的余额Fbalance字段和Investment表的投资金额Iaccount字段为number,其他字段均视为字符串

(1)查询投资过600571的这个产品且单笔投资金额不少于10000的客户的客户号和名字且按姓名降序排列

(2)给Product表新增字段Pvalue,类型未字符串,长度为32位,不允许为空

(3)在投资流水表Investment中,新建客户号、经理人工号和产品代码的唯一索引

(4)为表彰业绩优秀的经理人,请查询投资600571这个产品投资金额在平均值以上的客户的经理人的工号和姓名,现在投在600571这个产品的客户要从自己的资金账户统一追加投资5000元,请操作相关的表。

解析:我自己写的答案,不保证正确性

1SELECT  client.Cno,cilent.Cname FROM cilent JOIN Investment ON client.Cno = Client.Cno WHERE Investment.Iaccount>10000 AND Investment.Pno ='600571' ORDER BY Client.Cname DESC

2ALTER TABLE Product add Pvalue char(32) NOT NULL

3ALTER TABLE Investment ADD UNIQUE INDEX Investment_index (Cno,Mno,Pno)

4SELECT Manager.Mno,Manager.Mname FROM Manager JOIN Investment WHERE Investment.Pnp = '600571' and Iaccount > (select AVG(Iaccount) FROM Investment GROUP BY Cno)

UPDATE Investment  SET Iaccount =  Iaccount+5000 WHERE Pno ='600571' 
UPDATE Found INNER JOIN Client ON Client.Fno = Found.Fno SET Fbalance  = Fbalance -5000 WHERE Clinent.Cno IN (SELECT Cno FROM Investment  WHERE Pno='600571' )

2、表结构如下

说明:TradeType:B–申购,S–赎回

TradeStatus:T–交易成功个,F–交易失败

TradeDate:格式为YYYYMMDD

回答下面问题

(1)请给用户表的用户ID增加一个唯一索引

(2)请按日统计2016年10月份各产品的交易金额(含失败),并按交易日期进行降序排序。

(3)将2016年10月31日的所有交易金额大于1000的交易状态更新为交易成功

(4)请列出所有购买过货币基金产品的客户姓名

(5)请列出2016年10鱼粉申购交易前10的产品

解析:我自己写的答案,不保证正确性

1CREATE UNIQUE INDEX ID_index ON Users(ID)

2SELECT Amount FROM TradeDetail WHERE month(TradeDate) = '10' and year(TradeDate)='2016' ORDER BY Amount DESC

3UPDATE TradeDetail SET TradeStatus='T' WHERE TradeDate ='20161031' and Amount >1000

4SELECT UserName FROM Users WHERE UserId in (SELECT UserId FROM TradeDetail JOIN Product ON TradeDetail.PrdNo = Product.PrdNo WHERE Product.PrdType='C')

5SELECT PrdName FROM Product JOIN TradeDetail ON Product.PrdNo = TradeDate.PrdNo WHERE month(TradeDate)='10' and year(TradeDate)='2016'

l JOIN Product ON TradeDetail.PrdNo = Product.PrdNo WHERE Product.PrdType=‘C’)

5、SELECT PrdName FROM Product JOIN TradeDetail ON Product.PrdNo = TradeDate.PrdNo WHERE month(TradeDate)=‘10’ and year(TradeDate)=‘2016’




数据挖掘2022年2023届秋招知能科技公司机器学习算法工程师笔试题(代码片段)

岗位:高级机器学习算法工程师笔试时间:2022-9-281简答题1、神经网络中防止过拟合的方法(1)降低模型复杂度(2)正则化,正则化正是通过在损失函数上添加额外的参数稀疏性惩罚项(正则项... 查看详情

数据挖掘2022年2023届秋招奇虎360机器学习算法工程师笔试题(代码片段)

公司:奇虎360岗位:机器学习算法工程师笔试时间:2022年10月9号1选择题1、E(X2)E(X^2)E(X2)的计算PX=1=2/3,PX=0=1/6,PX=-1=1/6解析:E(X2)=12∗2/3+02∗1/6+(−1)2∗1/6=2/3+1/6& 查看详情

数据挖掘2022年2023届秋招爱玩特智能量化研究员岗笔试题(代码片段)

公司:爱玩特智能岗位:量化研究员时间:2022年10月17号,线下开卷笔试1题目笔试说明1、编程要求语言:Python结果汇总至Excel,表一至表五代码分块汇总至一个python文件、要求注释完整2、数据说明数据库... 查看详情

米哈游2023届秋招开启校招唯一专属内推码eytuc

爆个猛料很猛的米哈游7月又有新岗位啦!!!!不打卡弹性工作。抓紧金7银8面试机会,年中岗位多、急、需求量大,offer流程快。现招:技术(算法、前端、后台、大数据、安卓ios测试,C++,游戏开发,客户端开发,Unity开发,引... 查看详情

2023届秋招提前批信息汇总(持续更新ing)

 实时更新的文档:2023届秋招提前批信息汇总(持续更新ing)(qq.com)公司投递链接面试网站工作地点截止时间互联网及私企(软件)网易游戏网易游戏(互娱)校园招聘官网https://www.mianshi.online/广州深圳、杭州、... 查看详情

数据挖掘2022年2023届秋招kanaries雾角科技算法岗笔试题(代码片段)

Kanaries雾角科技算法岗位笔试笔试时间:2022年10月13号时长:120分钟几乎是刷过的算法题,最后一题是难度题,其他都是中等题目。1、LeetCode2038.如果相邻两个颜色均相同则删除当前颜色(1)题目总共有n个... 查看详情

恒生电子发布2023金融科技趋势研究报告,探索数智金融时代技术创新

12月8日,恒生电子在“数智·共生·向未来”2022恒生金融技术大会上正式发布《2023金融科技趋势研究报告》(以下简称“报告”)。该报告从安全可控、数据智能、性能体验、效率协作四个方面,对2023年金融科技... 查看详情

2023届秋招回顾,寒气逼人。。。

作者:OliQ来源:https://www.cnblogs.com/yuanchuziwen/p/16770895.html一、自我介绍就叫我OliQ吧(《白鲸》式的开局)!我来自杭州的一所双非一本学校,是一名普通的本科生,专业【软件工程】。1.1初学编程事实上,我... 查看详情

我的cv算法岗上岸之路(2023届秋招)

 Datawhale干货 作者:记忆的迷谷@知乎,整理:极市平台来源丨https://zhuanlan.zhihu.com/p/576729164导读 在卷成麻花的2022年,一个没有上述背景、没有名校撑腰的普通科班小硕能入坑中大厂的CV算法岗吗?作者亲... 查看详情

2023届秋招技术岗内推专场来啦~内推名额等待优秀的你

2023届秋季校园招聘开始啦!作为一个过来人,深知找工作的无奈和奔走的劳累。我是本次校招推星官,小伙伴们赶快准备简历,然后找我内推吧。23届毕业找工作的同学可以注意一下,和博主一起共事的内推... 查看详情

2023届秋招技术岗内推专场来啦~内推名额等待优秀的你

2023届秋季校园招聘开始啦!作为一个过来人,深知找工作的无奈和奔走的劳累。我是本次校招推星官,小伙伴们赶快准备简历,然后找我内推吧。23届毕业找工作的同学可以注意一下,和博主一起共事的内推... 查看详情

偷偷盘点一下23届秋招薪资(代码片段)

...者丨库森来源丨程序员库森(ID:Coolsen88)2023届秋招形式比起前几年严峻了很多,大厂缩招、小厂停招,寒气逼人。我根据牛客网、offershow小程序、脉脉、qq微信群等渠道收集汇总了一波2023届秋招技术岗薪资... 查看详情

自动驾驶决策规划-控制方向2023届秋招总结

隔了这么久,终于打算好好总结一些自己的秋招历程了。。1.基本情况985本硕,研究方向是深度强化学习与机器人控制。今年秋招投递的岗位主要是自动驾驶的决策规划或控制岗位,当然前期也投递了一些机器人公司... 查看详情

2023届秋招,我重新认清了自己

仅记录个人经历,充满主观感受,甚至纯属虚构,仅供参考,杠就是你对本想毕业再写,但是考虑到等毕业了,24秋招的提前批就快开始了,大概就来不及了,正好现在有点时间,陆陆续续的写... 查看详情

一个高考失利人的2022届秋招复盘,目前收到腾讯字节百度阿里京东的offer

文章目录一个高考失利人的2022届秋招复盘,目前收到腾讯字节百度阿里京东的offer前言本人情况和秋招结果战绩大学时间线安排大一大二举一些面试例子数据结构和算法如何考?如何学习这部分知识网络原理如何考?如何学习这部分... 查看详情

聚焦四大领域,恒生电子发布2022年金融科技技术与应用趋势

12月1日,恒生电子在2021LIGHT开发者云大会上正式发布《2022金融科技趋势研究报告》(以下简称“报告”)。报告详细分析2022年金融科技在数据、智能、效率、安全四大领域的核心技术与应用发展趋势,并对VR、量... 查看详情

用pandasdataframe来抓取重构金融股票的各种业务&数据形态(代码片段)

...据,可以看出/设计出多少种业务和股票指标。 A. 恒生成份股的股份编号恒指成份股编别=list(恒生成份股.keys())B. 个股的收市价&成交额。腾讯收市价=恒生指数[成份股].iloc[大市成交日,收市价]腾讯成交额=恒生指数[... 查看详情

2023秋招——大数据研发工程师提前批一面(代码片段)

🌻最近在准备秋招,又到了面试的环节,我将会对秋招面试的问题进行一系列的复盘,在面试中一点一点成长。对往期内容感兴趣的小伙伴可以参考下面👇:链接:2022暑期实习字节跳动数据研发面试经历-... 查看详情