线上会议精彩回顾-clouderasessionschina2021

明哥的IT随笔 明哥的IT随笔     2023-02-16     515

关键词:

大家好,我是明哥!

1 会议介绍 - Cloudera Sessions China 2021

Cloudera 官方于 2021/11/18 进行了一场全天的技术分享会 “Cloudera Sessions China 2021”,并同步进行了线上直播。

在本次全天的 Cloudera Sessions China 2021 活动中,Cloudera 以用户落地案例为主,为新老用户带来最新技术趋势的讨论和 CDP 典型场景和案例分享。其中包括混合云和私有云上数据平台的技术路线,实时数仓的架构建设,并有多位金融、制造业、零售业用户大咖以及合作伙伴介绍其最佳技术实践。

笔者有幸参加了全程线上直播,也从官方获取了大部分会议资料,在此回顾下会议亮点,并提供资料下载链接给大家。

2 会议议程回程

整个会议议程如下:

  • Cloudera 亚太区总裁致开幕辞

  • 主题演讲:Hybrid Cloud – The Power of “AND”

  • 数字化转型中的大数据趋势和技术方向

  • Dell EMC PowerScale 助力 CDP 开启大数据元宇宙

  • 浦发银行最佳实践分享

  • CDP私有云版本的最新进展与演示

  • 实时场景、实时数仓建设和演进

  • 用户分享 - 上海银行数据湖建设实践

  • 基于GPU的Spark应用加速

  • 用户分享 - 申万宏源基于混搭架构的大数据平台最佳实践

  • 用户分享 - 信也科技大数据与AI赋能新金融

  • 用户分享 – 永辉超市基于CDP的数据中台建设

  • CDP 迁移实例详解

  • Cloudera 金牌合作伙伴威士顿落地案例分享

IT大咖说官网提供了会议的直播回放,链接如下:

  • https://www.itdks.com/Home/Act/apply?id=5810&mUid=10267

3 会议精彩亮点回顾:主题演讲重点推介 CDP 混合云

Cloudera 在会议上重点推介了他们的 CDP 混合云。

4 会议精彩亮点回顾:数字化转型中的大数据趋势和技术方向

Cloudera 在会议上回顾了 HADOOP 的历史和现状,分析了当下数据类型和工作负载的变迁,由此引出了数字化转型中的大数据趋势和技术方向的预测。

这些分析和预测,刚好对应了笔者原来一篇博文里讲到的以下几点大数据发展趋势:

从技术视角看大数据行业的发展趋势

  • 大数据和云计算进一步深度融合,大数据拥抱云计算走向云原生化

  • 大数据更加青睐存储计算分离的架构

  • 大数据更加青睐对象存储

  • 大数据和机器学习/人工智能日益融合

  • 大数据日益重视数据安全

  • 大数据日益重视数据治理

5 会议精彩亮点回顾:CDP 混合云解决的用户痛点

CDP 混合云,解决了用户以下痛点: 

注:PPT 的标题中陈述的是 CDP 私有云,这其实并不冲突,因为在 CDP 私有云的 CDP private cloud base 的基础上,按需灵活扩展增加了若干个计算集群 ECS 或 OCP 后,就是 CDP 混合云了。在下一章节 “CDP 混合云的架构”中,有进一步的阐述。

6 会议精彩亮点回顾:CDP 混合云的架构介绍与展示

CDP Hybrid Cloud 顺应了企业数字化转型并最终使用混合云的大趋势,以统一的体验整合了公有云和私有云的资源,具有以下技术特点:

  • 存储计算分离

  • 计算集群快速搭建和销毁

  • 计算集群弹性扩展和收缩

  • 使用Ozone替代HDFS

  • 集中式用户权限管理

  • 集中式元数据管理

  • 通过CML整合支持机器学习和人工智能

CDP 混合云的架构如下,这里有几个要点解释下:

  • 用户通过熟悉的 Cloudera Manager,使用熟悉的 parcel包,来安装和管理 CDP BASE CLUSETER, 也就是 CDP private cloud base, 就像原来安装和管理 CDH 一样;

  • 用户通过熟悉的 Cloudera Manager,在需要的时候,使用 docker 镜像,在公有云上或私有云上,安装和管理一个或多个 ECS 或 OCP; ( ECS: Amazon Elastic Container Service; OCP: Red Hat OpenShift Container Platform, 两者都是基于 K8S/DOCKER的封装);

  • CDP BASE CLUSETER,主要当做存储集群来使用,当不使用其计算能力时,甚至可以不安装 impala/hs2/spark等计算引擎;

  • ECS 或 OCP,主要当做计算集群来使用,可以不安装也可以安装多个,当不使用其存储能力时,可以不安装 hdfs/ozone 等存储引擎;

  • ECS 或 OCP,对应不同的使用场景,可以安装多个集群,比如对应数仓场景的 CDW(cloudera datawarehouse, 其底层主要是hs2,impala,hue),对应机器学习的CML (cloudera machile learning,其底层主要是 python/r/scala 的jupiter notebook),对应数据工程的 CDE(cloudera data engineering,其底层主要是 spark,airflow)

  • 当然在复杂的场景下,CDP BASE CLUSETER 和 ECS/OCP,也可以是多对多的关系:

7 会议精彩亮点回顾:实时场景、实时数仓建设和演进

在实时场景或实时数仓场景,Cloudera 采用的是主流的 LAMBDA 架构,主要整合了以下组件:

  • 导入层:NIFI/KAFKA CONNECT + sqoop

  • 计算层:SPARK STREAMING/FLINK/KAFKA STREAM + spark/hive/impala

  • 存储层:KAFKA/KUDU/HBASE/HIVE/S3

8 会议精彩亮点回顾:基于GPU的Spark应用加速

9 会议精彩亮点回顾:CDP 迁移实例详解

  • 关于 CDP 迁移,笔者原来有关相关博文进行详细介绍,大家可以查阅;

  • 在会上留意到的一点是,已经有不少国内客户已经迁移完毕或正在迁移中了;

  • 迁移完毕后,数据一致性校验的方法需要注意;

2021 最新 Cloudera 大数据平台 CDP 升级指南白皮书完整版开放下载!(中文版)

一文看懂Cloudera对CDH/HDP/CDP的产品支持策略

为了方便读者获取,笔者已经将上述资料上传到了百度云盘,小伙伴们可以通过如下方式获取:

关注下方公众号"明哥的IT随笔",在后台回复关键词「CDP」获取下载链接;

▲点击卡片进行关注▲

▲回复「CDP」,获取PDF▲ 

线上技术分享的一些思考

...回顾和借鉴的。一、直播稳定性由于疫情,现在这种线上的会议越来越常态化,大多用的是腾讯会议(之前研究过腾讯会议的号设置机制,可以参考《腾讯会议号设计的几种猜测》),一般情况下,软... 查看详情

线上技术分享的一些思考

...回顾和借鉴的。一、直播稳定性由于疫情,现在这种线上的会议越来越常态化,大多用的是腾讯会议(之前研究过腾讯会议的号设置机制,可以参考《腾讯会议号设计的几种猜测》),一般情况下,软... 查看详情

安天365第二期线上交流圆满落幕

安天365第二期线上交流圆满落幕第二期视频会议于8月6日7:30在线上开始进行。会议历时将近四个小时,4位与会成员发表了精彩纷呈的演讲。本次会议主持由著名网络安全研究员陈小兵先生担任。主持人首先对安天365的研究近况... 查看详情

小组第四次会议(补4.11线上会议)

...员(王琦,慕晨曦,余萍,李思琦,黄晖颖)会议地点:线上会议会议内容:以4.9上课讨论以及老师的纠错为基础,进一步改正、细化已完成的各类图,完成需求规格说明书。会议记录员:王琦具体内容:1.首先各成员汇报负责... 查看详情

回顾会议议程

回顾会议议程 目标 通过总结以往的实践经验来提高团队生产力。 会议准备 邀请与会者:ScrumMaster、团队所有成员、产品负责人(可选) 附属工具:为所有参与者准备的荧光笔、贴纸、白板磁吸、白板和挂纸... 查看详情

线上圆桌整理-腾讯会议进化中的视频会议

本次分享将聚焦在进行中的视频会议,针对视频会议新技术做探讨。视频会议不是单纯的编解码和网络传输应用,它背后的数据支撑以及新能力引入都会带来新的可能和机遇。本次演讲邀请到腾讯会议产品部网络技术组... 查看详情

线上视频会议协作的需求需要突破哪些瓶颈?

随着疫情的反复来袭,线下的沟通将会减少,线上会议协作需求也将持续增长,创建多功能会议室促进本地、异地协作仍然是一个强大的趋势。无论空间大小或距离远近,越来越多的企业都需要通过对会议室环境... 查看详情

线上圆桌视频会议下半场

...后疫情时代,随着技术的急速更迭,社会上对于线上化工具的普遍态度产生了从被动接纳走向积极应用的转变。其中,视频会议也迎来了发展的黄金时代。但与此同时,来自社会的压力也使得视频会议技术正面临... 查看详情

线上|iccv2021中国预会议日程公开,注册有奖

...xff1a;https://event.baai.ac.cn/event/162或点击阅读原文报名,线上会议免费注册中国际计算机视觉大会(ICCV)是计算机视觉三大顶级会议之一,每两年召开一次,其录用的论文代表了计算机视觉领域最新的发展方向和... 查看详情

开好迭代回顾会议的5个原则

迭代回顾会议是Scrum五个仪式之一,是在迭代评审会议之后对本次迭代的优点与改进点进行复盘的一个活动,其最主要的目的是提升团队的整体能力,持续改进,形成一个自学习的团队。通过回顾会议可以使团队... 查看详情

线上圆桌-263视频会议终端到终端的加密

本次分享,将针对当前各类终端加密场景,分别介绍基于WebRTC的会议、SFU模式的会议以及WebRTCSFU模式的会议数据加密的异同。内容源自263音视频架构师 贺晓敏在视频会议下半场圆桌上的分享。PPT资料链接:https://pan.b... 查看详情

精彩回顾|2021中国.net开发者峰会

.NETConfChina2021是面向开发人员的社区峰会,基于.NETConf2021,庆祝.NET6的发布和回顾过去一年来.NET在中国的发展。峰会由来自北京、上海、苏州、深圳、武汉、广州、青岛、烟台、杭州等各地区的.NET技术社区共同发起举办&#... 查看详情

sprint回顾会议程及心得

参考技术ASprint回顾会会议议程安排:1.介绍会议目标和议程(5~10mins)   预设会议基调,主持人(ScrumMaster)会在此期间重申回顾会议的目的和此次会议的目标。2.收集数据(20~30mins) 一个迭代中发生的事件很多,... 查看详情

会议室分配算法(最大离散)

参考技术A项目需要开发一个线上会议室的预约功能,对接Zoom提供500个线上会议室,以满足用户线上会议需求。同时要求系统分配的会议室越离散越好,防止用户会议室使用超出预定时间时,影响下一场会议的进行。其中预约的... 查看详情

第十六届智能车竞赛线上全国总决赛远程组委会监督腾讯会议(代码片段)

 §01总决赛腾讯会议▲图1.0东北赛区全向行进组腾讯会议序号组别正式比赛腾讯会议好正式比赛时间1专科基础组462431639022021/08/20-2021/08/218:00-12:0014:00-18:002节能信标组89947800935-3双车接力组32583836322-4电磁越野组36223726578-5智能视觉... 查看详情

敏捷开发方法scrum

...来了,不能缩短或者延长Scrum管理五事件包括:Sprint计划会议站立会议回顾会议演示会议Scrum管理实施步骤指南(1)Sprint回顾会议会议准备会议物品:白板、便签纸、笔等;会议资料:通常有《Sprint任务清单》《站立会议问题跟... 查看详情

诚邀您参加2022第三届中国项目经理大会(线上会议)

项目经理是项目的“CEO”,项目的成败关乎公司的生存发展,公司当然不会随便任命而是会全面考核选择最合适的人担当。项目经理从领命的那一刻起就须知责任重大使命光荣,要认真挑起项目负责人的担子,带... 查看详情

腾讯会议中用ppt放视频,视频没有声音

今天做了线上汇报,好不容易做了一个视频,想着线上汇报的时候进行播放。结果,放的时候,他们说视频没有声音,我就很纳闷,想着来解决一下。 设备及软件MacbookProAirPodsMicrosoftPowerPoint腾讯会议 PPT... 查看详情