京东蚂蚁新浪工行等面向云原生的运维数智化转型实践丨dams峰会

铭毅天下 铭毅天下     2023-03-08     794

关键词:

云原生浪潮的来势汹汹,势必让企业的运维模式、运维工具、运维团队构建等发生巨大变化,不得不面临复杂的转型和改造,企业如何提前迎战,并借助云原生带来的便捷和弹性,推动自身的数智化转型?为此,第八届DAMS中国数据智能管理峰会特别精选以下运维领域热门议题,将于3月31日在上海与大家一起进行深度探讨。

DAMS中国数据智能管理峰会


时间:2023年3月31日

地点:上海龙之梦大酒店(上海市长宁区延安西路1116号)

指导单位:中国信息通信研究院、上海市软件行业协会、上海市计算机行业协会

主办单位:dbaplus社群

运维主题看点

  • 京东、美团、蚂蚁、新浪、携程、vivo、工商银行、华夏银行等互联网名企和大型银行,都是怎么做运维数智化转型的?

  • 如何基于数据库源码的分析,快速、准确定位故障根因?

  • AI算法如何更好地与真实运维场景结合,使运维数据价值升级?

  • 云时代下,如何通过存算分离、离在线混部等设计,满足高并发、高可用、高性能的需求?

  • 金融行业规模化、移动化、无人化运维如何规划与落地?

演讲嘉宾及议题

工商银行规模化监控系统落地实践

工商银行 数据中心系统三部副总经理 胡继强

介绍工行全球总分行组织模式下,两地三中心高可用布局的监控体系结构,以及超十万级纳管服务器规模的监控数据采集、处理、预警、通知和自动化处置的方法,具体包括以下内容:

  1. 工行开放平台的监控体系;

  2. 如何适应云环境、分布式、国产化等规模化、差异性的挑战;

  3. 未来,监控系统将何去何从。

云原生离线在线资源混部技术落地

携程 研发总监 周昕毅

介绍基于K8S平台进行离线计算集群与在线应用集群的资源混部的技术方案,具体包括以下内容:

  1. Yarn on K8S;

  2. 云原生网络模型;

  3. 统一资源调度;

  4. 大数据平台自动化运维管理。

vivo业务高可用建设实践

vivo 业务运维总监 周甲黎

随着业务高速发展,vivo对稳定性的诉求越来越高,面临着机房可用性、业务强耦合等多方面的挑战,本次分享将基于这些业务挑战,给大家带来一些高可用建设的新想法和建议,具体包括以下内容:

  1. 影响业务稳定性的因素;

  2. 高可用建设的常用方法;

  3. 在业务标准化、高可用架构应用、预案演练及复盘等四个方向做的重点建设、沉淀的运维方法,尤其是高可用建设的具体落地实践。

京东科技全链路故障诊断智能运维实践

京东科技 智能运维算法高级经理 张静

本次分享将介绍京东科技智能运维整体能力、传统运维与智能运维在故障预警到根因定位的直观比对时间轴,以及智能运维建设的价值。还将详述时序异常检测算法学件在京东科技线上横向业务场景,纵向监控、数据库、网络、资源调度等多个场景的落地经验,并提供以下启发:

  1. 运维算法学件建设经验,持续化迭代训练体系搭建方案;

  2. 运维算法学件与真实运维场景落地结合的实践经验;

  3. IEEE智能运维方向论文收录经验,知识产权创新点挖掘方法。

混沌工程在中国银行的实践探索

中国银行 信息科技运营中心技术经理 侯楠楠

众所周知,在一个复杂的分布式系统中,我们并不能阻止系统软硬件故障的发生,所以应该致力于在异常行为被触发前,尽可能多地识别出会导致异常的环节。当我们识别出这些风险时,就可以有针对性地对系统进行加固、防范,从而避免故障发生并带来严重后果。这就是本次分享混沌工程的目的,具体将介绍以下内容:

  1. 混沌工程的背景;

  2. 基于分布式建设的混沌工程实践在中国银行的探索;

  3. 混沌工程平台建设的思路;

  4. 混沌工程对生产安全的意义。

新浪智能数据分析平台建设

新浪 部门主管 高鹏

近些年“可观测”成为运维场景的标配,其对大数据系统提出了更高的要求,本次分享将介绍新浪在此挑战下构建智能数据分析平台的经验,具体包括以下内容:

  1. 如何协助开发构建全链路监控体系,将业务的繁杂调用关系搜集到统一分析平台,构建统一分析、报警平台;

  2. 在高达近千万写入量的背后,是一套高效、低成本的数据分析平台,如何在其上构建对用户友好的系统,方便用户捞取、分析数据;

  3. 除了在运维监控领域,如何将数据分析、数据科学用于成本分析,并结合K8S对资源实现更细粒度的动态弹性,降低服务成本。

数据库故障分析&性能优化平台建设

美团 数据库自治服务团队负责人 沈裕锋

分享如何基于MySQL源码的分析来快速、准确定位故障根因以及通过改造MySQL查询优化器源码,基于Cost模型自动给出风险SQL的索引优化建议,具体包括以下内容:

  1. 快速、精准地做数据库故障根因分析;

  2. 快速发现潜在的风险SQL并自动给出索引优化建议;

  3. AIOps在数据库领域的探索及落地经验。

云数据中心的移动化和无人化运维探索与实践

华夏银行 信息科技部中间件维护组组长 魏中伟

主要介绍华夏银行云数据中心在向“四层三域一中台”架构演进的过程中,对移动化和无人化运维的探索路径和经验总结,具体包括以下内容:

  1. 华夏银行云数据中心的“四层三域一中台”运维架构是如何构建的;

  2. 华夏银行构建移动化运维体系的搭建方案、安全措施、最新成果;

  3. 华夏银行无人化运维的实现方案、经验总结、最新成效和未来计划。

运维数据价值升级:基于SLO健康度体系探索与实践

蚂蚁集团 AIOps技术专家 徐新龙

SLO为应用的服务质量定义了明确的目标,帮助团队提供一致的客户体验、平衡功能研发与平台稳定性,改善与内部和外部用户的沟通。本次分享将以蚂蚁集团内部实践为例,介绍如何从0到1构建SLO、如何将AI结合SLO使数据发挥更大价值,以及基于SLO的健康度体系在运维场景下的成功实践,并提供以下启发:

  1. 结合实际场景和需求,定义SLO的意义和出发点;

  2. 通过标准化设计,构建自动化能力,提升规模和场景覆盖,简化SLO配置的复杂度和费力度;

  3. 将SLO应用到日常的应急场景中,结合AI算法在异常检测、故障定位、预案推荐等场景下的使用,提升应急能力和效率。

因智而治,数据库“自动驾驶”的探索和实践

阿里云 数据库事业部高级产品专家 胡航丽

智能化,是数据库未来的重要发展方向之一。AI for DB,帮助数据库具备自感知、自定位、自修复、自运维的能力,可以有效简化数据库的运维难度,帮助数据库实现“自动驾驶”。本议题将分享阿里云数据库在“自动驾驶”上的具体实践和经验。

*更多运维主题演讲嘉宾及干货议题在路上,持续更新……

峰会议程

门票/商务合作请联系钟女士,联系电话:14743605356

邮箱:zhongminhui@dbaplus.cn

报名方式

铭毅天下 · 专属优惠

码上报名,共襄盛会

输入优惠码:“MYTX" 99元全日普票免费  限额5张 先到先得,抢完即止

更有团购票29.9元/人  非常亲民的门票价格  希望技术人都可以参与的

运维侠客行杭州站沙龙回顾|云时代下的运维管理实践

...牌,杭州作为首站,活动当天汇聚了来自不同行业和企业的运维从业人员,其中有几十年的运 查看详情

如何提高it运维效率深度解读京东云基于自然语言处理的运维日志异常检测aiops落地实践

作者:京东科技 张宪波、张静、李东江基于NLP技术对运维日志聚类,从日志角度快速发现线上业务问题日志在IT行业中被广泛使用,日志的异常检测对于识别系统的运行状态至关重要。解决这一问题的传统方法需要复杂的基... 查看详情

精选案例|《金融电子化》:光大银行云原生背景下的运维监控体系建设

...同比增长29.3%。光大银行在数字化转型过程中积极应用云原生技术对业务系统进行了升级改造,大幅提升了底层技术平台对上层业务的支撑能力,不过伴随而来的全新的运维体系建设难题的解决也变得迫在眉睫。借助博睿数据在... 查看详情

敏稳融合时代,云原生paas是企业it转型的“灵药”吗?

...、提效降本、敏捷创新的需求。近日在云栖大会上,蚂蚁集团发布了最新的云原生PaaS平台SOFAStack4.0,作为一款覆盖了应用研发、运行、运维完整生命周期的全栈PaaS产品,打破稳态架构与敏态架构的界限,能够帮... 查看详情

重磅|用友《数字化中台》震撼上市!数智化转型和商业创新实践的企业级经验!

当前,数智化浪潮、国产化浪潮、全球化浪潮三浪叠加,云计算、移动互联网、大数据、人工智能、物联网等新技术与实体经济加速融合,为中国企业和公共组织的数智化转型带来了历史性的发展机遇。但是,如... 查看详情

微博云原生技术的思考与实践

本文由新浪微博架构师陈飞撰写,因见解深刻,故在此转载现在越来越多的企业开始全面拥抱云计算,开始关注云原生技术。从管理物理数据中心到使用云主机,我们不用再关心基础运维。从云主机到 Kubernetes容... 查看详情

网易x工行:云原生日志系统loggie正式开源!

性能不达标,或者扩展功能开发效率低,未达到很好的平衡对容器化场景支持有限大部分开源项目均未提供一套完整的日志解决方案一栈式日志解决方案:同时支持日志中转、过滤、解析、切分、日志报警等云原生的日志形态:... 查看详情

21世纪商业模式论坛丨韧性突围,容联云驱动企业可持续增长

...模式高峰论坛”在上海举行。作为赋能企业营销与服务数智化转型的SaaS服务商,容联云CFO李亦鹏受邀出席大会,并发表演讲。part01、数智化转型成为驱动企业增长的大势所趋对于每一家企业来说,“增长”都是永恒... 查看详情

以ai赋能企业数智化转型容联“云端”服贸会完美收官

...利闭幕,容联云携容犀机器人、空中营业厅等金融数智化转型解决方案亮相云上展厅并与观众进行沉浸式互动,助力金融机构实现可信、普惠、可持续增长的数智化实践。作为行业的通讯+AI的引领者,容联云致力... 查看详情

sofastackcafe单元化混合云产品中的kubernetes多集群实践

背景SOFAStack是蚂蚁集团的商业化金融级云原生架构产品,基于SOFAStack可快速搭建云原生微服务体系,快速开发更具可靠性和扩展性、更加易于维护的云原生应用。在宏观架构层面,提供单机房向同城双活、两地三中心... 查看详情

助力企业数据飞轮转起来!火山引擎云原生数仓bytehouse全面大促中

...正式将自身数据驱动能力,通过火山引擎数智平台VeDI全面向外开放,为企业提供了丰富的数据能力工具;而在今年四月举行的春季FORCE原动力大会上,火山引擎正式对外发布了数据飞轮模式,进一步解析了数据驱动的增长本质—... 查看详情

运维百家讲坛第2期:作业帮聂安-运维如何转型,听听作业帮的opas思路

...户,并维持服务运转;特点是强依附于业务领域危机,云原生时代公有云大量使用、微服务架构和DevOps真实达成、工具体系持续繁荣,传统运维的职责不断被外包、转移、替代,出现了领域危机组织结构,协作方式从人人协同、... 查看详情

蚂蚁金服互联网it运维体系实践

摘要: 本文来自蚂蚁金服首席技术架构师,基础技术部负责人胡喜。从2010年支撑双十一最高交易峰值2万笔/分钟到2015年双十一的8.59万笔/秒,蚂蚁金服的技术架构和运维体系一直都在不断摸索和实践。本文就“互联网IT运维... 查看详情

数商云与京东云携手,共筑paas新生态

7月13日,京东云峰会在北京圆满落幕!本次峰会全面展示了京东云在容器化、云原生方向的领先优势及应用实践,并与行业客户及合作伙伴分享以技术驱动产业数智化升级和驱动增长的全新业务战略和全线新品。图/... 查看详情

京东云新浪微博等专家畅谈docker未来格局:开放与竞争(上)

田琪(@摇摆巴赫)是京东资深架构师,10年互联网行业从业经验,之前曾分别就职于搜狐、新浪、腾讯等公司,眼下负责京东云主机及云数据库的架构及研发工作。对云计算基础技术有深刻理解。DockerCon2015于6月22-23号在美国旧金山... 查看详情

业界首发丨《云原生网络数据面可观测性最佳实践》重磅来袭

...;后台回复“链路观测”即可免费下载电子书ACKNetExporter是面向Kubernetes云原生环境的网络监控工具,现在已经开源为KubeSkoop项目(https://github.com/alibaba/kubeskoop),针对云原生网络的痛点,提供以下功能:针... 查看详情

中国工商银行基于ebpf技术的云原生可观测图谱探索与实践

...越来越无法应对新业务形态所带来的巨大冲击与挑战。云原生相关技术使业务应用呈现微服务众多、多语言开发、多通信协议等典型特征,调用链路日益复杂,监控数据爆发性增长,传统监控方式已无法适应云原生场... 查看详情

微博云原生技术的思考与实践

本文由新浪微博架构师陈飞撰写,因见解深刻,故在此转载现在越来越多的企业开始全面拥抱云计算,开始关注云原生技术。从管理物理数据中心到使用云主机,我们不用再关心基础运维。从云主机到 Kubernetes容... 查看详情