数据丢失不用怕,火山引擎dataleap提供排查解决方案

字节跳动数据平台 字节跳动数据平台     2023-03-31     733

关键词:

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群

 当一家公司的日均处理的数据流量在 PB 级别时,巨大的任务量和数据量会对消息队列(MQ)dump 的稳定性和准确定带来极大的挑战。

针对这一问题,火山引擎数智平台推出的大数据研发治理套件 DataLeap,可以为企业提供完整解决方案,帮助解决 MQ dump 在极端场景中遇到的数据丢失问题。

例如,当 HDFS(一种分布式文件系统)集群某个元数据节点由于硬件故障而宕机。那么在该元数据节点终止半小时后,运维工程师虽然可以通过手动运维操作将 HDFS 切到主 backup 节点,使得 HDFS 恢复服务。但故障恢复后, MQ dump 在故障期间可能有数据丢失,产出的数据与 MQ 中的数据不一致的情况。

此时,技术人员可以在收到数据不一致的反馈后,立即借助火山引擎 DataLeap 进行故障排查。

目前,火山引擎 DataLeap 基于开源 Flink,已经实现了流批一体的数据集成服务。通过 Flink Checkpoint 的功能,Flink 在数据流中注入 barriers 将数据拆分为一段一段的数据,在不终止数据流处理的前提下,让每个节点可以独立创建 Checkpoint 保存自己的快照。

每个 barrier 都有一个快照 ID ,在该快照 ID 之前的数据都会进入这个快照,而之后的数据会进入下一个快照。

 

在排查过程中,火山引擎 DataLeap 基于对 Flink 日志查看以及 HDFS 元数据查看,可以率先定位症结所在:删除操作的重复执行造成数据丢失。进一步解释就是,在故障期间,写入数据前的删除操作在 HDFS NameNode 上重复执行,将写入的数据删除造成最终数据的丢失。

溯源后,用户可以通过火山引擎 DataLeap 选择使用文件 State(当前的 Checkpoint id 和 task id)解决该问题,使用文件 State 前后处理流程对比如下图所示:

 

 

使用文件 State 后,在 Notify 阶段与 HDFS 交互的 metrics(打点监控系统)的平均处理时间减少了一半。

目前,企业均可以通过火山引擎 DataLeap 体验到上述 Flink Checkpoint 实践与优化方案,提升数据价值交付中的效率和质量。

 

点击跳转 大数据研发治理DataLeap 了解更多

火山引擎dataleap通过中国信通院测评,数据管理能力获官方认可!

 近日,火山引擎大数据研发治理套件DataLeap通过中国信通院第十五批“可信大数据”测评,在数据管理平台基础能力上获得认证。 “可信大数据”产品能力评测体系由中国信通院发起,是国内首个面向大数据产品的权威... 查看详情

直播预告|企业如何轻松完成数据治理?火山引擎dataleap给你一份实战攻略!

...,还考验选型、平台能力、数据部署方式等“软”技能。DataLeap是火山引擎数智平台VeDI旗下的大数据研发治理套件产品,可帮助用户快速完成数据集成、开发、运维、治理、资产、安全等全套数据中台建设,降低工作成本和数据... 查看详情

火山引擎dataleap推出全链路智能监控报警平台

...的基线监控覆盖率超过80%。当前,该能力已通过火山引擎DataLeap向企业开放。企业可以通过火山引擎DataLeap的基线监控功能,有效降低监控配置成本、避免无效报警及报警泛滥。 图:火山引擎DataLeap监控范围 火 查看详情

火山引擎dataleap:在数据研发中,如何提升效率?

...,满足实时调用需求。 目前,任务模板已是火山引擎DataLeap研发治理能力之一,主要用于管理常用的任务逻辑,以此降低常用代码的运维成本。在产品功能上,DataLeap任务模板支持丰富的引擎能力,包括LAS/EMRHSQL、LAS/EMRJavaFlin... 查看详情

火山引擎dataleap:3个关键步骤,复制字节跳动一站式数据治理经验

DataLeap是火山引擎数智平台VeDI旗下的大数据研发治理套件产品,帮助用户快速完成数据集成、开发、运维、治理、资产、安全等全套数据中台建设,降低工作成本和数据维护成本、挖掘数据价值、为企业决策提供数据支... 查看详情

火山引擎dataleap一招教你避坑“数据开发”中的资源隔离问题

...成为很多企业数仓研发团队的痛点之一。近期,火山引擎DataLeap推出“项目参数管理”能力,即通过自定义项目参数分别设置开发、生产环境参数值,参数支持配置多种类型,包括Region、DB、shecma、table、date以及自定义等,且支... 查看详情

电商流量分析怎么做?试试这款数据工具dataleap!

...数据指标。在亿级数据体量下,某电商平台基于火山引擎DataLeap、DataFinder等产品组合,通过以下三个步骤,实现从北极星指标、用户增长指标到转化漏斗等核心数据监测和分析。本文将聚焦在货架场景,揭秘电商平台流量分析背... 查看详情

火山引擎dataleap数据血缘技术实现与具体用例

目录01数据血缘模型02数据血缘优化03数据血缘用例04未来展望01数据血缘模型数据血缘模型–挑战首先介绍一下字节内部数据血缘遇到的挑战。随着公司业务扩张、用户数量持续增长以及数仓建设不断完善,元数据种类和数量... 查看详情

一:技术选型之路

...显然,做数据开发,只有Notebook是不够的。目前火山引擎DataLeap数据研发平台提供了任务开发、发布调度、监控运维等一系列能力。研发团队将Notebook作为一种任务类型,加入了火山引擎DataLeap数据研发平台,使用户既能拥有Noteboo... 查看详情

从此告别写sql!dataleap帮你零门槛完成“数据探查”

...具备一定专业门槛,并且重复操作、花费时间。火山引擎Dataleap推出的“数据探查”功能,可一举解决以上问题,帮助数据从业者校验数据量、主键、空值、枚举值等数值。用户只要进行简单的勾选操作,就能轻松获得详细、准... 查看详情

对话抖音电商:量级庞大参差不齐,“数据质量治理”有妙招!

...便捷实现数据质量监控,抖音电商数据团队引入火山引擎DataLeap数据质量平台,通过数据波动监控、异常报警、数据内容探查及差异对比工具等功能,保证数据在生产及使用流程中的可靠性和合理性,避免因为数据质量导致的数... 查看详情

助力企业数据飞轮转起来!火山引擎云原生数仓bytehouse全面大促中

用数据驱动业务提升,早已成为各类企业打破增长瓶颈,推动转型升级的一致共识。在大环境持续推动数字化转型的政策扶持下,企业仍然需要一个可借鉴的成熟经验模式,来彻底理解和实践数据驱动到底应该“怎么动”、“从... 查看详情

apachepulsar在火山引擎emr的集成与场景(代码片段)

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 近年来,基于云原生架构的新一代消息队列和流处理引擎ApachePulsar在大数据领域发挥着愈发重要的作用,其应用场景和客户案例... 查看详情

火山引擎datatester私有化部署实践经验

...——火山引擎A/B测试(DataTester)为了满足客户对数据安全、合规问题等需求,探索私有化部署是产品无法绕开的一条路。在面向ToB客户私有化的实际落地中,火山引擎A/B测试(DataTester)也遇到了字节内部... 查看详情

clickhousekafka引擎不消费问题排查

...;dws层。其中引擎表--ods,ods到dws都是通过物化视图来进行数据预处理。出问题的是ods到dws的物化视图,导致kafka引擎表无法正常工作。当然,dws、ods层都是没有数据的。从这一点来看,ClickHouse物化视图确实无法保证数据的一致性... 查看详情

火山引擎云原生数据仓库bytehouse技术白皮书v1.0(ⅳ)

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 近日,《火山引擎云原生数据仓库ByteHouse技术白皮书》正式发布。白皮书简述了ByteHouse基于ClickHouse引擎的发展历程,首次详细展... 查看详情

火山引擎成为全球边缘计算大会深圳站合作伙伴

...开放给外部企业,提供云基础、视频与内容分发、大数据、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长。火山引擎边缘计算产品火山引擎边缘计算,基于边缘基础设施和边缘云原生操作系统... 查看详情

火山引擎发布数智平台vedi,全面开放字节跳动数据技术能力

数据是“新石油”,经过提炼加工才能创造价值。9月2日,火山引擎数据智能科技峰会在杭州举办。会上,火山引擎发布新一代企业级数据产品——数智平台VeDI(VolcengineDataIntelligence),包括数据引擎、数... 查看详情