如何将业务系统的数据抽取汇聚到数据中台?

阿里云开发者 阿里云开发者     2022-12-22     571

关键词:

简介:数据集成是简单高效的数据同步平台,致力于提供具有强大的数据预处理能力、丰富的异构数据源之间数据高速稳定的同步能力,为数据中台的建设打好坚实的数据基座。

-更多数智化转型、数据中台内容请加入阿里云数据中台交流群以及官方微信(文末扫描二维码)

-阿里云数据中台官网 https://dp.alibaba.com/index




数据中台是当下大数据领域最前沿的数据建设体系, 它并不是从零开始, 无中生有的。数据中台是传统的数据仓库的一种升级, 是数据采集、建设、管理与使用的一整套体系。                Dataphin是一个构建数据中台的强大工具, 数据集成是Dataphin的组成部分,负责数据“采”、“建”、“管”“用”中的采集部分。数据集成是简单高效的数据同步平台,致力于提供具有强大的数据预处理能力、丰富的异构数据源之间数据高速稳定的同步能力,为数据中台的建设打好坚实的数据基座。

(Dataphin:面向各行各业大数据建设、管理及应用诉求,一站式提供从数据接入到数据消费全链路的智能数据构建与管理的大数据能力,包括产品、技术和方法论等,助力打造标准统一、融会贯通、资产化、服务化、闭环自优化的智能数据体系,以驱动创新。详细了解:https://dp.alibaba.com/product/dataphin)

数据集成定位

数据集成是数据中台建设中最基础的工作,将不同系统的数据相互打通,实现数据自由离线或实时流动

面对各行各业对大数据越来越多的应用,对数据集成也有了更多的诉求。包括:能够简单高效的配置大量数据表的同步任务;能够集成多种异构数据源;能够实现对数据源的数据进行轻度预处理;能够实现数据同步任务的调优(例如容错,限速,并发)等。Dataphin的数据集成模块主要面向企业数据开发人员,以组件拖拉拽的形式,帮助企业高效构建大数据流通管道,从而将各种烟囱状态的数据汇聚到数据中台


数据集成能力

数据集成旨在为用户构建简单高效、安全可靠的数据同步平台:

  • 支持通过整库迁移(快速生成批量同步任务)和一键生成目标表的方式,提高数据集成的效率。
  • 支持流程和转换组件,实现数据源的数据预处理(例如清洗、转换、字段脱敏、计算、合并、分发、过滤等)能力。
  • 支持丰富的异构数据源,实现数据源之间数据高速稳定的同步能力。
  • 支持Dev-Prod和Basic的开发模式,您可以根据业务场景进行灵活选择开发模式。
  • 支持将Dataphin中创建的逻辑表快速地同步到目标库。
  • 用户可自定义系统尚未支持的数据源组件,以满足不同业务场景数据同步的需求。


数据集成场景关注要点

- 易用性

用户进行数据中台建设时,需要集成的表的数量往往很多,需要进行大量重复的繁琐配置工作。

Dataphin的数据集成通过高效的拖拽式操作,自动化一键自动建表、组件复制和整体管道配置复制,批量化的整库迁移等操作可大大提高系统的易用性及操作效率。

Dataphin的数据集成的画布数据的输入、转换、输出组件、采集工作流、采集任务等可视化功能,使管理员直观的掌握数据采集情况。

Dataphin的数据集成在任务搭建过程中支持同步任务试运行、度量查看、数据预览,方便用户进行数据集成任务的调试。

- 多源异构的数据同步能力

在企业信息化建设过程中,由于各业务系统建设和实施数据管理系统的阶段性、技术性以及其它经济和人为因素等因素影响,导致企业在发展过程中积累了大量采用不同存储方式的业务数据,包括采用的数据管理系统也大不相同,从简单的文件数据库到复杂的网络数据库,它们构成了企业的异构数据源。

在数据中台的建设中,需要支持各种异构数据源的数据集成,Dataphin的数据集成可支持30+种数据源的支持,同时可自定义数据源进行灵活接入。

- 数据预处理、同步配置能力

在数据集成过程中,来源端数据会有轻度预处理诉求,比如敏感数据加密、数据过滤、分库分表数据合并、追 加字等。也会有各式各样同步配置诉求,如容错,限速,并发,同步过程调试等。

Dataphin的数据集成支持数据清洗转换能力,提供字段计算、合并、分发、过滤、字段脱敏等组件或函数,支持容错配置、并发配置、限速配置等。


以上就是Dataphin的核心功能数据集成的介绍, 希望能帮助您更好地使用Dataphin数据集成功能。

了解产品更多内容可以戳入:https://dp.alibaba.com/product/dataphin




数据中台是企业数智化的必经之路,阿里巴巴认为数据中台是集方法论、工具、组织于一体的,“快”、“准”、“全”、“统”、“通”的智能大数据体系。

目前正通过阿里云对外输出系列解决方案,包括通用数据中台解决方案零售数据中台解决方案金融数据中台解决方案互联网数据中台解决方案政务数据中台解决方案等细分场景。

其中阿里云数据中台产品矩阵是以Dataphin为基座,以Quick系列为业务场景化切入,包括:

官方站点:

数据中台官网 https://dp.alibaba.com

原文链接:https://developer.aliyun.com/article/786433?

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

数据中台详解

文章目录什么是数据中台数据中台VS数据仓库数据中台的业务价值与技术价值数据中台建设与架构数据中台建设方法论数据中台架构数据汇聚联通:打破企业数据孤岛数据采集、汇聚的方法和工具数据交换数据体系建设数据... 查看详情

数据中台02:数据中台架构

...务,把数据资产变为数据服务能力,服务于企业业务。数据安全管理、数据运营体系,保障数据中台可以长期健康、持续运转。1、数据汇聚数据汇聚是数据中台数据接入的入口,数据中台本身不产生数据,所... 查看详情

数据中台体系规划建设

...业数据汇聚地,企业的一切数据都汇聚到数据中台,企业业务所需的数据总能在数据中台找到。但数据中台中的数据并不是简单地堆积,各种系统产生的原始数据堆积在一起导致使用成本非常高,这类数据只能在某些数据技术基... 查看详情

5.数据中台---数据汇聚联通:打破企业数据孤岛(代码片段)

...要构建企业级的数据中台,第一步就是要让企业内部各个业务系统的数据实现互联互通,从物理上打破数据孤岛,这主要通过数据汇聚和交换的能力来实现。在面向具体场景时,可以根据数据类型将汇聚对象分为结构化和非结构... 查看详情

如何搭建企业级中台系统(代码片段)

如何搭建企业级中台系统企业数字化转型,解决数据孤岛、万物互联:利用云计算基础服务,一分钟开启一百台服务器,十分钟开启一千台服务器。超大内存和内核的服务器,在线下很难购买到的,通过云计算的弹性伸缩的能力... 查看详情

数据集成产品分析

...转。为什么会有数据同步这类产品?在企业中,业务的快速发展产生了大量数据,也催生出多种应用系统,各系统承载不同类型的数据,对应着不同的数据存储方式。而对于构建数据中台或大数据系统,首... 查看详情

《bi项目笔记》增量etl数据抽取的策略及方法

...数据。在ETL使用过程中。增量抽取较全量抽取应用更广。如何捕获变化的数据是增量抽取的关键。对捕获方法一般有两点要求:准确性,能够将业务系统中的变化数据按一定的频率准确地捕获到;性能,不能对业务系统造成太大... 查看详情

企业中台服务:数据中台业务中台构建起数据闭环运转的运营体系

随着大数据技术和业务不断发展,将企业的核心能力以数字化形式沉淀到平台,形成以企业服务为中心,以业务中台和数据中台构建起数据闭环运转的运营体系,供企业更高效地进行业务探索和创新,以数字化资产... 查看详情

etl讲解

业务系统中,各个业务系统的数据库服务器运行什么DBMS,是否存在手工数据,手工数据量有多大,是否存在非结构化的数据等等,当收集完这些信息之后才可以进行数据抽取的设计。  1、对于与存放DW的数据库系统相同的数据源... 查看详情

数据中台建设:打破企业数据孤岛和提取数据价值

...要构建企业级数据中台,第一步就是将企业内部各个业务系统的数据实现互联互通,打破数据孤岛2,主要通过数据汇聚和交换来实现。企业采集的数据可以是线上数据采集、线下数据采集、互联网数据采集、内部数... 查看详情

什么是数据中台?数据中台带来了哪些价值?_光点科技

...品和实施方法,建立一套不断将数据转化为资产并服务于业务的机制。在政府和企业的数字化转型过程中,数据中台沉淀了各业务单元的业务和数据,构建了数据技术、数据处理、数据操作等数据建设、管理和使用系统,实现了... 查看详情

etl工具大全:kettledatacleanercanaldatax

...释个人理解ODS操作性数据仓库,应用场景:1、在业务系统和数据仓库之间形成一个隔离,ODS直接存放从业务系统抽取过来的数据,这些数据从结构和数据上与业务系统保持一致,降低了数据抽取的复杂性。2、... 查看详情

数据中台:什么是数据中台

...企业数据管理都以传统的IT架构为基础。每当技术部门为业务部门解决问题时,需要从业务需求的探查、技术壁垒的打通等从上到下各个方面来建设新系统。每个系统的建成都自成一体,各自满足业务部门的需求。这种情况不仅... 查看详情

数据仓库基础内容

...中的数据整合一起,进行数据分析,此时数据仓库对多种业务数据进行筛选和整合,可以用于数据分析、数据挖掘、数据报表。时效性T+1.二.数据仓库的特点主题性:数据仓库是针对某个主题来进行组织,比如滴滴出行,司机行... 查看详情

数据中台与数据仓库比较

从三个点来说:1)提供服务的对象2)业务域3)层次的划分  1)提供服务的对象a、数据仓库的服务对象基本上是人。明细数据,聚合指标,转化率模型,他们的目前用户都是人b、数据中台的服务对象变成人+机器。用户... 查看详情

中台:业务中台数据中台技术中台

...企业级能力复用平台为什么需要中台避免重复造轮子许多业务需求或功能需求高度类似、通用化程度很高,但是由于没有专门的团队负责规划和开发,大量的系统重复开发、重复建设,导致复用性低、效率低、产研资... 查看详情

数据中台数据分析过程梳理

在当今社会中,随着企业的快速发展,相关业务系统的建设也会越来越多,新的业务模式、新的IT架构、多云环境的出现等等。而一些问题就逐渐暴露了出来:企业之间的IT无法做到互通、新模式生产数据与旧数据... 查看详情

数据中台数据分析过程梳理

在当今社会中,随着企业的快速发展,相关业务系统的建设也会越来越多,新的业务模式、新的IT架构、多云环境的出现等等。而一些问题就逐渐暴露了出来:企业之间的IT无法做到互通、新模式生产数据与旧数据... 查看详情