dataphin功能:集成——如何将业务系统的数据抽取汇聚到数据中台

阿里云云栖号 阿里云云栖号     2022-12-20     616

关键词:

简介: 数据集成是简单高效的数据同步平台,致力于提供具有强大的数据预处理能力、丰富的异构数据源之间数据高速稳定的同步能力,为数据中台的建设打好坚实的数据基座。

数据中台是当下大数据领域最前沿的数据建设体系, 它并不是从零开始, 无中生有的。数据中台是传统的数据仓库的一种升级, 是数据采集、建设、管理与使用的一整套体系。Dataphin是一个构建数据中台的强大工具, 数据集成是Dataphin的组成部分,负责数据“采”、“建”、“管”“用”中的采集部分。数据集成是简单高效的数据同步平台,致力于提供具有强大的数据预处理能力、丰富的异构数据源之间数据高速稳定的同步能力,为数据中台的建设打好坚实的数据基座。

(Dataphin:面向各行各业大数据建设、管理及应用诉求,一站式提供从数据接入到数据消费全链路的智能数据构建与管理的大数据能力,包括产品、技术和方法论等,助力打造标准统一、融会贯通、资产化、服务化、闭环自优化的智能数据体系,以驱动创新。)

数据集成定位

数据集成是数据中台建设中最基础的工作,将不同系统的数据相互打通,实现数据自由离线或实时流动。

面对各行各业对大数据越来越多的应用,对数据集成也有了更多的诉求。包括:能够简单高效的配置大量数据表的同步任务;能够集成多种异构数据源;能够实现对数据源的数据进行轻度预处理;能够实现数据同步任务的调优(例如容错,限速,并发)等。Dataphin的数据集成模块主要面向企业数据开发人员,以组件拖拉拽的形式,帮助企业高效构建大数据流通管道,从而将各种烟囱状态的数据汇聚到数据中台

数据集成能力

数据集成旨在为用户构建简单高效、安全可靠的数据同步平台:

  • 支持通过整库迁移(快速生成批量同步任务)和一键生成目标表的方式,提高数据集成的效率。
  • 支持流程和转换组件,实现数据源的数据预处理(例如清洗、转换、字段脱敏、计算、合并、分发、过滤等)能力。
  • 支持丰富的异构数据源,实现数据源之间数据高速稳定的同步能力。
  • 支持Dev-Prod和Basic的开发模式,您可以根据业务场景进行灵活选择开发模式。
  • 支持将Dataphin中创建的逻辑表快速地同步到目标库。
  • 用户可自定义系统尚未支持的数据源组件,以满足不同业务场景数据同步的需求。

数据集成场景关注要点

- 易用性

用户进行数据中台建设时,需要集成的表的数量往往很多,需要进行大量重复的繁琐配置工作。

Dataphin的数据集成通过高效的拖拽式操作,自动化一键自动建表、组件复制和整体管道配置复制,批量化的整库迁移等操作可大大提高系统的易用性及操作效率。

Dataphin的数据集成的画布数据的输入、转换、输出组件、采集工作流、采集任务等可视化功能,使管理员直观的掌握数据采集情况。

Dataphin的数据集成在任务搭建过程中支持同步任务试运行、度量查看、数据预览,方便用户进行数据集成任务的调试。

- 多源异构的数据同步能力

在企业信息化建设过程中,由于各业务系统建设和实施数据管理系统的阶段性、技术性以及其它经济和人为因素等因素影响,导致企业在发展过程中积累了大量采用不同存储方式的业务数据,包括采用的数据管理系统也大不相同,从简单的文件数据库到复杂的网络数据库,它们构成了企业的异构数据源。

在数据中台的建设中,需要支持各种异构数据源的数据集成,Dataphin的数据集成可支持30+种数据源的支持,同时可自定义数据源进行灵活接入。

- 数据预处理、同步配置能力

在数据集成过程中,来源端数据会有轻度预处理诉求,比如敏感数据加密、数据过滤、分库分表数据合并、追 加字等。也会有各式各样同步配置诉求,如容错,限速,并发,同步过程调试等。

Dataphin的数据集成支持数据清洗转换能力,提供字段计算、合并、分发、过滤、字段脱敏等组件或函数,支持容错配置、并发配置、限速配置等。

以上就是Dataphin的核心功能数据集成的介绍, 希望能帮助您更好地使用Dataphin数据集成功能。

原文链接
本文为阿里云原创内容,未经允许不得转载。

如何将业务系统的数据抽取汇聚到数据中台?

简介:数据集成是简单高效的数据同步平台,致力于提供具有强大的数据预处理能力、丰富的异构数据源之间数据高速稳定的同步能力,为数据中台的建设打好坚实的数据基座。-更多数智化转型、数据中台内容请加... 查看详情

企业中系统间的几种对接方式

...性  当我们进行系统对接和集成时,要求集成的系统及功能代码改动量最小。技术选择  不同的技术选型涉及到不同的软硬件的支持,学习及开发成本也会有所不同。数据格式  系统的集成即数据的交互对接,从本质上来... 查看详情

呼叫中心系统是如何构建的?

...限度地发挥呼叫中心的作用。应用集成应体现优秀的接口功能,通过呼叫中心系统与其他系统的集成,如:数据和接口等不同的集成方式,快速传递数据和业务信息。3.实施能力。呼叫中心系统的建设是一项复杂的工程,它的成... 查看详情

用友yonsuite与旺店通数据集成对接-技术篇2

客户需求:旺店通企业版结合旺店通WMS以及其他品牌的WMS(京东沧海)进行电商业务的管理,线下使用的是用YonSuite系统进行财务和业务的核算系统,全部业务数据将汇集到用友YonSuite系统,现在需要将三套系统的相关数据进行... 查看详情

dataworks数据集成开发规范

...b、点击提交后页面如下所示,可以看到主要分为四部分功能区,下面将进行每一部分功能区的简述。 左上角功能区主要是保存和运行提交功能区,第一个功能键为保存;第二个功能键为运行,参数取数按照上次运行的参数值... 查看详情

spring学习整理

...述将Spring理解为管理对象间依赖关系的容器“解耦”根据功能的不同,可以将一个系统中的代码分为主业务逻辑与系统级业务逻辑两类```Spring是为了解决企业级开发的复杂度问题1.主业务逻辑保险业务银行业务2.系统级业务逻辑... 查看详情

电脑进销存软件如何选型

...款、委外进货管理、委外品质管理,因此具备一体化管理功能的电脑进销存软件成为众多企业的选择。市面上的进销存系统种类有很多,究竟哪款适合企业?电脑进销存软件如何选型?  选型过程中需要结合企业的管理需求、... 查看详情

android6.0如何将supersu的root权限管理功能集成到系统源码里面

...将SuperSU集成到系统源码中,使系统自带root权限管理功能。在此总结一下集成SuperSU到Android源码中需要注意的几个要点:1.设置selinux为disable或者permissive模式;2.设置ro.secure=0;3.将superuser.apk预置到system/app目录下&... 查看详情

dataphin核心功能:安全——基于数据权限分类分级和敏感数据保护,保障企业数据安全

...,对企业的数据安全使用和管理提出了更高的要求。Dataphin提供基于数据分级分类和数据脱敏的敏感数据识别和保护能力,助力企业建立合规的数据安全体系,保障企业数据安全。本篇,我们就来聊聊Dataphin的数据... 查看详情

什么是数据仓库?

...可以很好地解决事务处理,实现对数据的“增删改查”等功能,但是却不能提供很好的决策分析支持。因为事务处理首先考虑响应的及时性,多数情况都是在处理当前数据,而决策分析需要考虑的是数据的集成性和历史性,可能... 查看详情

数据仓库基础内容

...低了数据抽取的复杂性。转移一部分业务系统的细节查询功能,因为ods存放的数据与业务系统相同,原来有业务系统产生的报表,现在可以从ods中产生了。完成数据仓库中不能完成的功能。ods存放的是明细数据,数据仓库dw或dm 查看详情

spring学习,初识spring

...述将Spring理解为管理对象间依赖关系的容器“解耦”根据功能的不同,可以将一个系统中的代码分为主业务逻辑与系统级业务逻辑两类```Spring是为了解决企业级开发的复杂度问题1.主业务逻辑保险业务银行业务2.系统级业务逻辑... 查看详情

为啥企业需要数据仓库

...供准确、及时的的报表。虽然给业务系统也能够提供报表功能,但由于业务处理系统是为实现某个业务功能开发的,业务处理系统中的报表只能提供局部的信息,无法提供关于企业整体的信息,使管理人员有“只见树木,不见森... 查看详情

新一代数据集成平台apacheseatunnel的原理和实践

1数据集成概览在对数据集成做概论之前,首先我们要提出一个问题,什么是数据集成? 从字面意义上来讲,数据集成就是把不同来源格式以及特点性质的数据在逻辑上或者物理上有机地进行集中,从而为企业提供全面的数... 查看详情

mes与erp系统如何做系统集成

...业信息化系统中关系密切,二者相辅相成。两个系统有效集成会大大提高企业运营效率。ERP与MES主要有以下几种集成模式:(1)封装调用集成模式所谓“封装”就是指将对象的属性和操作方法同时封装在定义的对象中,用操作... 查看详情

数据集成产品分析

数据集成产品分析数据集成产品致力于异构数据源之间的数据交换与汇聚,该类产品是数据中台建设的第一环节,笔者将通过两篇文章对数据集成产品进行分析。数据同步,又称为数据集成、数据迁移,主要用于... 查看详情

如何整合redismongodbmysql

...大文本数据放进mongodb存取中  4.数据统计计数增加阀值功能  用mysql将memcached、redis、mongodb三者结合起来,  根据实际业务需要看一下哪些适合memcached、redis缓存存取,哪些适合mongodb存取.  核心架构:  1)、应用系统... 查看详情

集成测试

...成测试策略:基于层次的集成:自顶上下与自底向上基于功能的集成:按照功能的优先级逐步将模块加入系统中基于进度的集成:把最早可获得的代码进行集成基于使用的集成:通过类的使用关系进行集成集成测试考虑的问题:... 查看详情