AWS DMS - 如何将 RDS 表数据写入单个 S3 目标文件?

     2023-02-19     71

关键词:

【中文标题】AWS DMS - 如何将 RDS 表数据写入单个 S3 目标文件?【英文标题】:AWS DMS - How to write to RDS table data to a single S3 target file? 【发布时间】:2021-08-30 03:05:11 【问题描述】:

我已成功设置 DMS 以 csv 格式(完全加载)将数据从 RDS(SQL Server)复制到 S3。但是,在运行任务时,DMS 会复制源表并在 S3 中为单个表创建多个 csv 文件。有什么办法可以确保对于 1 个表,DMS 只在 S3 中创建一个目标 csv 文件?

【问题讨论】:

【参考方案1】:

第一次完全加载操作会将所有数据加载到一个文件中。 对于正在进行的复制数据,迁移的数据具有不同的格式,它包含如下附加字符:

I:插入记录 U:换一个 D:删除一个

因此,它们不能合并到一个文件中。 您可以使用 Lambda 来做到这一点,但这不是一个好方法:

每当对上述 S3 存储桶(包含 csv 文件)进行任何数据更改时,将触发器添加到 S3 存储桶上的 Lambda 函数 在 Lambda 函数中:处理上述每种情况下的文件并自行合并。

我建议使用其他数据库目标,如 MySQL、Postgres 等。因为它们都支持它们。

【讨论】:

感谢您的回复。对于小表来说确实如此,但我注意到对于大表(> 1GB),DMS 在 S3 中创建了多个 CSV 文件。有没有办法解决这个问题并让 DMS 只创建 1 个大 CSV 文件?如果没有,将这些文件合并为一个的最佳方法是什么?

如何在数据加载之前截断 AWS Glue 作业中的 RDS 表?

】如何在数据加载之前截断AWSGlue作业中的RDS表?【英文标题】:HowdoItruncateaRDStableinAWSGluejobbeforethedataload?【发布时间】:2019-07-1713:49:33【问题描述】:我使用AWSGlue作为ETL将数据加载到RDS表,这是一个每日快照表,需要在一天的... 查看详情

数据迁移服务 (DMS):出现错误后如何继续(无法执行删除语句)?

】数据迁移服务(DMS):出现错误后如何继续(无法执行删除语句)?【英文标题】:DataMigrationService(DMS):HowdoIContinueafterError(Failedtoexecutedeletestatement)?【发布时间】:2021-10-1409:48:06【问题描述】:AWS/DMS源AuroraMySQL->目标AuroraMySQL我... 查看详情

AWS DMS Redshift 作为目标

...是redshift,则DMS在复制到redshift之前使用S3存储桶临时存储数据。我找不到任何文件来确认此S3存储桶是否是临时的(仅用于初始复制)并且在复制完成后被删除。(https://docs.aws.a 查看详情

AWS DMS 不支持 RDS SQL Server 的 CDC/更改跟踪。

...erver.【发布时间】:2016-09-2716:46:09【问题描述】:AWSDMS(数据库迁移服务)似乎不支持RDSSQLServer的CDC(更改跟踪)。我正在尝试创建RDSSQLServer只读副本以卸载主副本以进行报告。还需要一种解决方案来持续跨区域从美 查看详情

使用 AWS DMS 加载数据时如何修剪列

】使用AWSDMS加载数据时如何修剪列【英文标题】:HowtodotrimcolumnswhenloadingdatausingAWSDMS【发布时间】:2021-08-0818:09:14【问题描述】:我必须使用AWSDMS迁移表。加载时,我必须修剪源表中的列并将其加载到目标。我无法在AWSDMS中找到... 查看详情

将 Pyspark 数据帧加载到 postgres RDS 中的表中时出错

】将Pyspark数据帧加载到postgresRDS中的表中时出错【英文标题】:ErrorwhileLoadingaPysparkdataframeintoatableinpostgresRDS【发布时间】:2022-01-0910:21:54【问题描述】:尝试将数据帧写入RDS中的postgres表时出现以下错误将DataFrame写入RDS中的active_... 查看详情

将本地 PostgreSQL 数据库文件合并到 AWS RDS 数据库

...地Postgres数据库文件合并到AWS现有的RDS数据库。有谁知道如何做到这一点?提前谢谢你。【问题讨论】:您的RDS实例是在公有子网 查看详情

AWS DMS 任务在 CDC 模式下一段时间后失败

...14【问题描述】:在初始迁移+CDC模式下,我无法设置将RDS数据库(PostgreSQL,引擎10.15)中的数据迁移到S3存储桶的任务。两个端点均已成功配置和测试。我已经创建了两次任务,两次最多运行了几个小时,第一次初始转储正常并... 查看详情

如何将多个表的结果写入配置单元中的单个表?

】如何将多个表的结果写入配置单元中的单个表?【英文标题】:Howtowriteresultfrommultipletablestosingletableinhive?【发布时间】:2014-02-2414:06:13【问题描述】:我想通过从多个表中选择列来将结果写入单个表。我想在hive中实现如下所... 查看详情

AWS RDS 到 AWS ES

.../更新到用户表--->AWSKinesis流--使用AWSLambda-->AWSES问题如何在插入/更新到特定表时创建运动流?我可以通过AWSLambda完成吗?【问题讨论】:您在 查看详情

将数据从 Citus 迁移到 RDS

】将数据从Citus迁移到RDS【英文标题】:MigratedatafromCitustoRDS【发布时间】:2021-10-1914:14:40【问题描述】:由于Citus不会在AWS中作为托管服务提供,我正在尝试将数据库移动到RDS(不是整个历史记录,而只是作为OLTP的事务部分)。... 查看详情

AWS RDS Aurora - 如何使用 PgAdmin 进行连接?

】AWSRDSAurora-如何使用PgAdmin进行连接?【英文标题】:AWSRDSAurora-HowtoconnectusingPgAdmin?【发布时间】:2019-11-2011:44:55【问题描述】:昨天AWS为PostgreSQL推出了Auroraserverless,但它似乎没有与其他RDS数据库相同的配置选项,例如我无法将... 查看详情

AWS DMS 添加新列以跟踪更改

...时间】:2017-02-1623:15:44【问题描述】:我们正在使用DMS将数据从MySQL迁移到Redshift(作为持续迁移)。我们在MySQL中有一些大表-太大而无法添加任何新列。但是,现有表中没有任何可靠的列可以知道记录何时更新或新。DMS中是否... 查看详情

如何在不停机的情况下更改 AWS-RDS 实例类型?

】如何在不停机的情况下更改AWS-RDS实例类型?【英文标题】:HowtochangeAWS-RDSinstancetypewithoutdowntime?【发布时间】:2019-07-0912:44:39【问题描述】:我正在使用AWS-RDS(AuroraMySQL5.6),它是一个集群,它有一个写入器实例和一个读取器实... 查看详情

使用 Sqoop 将表从 AWS RDS 移动到 AWS EMR 的问题

...3【问题描述】:我有一个使用postgres的带有单个表的AWSRDS数据库。现在我想将我的数据移动到AWSEMR,以便我可以使用Hadoop来处理它。我发现了这个博客:https://aws.amazon.com/blo 查看详情

如何将 AWS RDS Aurora MySQL 5.6 升级到 5.7

】如何将AWSRDSAuroraMySQL5.6升级到5.7【英文标题】:HowtoupgradeAWSRDSAuroraMySQL5.6to5.7【发布时间】:2018-07-1803:50:45【问题描述】:我们将AWSRDSAuroraMySQL5.6用于我们的生产数据库。AWS于2018年2月6日推出了兼容MySQL5.7的Aurora引擎。我在“修... 查看详情

我们可以使用 AWS 胶水分析 RDS 数据库并使用 ETL 将分析的数据存储到 rds mysql 表中吗

】我们可以使用AWS胶水分析RDS数据库并使用ETL将分析的数据存储到rdsmysql表中吗【英文标题】:CanweuseAWSglueforanalysingtheRDSdatabaseandstoretheanalyseddataintordsmysqltableusingETL【发布时间】:2019-12-2410:40:19【问题描述】:我是AWS的新手。我... 查看详情

如何在我的 AWS RDS 上使用数据存储? [关闭]

】如何在我的AWSRDS上使用数据存储?[关闭]【英文标题】:HowdoIgetdatastorageusedonmyAWSRDS?[closed]【发布时间】:2012-11-1000:31:17【问题描述】:我正在使用AWSRDS。首先,我从10GB的存储开始。我需要将更多数据导入我的MySQL。需要知道有... 查看详情