代码之家  ›  专栏  ›  技术社区  ›  Punter Vicky

ETL—将数据从oracle db推送到aws s3

  •  2
  • Punter Vicky  · 技术社区  · 6 年前

    我有一个oracle db,它有大约20个表。我想将oracle表中的数据推送到S3存储桶中。我想做这个实时或最坏的近实时。一旦提取了数据,我可能必须进行一些少量的数据转换,例如:混淆敏感数据或进行外部服务调用以标记敏感数据。我看到amazon aws glue是一个etl工具,但我不确定它是否适合此用途。

    1 回复  |  直到 6 年前
        1
  •  3
  •   Kannaiyan    6 年前

    AWS Data Firehose非常适合这种情况。如果要进行转换,可以引入Lambda。每个记录都将在传递到目标之前传递到lambda,您可以引入掩蔽或将任何数据转换到目标。

    数据转换: https://docs.aws.amazon.com/firehose/latest/dev/data-transformation.html

    Oracle至AWS Kinesis数据消防软管: Xplenty获取您的oracle数据并将其交付给firehose。

    https://www.xplenty.com/integrations/oracle/amazon-kinesis-firehose/

    希望有帮助。

    无Xplenty:

    您可以按照文档的说明在ORACLE下创建触发器,以触发lambda来传递记录。

    https://aws.amazon.com/blogs/big-data/from-sql-to-microservices-integrating-aws-lambda-with-relational-databases/

    ORACLE—Lambda(处理触发器和转换)—Firehose-- S3级