代码之家  ›  专栏  ›  技术社区  ›  Jsimp

如何将整个数据目录与RDS同步

  •  0
  • Jsimp  · 技术社区  · 5 年前

    我有一个胶水爬虫是由lambda函数在每次S3上传时触发的。因此,数据目录始终与S3同步。我能够创建自动从目录上传特定表的胶水作业。 如果用户上载一个包含新列的新表,我必须手动为该表创建一个新作业。有没有办法使这一手动步骤自动化?

    0 回复  |  直到 5 年前
        1
  •  0
  •   JD D    5 年前

    如果您希望在爬虫程序发现新表时触发某些逻辑,我建议您考虑创建 Cloudwatch Event Rule 为了改变胶水服务的状态。特别是,当数据目录数据库或表的状态发生更改时,可以调用服务(即Lambda函数)。

    此lambda函数可以检查状态更改事件,并使用其中一个sdk为新表创建作业。