代码之家  ›  专栏  ›  技术社区  ›  jerome

筛选数据库行

  •  0
  • jerome  · 技术社区  · 7 年前

    我想知道卡夫卡平台是否适合以下工作。

    我正在尝试摄取一个包含多个表的完整数据库。一旦被卡夫卡接受,我想根据条件过滤表的行。

    我认为使用Kafka流很容易做到这一点,但是被过滤器拒绝的消息会发生什么呢?

    例如,如果基于日期,将来可能会满足条件,那么是否有可能再次过滤被拒绝的邮件,以最终通过过滤器并进行进一步处理?

    在向卡夫卡提供数据之前过滤数据行是否更好?

    非常感谢。

    1 回复  |  直到 7 年前
        1
  •  1
  •   Hans Jespersen    7 年前

    您可能需要考虑使用数据库连接器,例如Debezium或融合的JDBC源连接器,它们都基于Kafka Connect

    有关MySQL的Debezium连接器的更多信息,请参阅 http://debezium.io/docs/connectors/mysql

    有关Confluent JDBC连接器的更多信息,请参阅 http://docs.confluent.io/current/connect/connect-jdbc/docs/source_connector.html

    请参见此处关于Kafka Connect行过滤的讨论 Kafka connect (Single message transform) row filtering