- Flink CDC启动一个Source Function来监听指定的数据库,并监视其中的变更事件 。
- 当数据库中的表发生增删改操作时,Source Function会将这些变更事件转换成Flink DataStream中的数据格式,并发送给Flink流处理引擎中 。
- Flink流处理引擎可以对接收到的数据进行各种实时计算和分析,并将结果写入目标数据存储中 。

文章插图
代码地址:https://github.com/ververica/flink-cdc-connectors.git
除了以上这些CDC项目外,Pulsar也提供有CDC插件,Pulsar IO CDC是一个Apache Pulsar的插件,用于实时捕获数据库的变更,并将其转化为消息的形式发送到Pulsar集群中 。
基于日志的CDC相对来说更加全面、可靠、实时、无业务侵入性,但实现起来比较困难,而基于查询的CDC则更加灵活、易用,但延迟高,有可能会影响到业务,还可能会存在遗漏数据的情况 。因此,在选择 CDC 技术时需要根据具体场景和需求来进行选择 。
推荐阅读
- 几个玩转2D/3D渲染的开源JS库,助你快速实现各种2D/3D动画特效
- Redis+DB实现基于号段的发号器原理
- 核桃|买文玩的几个误区
- 鲤鱼|夏季闹小鱼从窝料开始!分享几个实用的方法,效果立竿见影
- 00后|“让老板知道便宜没好货”,00后的几个“打工思维”,才是正常吧
- |遇上走漂就不钓了?只需做几个调整,其实活水更能钓大鱼
- 文玩|它是文玩界唯一的绿颜色文玩,见过的人没有几个?
- 许多|女人都有这几个共性,很现实
- 光绪元宝|光绪元宝有这几个特征就能价值过百万 一定要收藏好
- 芒果几个月的宝宝吃吗
