百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

用DataX实现两个MySQL实例间的数据同步

liuian 2025-06-23 20:38 32 浏览

DataX

DataX使用Java实现。

如果可以实现数据库实例之间准实时的#数据同步#,可以解决很多问题。例如数据可靠性和高并发的问题。Oracle Golden Gate是Oracle提供的一个商业解决方案,而开源的也有很多,这里介绍的#datax#就是一种。下面是DataX的设计原理图





环境

两个数据库实例,都是MySQL,一个位于生产环境,一个位于测试环境。想将指定数据库的指定表数据,从生产环境同步到测试环境对应表中。

步骤

  1. 安装JDK 1.8
sudo apt update
sudo apt install openjdk-8-jdk -y
......
gauss@power-edge-r730:~$ java -version
openjdk version "1.8.0_452"
OpenJDK Runtime Environment (build 1.8.0_452-8u452-ga~us1-0ubuntu1~24.04-b09)
OpenJDK 64-Bit Server VM (build 25.452-b09, mixed mode)
gauss@power-edge-r730:~$ javac -version
javac 1.8.0_452
  1. 下载DataX
$ wget https://github.com/alibaba/DataX/releases/download/datax_0.0.1/datax.tar.gz
# 可从国内下载 : https://datax-opensource.oss-cn-hangzhou.aliyuncs.com/202308/datax.tar.gz
$ tar -zxvf datax.tar.gz
$ mv datax ~/soft/
$ cd ~/soft/datax/
$ python3 bin/datax.py --help

DataX (DATAX-OPENSOURCE-3.0), From Alibaba !
Copyright (C) 2010-2017, Alibaba Group. All Rights Reserved.
  1. 编写同步配置文件
$ cat job/mysql_jygt_2_enger.json
{
    "job": {
        "setting": {
            "speed": {
                "channel": 1,
            },
            "errorLimit": {
                "record": 0,
                "percentage": 0.02
            }
        },
        "content": [
            {
                "reader": {
                    "name": "mysqlreader",
                    "parameter": {
                        "username": "name",
                        "password": "passwd",
                        "column": ["*"],
                        "connection": [
                            {
                                "table": ["t_user"],
                                "jdbcUrl": ["jdbc:mysql://192.168.1.222:3306/db_jygt?useSSL=false&serverTimezone=UTC"]
                            }
                        ],
                        "splitPk": "id",
                        "where": "f_modify_time> '${last_sync_time}'"
                    }
                },
                "writer": {
                    "name": "mysqlwriter",
                    "parameter": {
                        "writeMode": "insert",
                        "username": "name",
                        "password": "passwd",
                        "column": ["*"],
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://192.168.1.111:3306/db_enger?useSSL=false&serverTimezone=UTC",
                                "table": ["t_user"]
                            }
                        ],
                        "preSql": [
                                "CREATE TABLE  IF NOT EXISTS `t_user` (
                                `f_id` INT(11) NOT NULL AUTO_INCREMENT COMMENT '主键:唯一标识特定表的一个记录',
                                `f_uid` VARCHAR(64) NOT NULL COMMENT '用户ID,业务语义上,与f_user_source_id一起唯一标记一个用户' COLLATE 'utf8mb4_bin',
                                `f_user_source_id` INT(11) NOT NULL COMMENT '用户来源id,对应t_user_source表的相关记录主键',
                                `f_auth_code` VARCHAR(256) NOT NULL COMMENT '用户身份识别码,一般用来验证用户的身份。例如密码,手机验证码、邮件验证码、或者来自第三方平台的授权吗' COLLATE 'utf8mb4_bin',
                                `f_name` VARCHAR(64) NULL DEFAULT NULL COMMENT '用户名' COLLATE 'utf8mb4_bin',
                                `f_motto` VARCHAR(128) NULL DEFAULT NULL COMMENT '用户座右铭' COLLATE 'utf8mb4_bin',
                                `f_avarta_url` VARCHAR(50) NULL DEFAULT NULL COMMENT '用户的头像url' COLLATE 'utf8mb4_bin',
                                `f_create_time` DATETIME NOT NULL DEFAULT CURRENT_TIMESTAMP,
                                `f_modify_time` TIMESTAMP NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
                                PRIMARY KEY (`f_id`) USING BTREE,
                                UNIQUE INDEX `unq_source_and_uid` (`f_uid`, `f_user_source_id`) USING BTREE,
                                INDEX `idx_source` (`f_user_source_id`) USING BTREE
                                )"
                        ]
                    }
                }
            }
        ]
    }
}
  1. 执行
gauss@power-edge-r730:~/soft/datax$ python3 bin/datax.py job/mysql_jygt_2_enger.json

.......
 All Task WaitWriterTime 0.000s |  All Task WaitReaderTime 0.177s | Percentage 100.00%
2025-05-27 16:31:22.350 [job-0] INFO  JobContainer -
任务启动时刻                    : 2025-05-28 00:31:11
任务结束时刻                    : 2025-05-28 00:31:22
任务总计耗时                    :                 11s
任务平均流量                    :               73B/s
记录写入速度                    :              0rec/s
读出记录总数                    :                   9
读写失败总数                    :                   0
  1. 验证




  1. 更多

可以编制一个脚本来管理已经同步的数据最后更新时间,再次运行就只对其后更改的数据进行同步。并配置定时任务,令其自省,实现准实时同步数据。

gauss@power-edge-r730:~/soft/datax$ cat script/mysql_jygt_2_enger.sh
#!/bin/bash

# DataX路径
DATAX_PATH="/home/gauss/soft/datax"

# 配置文件路径
CONFIG_FILE="$DATAX_PATH/job/mysql_jygt_2_enger.json"

# 时间戳文件路径
TIME_FILE="$DATAX_PATH/job/imysql_jygt_2_enger_last_sync_time.txt"

# 获取上次同步时间
LAST_TIME=$(cat $TIME_FILE)

# 当前时间
CURRENT_TIME=$(date +"%Y-%m-%d %H:%M:%S")

# 替换配置文件中的时间变量
sed -i "s/'\${last_sync_time}'/'$LAST_TIME'/" $CONFIG_FILE

# 执行DataX同步
python3 $DATAX_PATH/bin/datax.py $CONFIG_FILE

# 更新时间戳文件
echo $CURRENT_TIME > $TIME_FILE

# 恢复配置文件
sed -i "s/'$LAST_TIME'/'\${last_sync_time}'/" $CONFIG_FILE
crontab -e
*/5 * * * * /opt/datax/incremental_sync.sh >> /opt/datax/sync.log 2>&1

相关推荐

鲁大师下载安装免费版(鲁大师app下载)

解决方法吧。第一种方法:一般情况下,我们安装的时候软件也需要一定的时间,我们可以多等待一会。第二种方法:安装到99%你直接关掉安装。然后自己到安装目录文件里找到启动程序,就可以用了。第三种方法:1、可...

ssd坏道检测与修复(ssd硬盘坏道检测)

1、固态硬盘(SSD硬盘)损坏分两方面,一方面是出现硬盘坏块,另一方面是出现物理损坏。2、固态硬盘如果出现坏块是不可修复的。SSD硬盘坏块不是所谓的逻辑坏块。SSD硬盘内部是晶体管,损坏后不能恢复,这...

win10专业工作版激活密钥(windows10 专业版激活密钥)

要获得Windows10专业版永久激活密钥,可以通过微软官方零售渠道或可靠的第三方卖家购买正版产品密钥。使用第三方卖家时,务必注意其信誉和真实性。激活后,密钥将与您的Microsoft帐户关...

键盘下载安装(维语输入法键盘下载安装)

以惠普星14,win10系统为例,具体的操作步骤入如下:1、开启电脑后,在电脑的浏览器中搜索“输入法”。2、在页面中挑选一款自己喜欢的输入法软件,并点击旁边的下载按钮。3、随后在弹出的对话框中选择下载...

office 2010怎么激活(office 2010如何激活)

 1.打开下载好的Office,点击左上角的“文件”,然后在下拉菜单上点击“帮助”,显示需要激活Office。?  2.找到解压缩好的安装文件,打开里面的“激活破解”文件夹。?  3.在文件夹中运行激...

笔记本xp系统忘记开机密码(笔记本xp开机密码忘了怎么办最简单的方法)

xp系统忘记开机密码解锁方法如下1、在需要破解开机密码的xp电脑上插入pe启动盘,启动电脑后不停按F12、F11、Esc等快捷键,在弹出的启动菜单选择框中选择识别到的usb启动项,比如General...

新风系统安装示意图(新风系统安装效果图)
  • 新风系统安装示意图(新风系统安装效果图)
  • 新风系统安装示意图(新风系统安装效果图)
  • 新风系统安装示意图(新风系统安装效果图)
  • 新风系统安装示意图(新风系统安装效果图)
isofix接口(isofix接口怎么拆卸)

isofix接口上有isofix的字样,它的图标是一个类似人坐在座椅上。在汽车座椅靠垫与坐垫之间的连接处有2个接口,那就是isofix接口,是一种硬连接方式,为了防止撞击时发生座椅翻转,一些座椅在IS...

无线路由器怎么设置不让别人连接

要设置无线路由器不让别人连接,可以采取以下措施:1.配置路由器密码:在路由器设置中,可以设置密码,限制只有授權的人才能连接到网络。2.配置防火墙:可以安装防火墙软件,如OpenDNS,限制...

fast迅捷路由器(fast迅捷路由器配置上网教程)

http://www.fastcom.com.cn/上面这个就迅捷官网的网址老版本的迅捷路由器默认登录地址为“192.168.1.1”,新版本的迅捷路由器默认登录地址为“falogin.cn”。02...

手机天梯图2025最新版(手机天梯图cpu2020快科技)

一般情况下而言,手机处理器的性能越强,功耗也就越高。有网友制作了一张手机处理器功耗排名图,高通骁龙888位8.34W,是榜单中功耗第二的处理器。而海思麒麟9000则位列第三,功耗为8.3W。一般情况下...

pe系统下载官网手机版(pe系统之家)

打开手机应用商店,选择windowspe,下载安装PE系统是一种维护用的系统,本身是很简陋的,什么常用功能都没有,后经一些爱好都修改、完善,现在成为可当临时系统用的精简系统。但PE系统当前种类很多,...

云骑士装机大师怎么激活win7

回答如下:要激活Windows7操作系统,您可以按照以下步骤进行操作:1.确保您的计算机已连接到互联网。2.打开“开始”菜单,点击“计算机”右键,选择“属性”。3.在系统属性窗口中,向下滚动到...

vmware workstation使用教程

VMwareWorkstation15是一款虚拟机软件,可以在主机上模拟多个虚拟计算机环境。以下是使用VMwareWorkstation15的基本步骤:1.下载和安装软件:从VMware官方...

windows7旗舰版64位多少钱(windows7旗舰版64位多少钱合适)

这两个都是64位的,唯一区别是后者集成SP1。win7旗舰版64位玉米系统比较稳定,不但稳定,运行速度也很快!WIN764位系统需要的电脑配置。最低配置CPU:1GHz32位或2G...