用DataX实现两个MySQL实例间的数据同步
liuian 2025-06-23 20:38 32 浏览
DataX
DataX使用Java实现。
如果可以实现数据库实例之间准实时的#数据同步#,可以解决很多问题。例如数据可靠性和高并发的问题。Oracle Golden Gate是Oracle提供的一个商业解决方案,而开源的也有很多,这里介绍的#datax#就是一种。下面是DataX的设计原理图
环境
两个数据库实例,都是MySQL,一个位于生产环境,一个位于测试环境。想将指定数据库的指定表数据,从生产环境同步到测试环境对应表中。
步骤
- 安装JDK 1.8
sudo apt update
sudo apt install openjdk-8-jdk -y
......
gauss@power-edge-r730:~$ java -version
openjdk version "1.8.0_452"
OpenJDK Runtime Environment (build 1.8.0_452-8u452-ga~us1-0ubuntu1~24.04-b09)
OpenJDK 64-Bit Server VM (build 25.452-b09, mixed mode)
gauss@power-edge-r730:~$ javac -version
javac 1.8.0_452
- 下载DataX
$ wget https://github.com/alibaba/DataX/releases/download/datax_0.0.1/datax.tar.gz
# 可从国内下载 : https://datax-opensource.oss-cn-hangzhou.aliyuncs.com/202308/datax.tar.gz
$ tar -zxvf datax.tar.gz
$ mv datax ~/soft/
$ cd ~/soft/datax/
$ python3 bin/datax.py --help
DataX (DATAX-OPENSOURCE-3.0), From Alibaba !
Copyright (C) 2010-2017, Alibaba Group. All Rights Reserved.
- 编写同步配置文件
$ cat job/mysql_jygt_2_enger.json
{
"job": {
"setting": {
"speed": {
"channel": 1,
},
"errorLimit": {
"record": 0,
"percentage": 0.02
}
},
"content": [
{
"reader": {
"name": "mysqlreader",
"parameter": {
"username": "name",
"password": "passwd",
"column": ["*"],
"connection": [
{
"table": ["t_user"],
"jdbcUrl": ["jdbc:mysql://192.168.1.222:3306/db_jygt?useSSL=false&serverTimezone=UTC"]
}
],
"splitPk": "id",
"where": "f_modify_time> '${last_sync_time}'"
}
},
"writer": {
"name": "mysqlwriter",
"parameter": {
"writeMode": "insert",
"username": "name",
"password": "passwd",
"column": ["*"],
"connection": [
{
"jdbcUrl": "jdbc:mysql://192.168.1.111:3306/db_enger?useSSL=false&serverTimezone=UTC",
"table": ["t_user"]
}
],
"preSql": [
"CREATE TABLE IF NOT EXISTS `t_user` (
`f_id` INT(11) NOT NULL AUTO_INCREMENT COMMENT '主键:唯一标识特定表的一个记录',
`f_uid` VARCHAR(64) NOT NULL COMMENT '用户ID,业务语义上,与f_user_source_id一起唯一标记一个用户' COLLATE 'utf8mb4_bin',
`f_user_source_id` INT(11) NOT NULL COMMENT '用户来源id,对应t_user_source表的相关记录主键',
`f_auth_code` VARCHAR(256) NOT NULL COMMENT '用户身份识别码,一般用来验证用户的身份。例如密码,手机验证码、邮件验证码、或者来自第三方平台的授权吗' COLLATE 'utf8mb4_bin',
`f_name` VARCHAR(64) NULL DEFAULT NULL COMMENT '用户名' COLLATE 'utf8mb4_bin',
`f_motto` VARCHAR(128) NULL DEFAULT NULL COMMENT '用户座右铭' COLLATE 'utf8mb4_bin',
`f_avarta_url` VARCHAR(50) NULL DEFAULT NULL COMMENT '用户的头像url' COLLATE 'utf8mb4_bin',
`f_create_time` DATETIME NOT NULL DEFAULT CURRENT_TIMESTAMP,
`f_modify_time` TIMESTAMP NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
PRIMARY KEY (`f_id`) USING BTREE,
UNIQUE INDEX `unq_source_and_uid` (`f_uid`, `f_user_source_id`) USING BTREE,
INDEX `idx_source` (`f_user_source_id`) USING BTREE
)"
]
}
}
}
]
}
}- 执行
gauss@power-edge-r730:~/soft/datax$ python3 bin/datax.py job/mysql_jygt_2_enger.json
.......
All Task WaitWriterTime 0.000s | All Task WaitReaderTime 0.177s | Percentage 100.00%
2025-05-27 16:31:22.350 [job-0] INFO JobContainer -
任务启动时刻 : 2025-05-28 00:31:11
任务结束时刻 : 2025-05-28 00:31:22
任务总计耗时 : 11s
任务平均流量 : 73B/s
记录写入速度 : 0rec/s
读出记录总数 : 9
读写失败总数 : 0
- 验证
- 更多
可以编制一个脚本来管理已经同步的数据最后更新时间,再次运行就只对其后更改的数据进行同步。并配置定时任务,令其自省,实现准实时同步数据。
gauss@power-edge-r730:~/soft/datax$ cat script/mysql_jygt_2_enger.sh
#!/bin/bash
# DataX路径
DATAX_PATH="/home/gauss/soft/datax"
# 配置文件路径
CONFIG_FILE="$DATAX_PATH/job/mysql_jygt_2_enger.json"
# 时间戳文件路径
TIME_FILE="$DATAX_PATH/job/imysql_jygt_2_enger_last_sync_time.txt"
# 获取上次同步时间
LAST_TIME=$(cat $TIME_FILE)
# 当前时间
CURRENT_TIME=$(date +"%Y-%m-%d %H:%M:%S")
# 替换配置文件中的时间变量
sed -i "s/'\${last_sync_time}'/'$LAST_TIME'/" $CONFIG_FILE
# 执行DataX同步
python3 $DATAX_PATH/bin/datax.py $CONFIG_FILE
# 更新时间戳文件
echo $CURRENT_TIME > $TIME_FILE
# 恢复配置文件
sed -i "s/'$LAST_TIME'/'\${last_sync_time}'/" $CONFIG_FILE
crontab -e
*/5 * * * * /opt/datax/incremental_sync.sh >> /opt/datax/sync.log 2>&1相关推荐
- 鲁大师下载安装免费版(鲁大师app下载)
-
解决方法吧。第一种方法:一般情况下,我们安装的时候软件也需要一定的时间,我们可以多等待一会。第二种方法:安装到99%你直接关掉安装。然后自己到安装目录文件里找到启动程序,就可以用了。第三种方法:1、可...
- ssd坏道检测与修复(ssd硬盘坏道检测)
-
1、固态硬盘(SSD硬盘)损坏分两方面,一方面是出现硬盘坏块,另一方面是出现物理损坏。2、固态硬盘如果出现坏块是不可修复的。SSD硬盘坏块不是所谓的逻辑坏块。SSD硬盘内部是晶体管,损坏后不能恢复,这...
- win10专业工作版激活密钥(windows10 专业版激活密钥)
-
要获得Windows10专业版永久激活密钥,可以通过微软官方零售渠道或可靠的第三方卖家购买正版产品密钥。使用第三方卖家时,务必注意其信誉和真实性。激活后,密钥将与您的Microsoft帐户关...
- 键盘下载安装(维语输入法键盘下载安装)
-
以惠普星14,win10系统为例,具体的操作步骤入如下:1、开启电脑后,在电脑的浏览器中搜索“输入法”。2、在页面中挑选一款自己喜欢的输入法软件,并点击旁边的下载按钮。3、随后在弹出的对话框中选择下载...
- office 2010怎么激活(office 2010如何激活)
-
1.打开下载好的Office,点击左上角的“文件”,然后在下拉菜单上点击“帮助”,显示需要激活Office。? 2.找到解压缩好的安装文件,打开里面的“激活破解”文件夹。? 3.在文件夹中运行激...
- 笔记本xp系统忘记开机密码(笔记本xp开机密码忘了怎么办最简单的方法)
-
xp系统忘记开机密码解锁方法如下1、在需要破解开机密码的xp电脑上插入pe启动盘,启动电脑后不停按F12、F11、Esc等快捷键,在弹出的启动菜单选择框中选择识别到的usb启动项,比如General...
- isofix接口(isofix接口怎么拆卸)
-
isofix接口上有isofix的字样,它的图标是一个类似人坐在座椅上。在汽车座椅靠垫与坐垫之间的连接处有2个接口,那就是isofix接口,是一种硬连接方式,为了防止撞击时发生座椅翻转,一些座椅在IS...
- 无线路由器怎么设置不让别人连接
-
要设置无线路由器不让别人连接,可以采取以下措施:1.配置路由器密码:在路由器设置中,可以设置密码,限制只有授權的人才能连接到网络。2.配置防火墙:可以安装防火墙软件,如OpenDNS,限制...
- fast迅捷路由器(fast迅捷路由器配置上网教程)
-
http://www.fastcom.com.cn/上面这个就迅捷官网的网址老版本的迅捷路由器默认登录地址为“192.168.1.1”,新版本的迅捷路由器默认登录地址为“falogin.cn”。02...
- 手机天梯图2025最新版(手机天梯图cpu2020快科技)
-
一般情况下而言,手机处理器的性能越强,功耗也就越高。有网友制作了一张手机处理器功耗排名图,高通骁龙888位8.34W,是榜单中功耗第二的处理器。而海思麒麟9000则位列第三,功耗为8.3W。一般情况下...
- pe系统下载官网手机版(pe系统之家)
-
打开手机应用商店,选择windowspe,下载安装PE系统是一种维护用的系统,本身是很简陋的,什么常用功能都没有,后经一些爱好都修改、完善,现在成为可当临时系统用的精简系统。但PE系统当前种类很多,...
- 云骑士装机大师怎么激活win7
-
回答如下:要激活Windows7操作系统,您可以按照以下步骤进行操作:1.确保您的计算机已连接到互联网。2.打开“开始”菜单,点击“计算机”右键,选择“属性”。3.在系统属性窗口中,向下滚动到...
- vmware workstation使用教程
-
VMwareWorkstation15是一款虚拟机软件,可以在主机上模拟多个虚拟计算机环境。以下是使用VMwareWorkstation15的基本步骤:1.下载和安装软件:从VMware官方...
- windows7旗舰版64位多少钱(windows7旗舰版64位多少钱合适)
-
这两个都是64位的,唯一区别是后者集成SP1。win7旗舰版64位玉米系统比较稳定,不但稳定,运行速度也很快!WIN764位系统需要的电脑配置。最低配置CPU:1GHz32位或2G...
- 一周热门
-
-
飞牛OS入门安装遇到问题,如何解决?
-
如何在 iPhone 和 Android 上恢复已删除的抖音消息
-
Boost高性能并发无锁队列指南:boost::lockfree::queue
-
大模型手册: 保姆级用CherryStudio知识库
-
用什么工具在Win中查看8G大的log文件?
-
如何在 Windows 10 或 11 上通过命令行安装 Node.js 和 NPM
-
威联通NAS安装阿里云盘WebDAV服务并添加到Infuse
-
Trae IDE 如何与 GitHub 无缝对接?
-
idea插件之maven search(工欲善其事,必先利其器)
-
如何修改图片拍摄日期?快速修改图片拍摄日期的6种方法
-
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
