Gitlab之间进行同步备份 gitlab数据同步
liuian 2024-12-24 14:17 90 浏览
目前,我们公司有两个研发团队,分别在北京和武汉,考虑到访问速度的问题,原有武汉的研发环境在近端部署。也就是北京和武汉分别有两套独立的研发管理环境,虽然这解决了近端访问速度的问题,但是管理上较为分散,比如研发环境备份和恢复就是最重要的问题之一。最近,处于对安全性和合规性的考虑,希望将北京和武汉的源代码,统一的集中备份,防止公司资产流失。
Gitlab同步备份需求分析
由于历史原因,北京团队使用Gerrit进行代码审核和管理的工具,但是对于很多开发人员来说,入门比较陡峭,需要记忆很多git命令,所以考虑团队扩展性的需要,将Gerrit环境逐步切换至Gitlab中,而武汉团队则是直接选择了Gitlab进行代码管理。
在选择目标侧环境时,原本想使用阿里云效和腾讯的Coding环境进行备份,以我们目前体量来看,是完全免费的。但是考虑到随着公司增长,后期可能会产生成本,所以决定利用现有的K8S生产环境部署一套Gitlab,用于代码备份。
所以本次要解决的问题就是将两个团队Gitlab环境下的所有项目定期备份至远程的Gitlab中。在最初期的方案设计中,想使用最简单的Sehll脚本进行同步,但是会出现以下几个问题要解决:
- 在前期配置过程中,如果待同步项目较多,则在目标端进行预配置的工作较多,增加了管理成本,所以希望将整组的项目进行完整的增量同步
- 如果在源端有新的代码库增加,则需要至少维护同步脚本和备份端的Gitlab环境进行修改
- 如果还想同步Gitlab上诸如Wiki等文档类页面,则需要额外的手段进行
解决过程及思考
基于以上几点考虑,期望寻求一种自动化手段解决该问题,争取实现零运维的效果。
方案一:利用Gitlab原生机制
在Gitlab中提供了一种仓库(projects)级别的同步方式,具体配置如下:
- 进入仓库的的Settings,点击Repository
- 打开Mirroring repositories
- 配置目标仓库地址及同步方式
在开源版本中,只支持Push方式,而商业版本则支持Push和Pull两种方式。这个功能的优势是实时性,每当有代码提交后,则自动触发同步,避免了不必要的负载。
但是遗憾的是,在本地进行了测试时,只显示正在同步,但是一直没有同步成功,也没有给出具体的任务状态或失败原因。同时,并没有在组级别上提供同步能力,每次新增项目时,仍然需要手动在源端和目标端进行频繁操作,维护成本较高,所以最终放弃了该方案。
方案二:开源项目
在放弃第一个解决方案后,开始在Github上寻找开源项目。有一个基于Shell开发的gitlab-mirrors的项目引起了我的关注,这个项目由多个shell脚本组成。目标端支持除gitlab之外的多种Git仓库,看起来可以满足我们的需要。但是经过调研,发现gitlab-mirrors是以project为单位,无法按照组级别进行同步,所以也无法满足我们的需要。经过多番搜索,并没有一个项目能够百分之百满足我们组级别同步备份需求的项目。
方案三:自主实现自动化流程
由于以上两种方式均无法满足需求,所以决定基于Gitlab开放的Python库进行二次开发,满足需求。基本的思路为:
- 在源端获取待同步组内的所有项目、子组
- 克隆代码、所有分支、tags
- 判断目标端Gitlab是否存在该组或者项目,如果没有则创建
- Push代码、分支、tags
在满足了以上需求后,需要定期执行脚本实现周期性增量同步,那么如何利用Docker实现最简单的部署呢?所以需求进一步更新为:
- 构建一个容器,该容器能够支持定期执行同步任务
- 容器要利用系统的crontab,支持灵活配置
- 任务在执行时要避免重复执行
基于以上需求,我开发了gitlab-sync脚本及容器(https://github.com/xiaoquqi/gitlab-sync),改代码已经上传到github中,以下就为大家介绍详细的使用方法。
使用方法
通过以下配置,你可以轻松完成从Gitlab A中的Group A周期同步至Gitlab B中的Group B中。
前提条件
在开始配置gitlab-sync前,以下信息是必须提前获取的:
- LOCAL_GTILAB_URL: 源端的Gitlab的WEB地址及端口
- LOCAL_GITLAB_TOKEN: 源端Gitlab的Token,需要读取的权限
- LOCAL_GITLAB_GROUP: 源端Gitlab待同步的组,该组下所有项目及后续新增项目都会自动同步到目标端
- REMOTE_GTILAB_URL: 目标端Gitlab的WEB地址及端口
- REMOTE_GTILAB_TOKEN: 目标端Gitlab的Token,需要读取和写入权限
- REMOTE_GTILAB_GROUP: 目标端的组,可以与源端不一样
- REMOTE_GTILAB_PUSH_URL: 目标端Push地址,用于作为git push的目标端
除了这些信息外,Docker启动会默认将$HOME/.ssh路径挂载至容器内,所以需要你的key已经加入到源端和目标端的Gitlab中,以保证正确的Clone和Push的操作。
获取代码及配置
在代码中,提供了docker-compose.yml文件,可以直接使用。
git clone https://github.com/xiaoquqi/gitlab-sync
cd gitlab-sync
cp env.sample .env
cp crontab/cron.exmaple crontab/cron- 在.env文件中,根据提前准备好的变量进行配置
- cron是crontab的配置文件,根据需求设定周期同步策略,后面的命令行不建议修改,其中flock是为了避免任务被重复运行
启动同步
完成配置后,启动容器开始同步。
docker-compose up -d
可以在Host主机的/var/log/gitlab-sync/gitlab-sync.log获取执行过程中的日志。
总结
在整个过程中,原本是想以脚本方式做最简单的处理,但是考虑到了后期运维成本等问题,最终决定考虑一种全自动化方式进行运维。
在处理容器运行crontab时,遇到用户环境变量无法获取的问题,目前采用的一种方式是一种Work Around,在容器启动后,将当前用户环境变量Dump到根分区下固定文件,在执行period_task.sh脚本中去加载这个脚本,从而获取环境变量。如果有更好的方法进行优化,欢迎提交Pull Request。
如果大家在使用过程中有任何问题,欢迎反馈,我会持续优化代码。
相关推荐
- 高端显卡(带DVI接口的最高端显卡)
-
高级显卡有很多用处。首先,它可以提高电脑图形和处理的高清度和速度,使得用户可以流畅的玩游戏、观看高清电影等。其次,高级显卡可以支持更加复杂的计算任务,比如机器学习、科学计算等,因此在这些任务中能够提升...
- flash动画软件(Flash动画软件下载)
-
你好,如果希沃白板里的Flash图标无法播放,可能是因为以下原因:1.缺少Flash插件:Flash图标需要AdobeFlashPlayer插件来播放。请确保您的设备上已安装最新版本的Flash...
- windows10多少钱一年(windows10 多少钱)
-
2023年版的Windows10将是一个经过进一步改进和优化的操作系统。它将提供更快的启动速度和更高的性能,同时增强了安全性和稳定性。用户界面可能会有一些改变,以提供更好的用户体验。此外,它还将支持...
- outlook官方下载(outlook官网app下载)
-
1、解锁手机进入系统后,在手机中选择电子邮箱的应用进入。2、进入应用主界面后,在页面中选择exchange的选项,进入邮箱的添加界面。3、点击后,在页面中输入自己的outlook邮箱地址和密码,点击登...
- 我wifi连上却不能上网怎么办
-
wifi能够连接,但是不能上网,说明用户使用的wifi网络没有成功连接外网。这个情况出现的原因可能有如下几点:用户使用的无线路由器没有开启自动拨号功能。用户填写的账号密码有误,无法成功联网。当地线路故...
- 家庭用win10哪个版本好(windows10家庭用什么版本)
-
1.家庭版:仅包含基础功能,在所有版本中功能最少,适合普通用户;2.专业版:包含大量高级功能,适合高端用户群体使用;3.企业版:针对企业用户推出的版本,提供批量授权。1.家庭版从名称中就可以知道主要面...
- u盘修复工具破解版(u盘修复工具下载)
-
1、首先打开电脑浏览器,搜索“嗨格式数据恢复大师”,选择软件主界面中的“快速扫描恢复”模式对磁盘进行扫描。2、当扫描模式选择完成后,也就需要选择“原数据文件所存储的位置”,此时可直接选择我们所插入的“...
-
- 电脑如何连接宽带步骤(电脑如何连接宽带步骤操作)
-
电脑连接宽带连接方法如下1、首先,打开控制面板,进入“网络和Internet”选项2、然后,点击打开“网络和共享”选项;3、接着,我们点击“设置新的连接或网络”选项;4、这里我们选择宽带(PPPoE)选项,该选项就是表示宽带上网5、然后,输...
-
2025-12-27 14:55 liuian
- 邮箱免费注册入口(个人邮箱注册申请免费注册)
-
163邮箱官网注册入口是;https://smart.mail.163.com/login.htm163邮箱注册方法;1在浏览器搜索“网易邮箱”。2进入网易邮箱官网https://smart.mail...
- windows7如何换主题(win7系统如何更改主题)
-
在Windows7中更改主题的方法如下:1.点击桌面空白处,选择“个性化”选项。2.在“个性化”窗口中,可以直接选择几种预设好的主题,或者点击“获取更多主题”在线下载更多主题。3.如果要自定义...
- thinkpad x390(thinkpadx390哪一年的)
-
x390好,他是最新的芯片,他的性能方面得到了很大的提升,用的也是最新的工艺和材料,所以在性能表现上提升了很。他用的是最新的处理方式,在使用的时候不需要大安心。他发热发烫,对电量的控制也做得比较到位,...
- iso文件要解压吗(iso文件要解压吗手机)
-
一般来说,整个一套的iso体系文件还是比较多的,如果是通过邮件等形式来传送的话,一般都会把文件进行压缩后再传送,以便文件能够顺利发送。所以在接收到这些文件后需要解压后才能够查阅。如果电脑里没有解压程序...
- sd卡未格式化是什么意思(sd卡提示格式化但无法格式化)
-
存储卡未格式化意味着该SD卡上没有被操作系统识别的文件系统。这通常发生在初次使用SD卡时,或者在从另一台设备中移除SD卡后插入到新设备时。在这种情况下,您需要格式化SD卡以便于使用。请注意,格式化会清...
- 附近上门维修电话(附近修门窗上门维修电话)
-
供电公司的资产产权到用户的计量箱计量箱以下的线路和室内设备属于用户资产,所以9598电工有权可以拒绝电表以下线路的维修,如果房屋内的线路或电苗以下线路存在损坏故障无法正常使用时,可以找相关维修机构进行...
- ghost硬盘镜像(ghost硬盘镜像备份)
-
答具体方法如下步骤一:打开“ToDisk”对拷选项(1)首选打开Ghost工具,进入界面后,选择“Local”→“Disk”→“ToDisk”。步骤二:选择源数据硬盘(2)我们需要选择源数据硬盘...
- 一周热门
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
