百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

阿里云自动巡检(阿里云auto scaling)

liuian 2025-06-08 22:35 11 浏览

背景简介

随着智能化的快速发展及信息通信技术的不断创新,各大企业基于对信息安全,成本等各方面的考虑开始选择上云。作为国内云服务的领军者,阿里云也成为了大家重点关注和使用的云服务之一。上云节省了我们运维人员日常的工作,再也不用担心机房的温度、湿度等一系列问题。只需要关注服务器运行状况即可。大大减少了日常的工作量。

做运维永远是预防比消防更重要相信是很多运维人员的共识。定时巡检能够及时发现设备的异常情况,避免事故的发生,保障服务的稳定运行。对于服务器巡检来说,最基础的当然就是服务器的资源使用情况。CPU使用率、内存是否有异常波动,磁盘空间是否充足。当我们服务器数量较少的时候我们可以通过监控大盘去查看,但是当服务器数量达到100台以上时,监控大盘的缺点就表现出来了。我们去观察CPU性能曲线的时候如果数量过多会导致曲线过于密集。

如果用TOP的方式去展示又有可能因为计算TOP算法的问题导致某些存在隐患的机器被掩盖掉,没有展示出来,从而导致隐患的存在。但是每一台机器去观察既浪费时间又耗费精力。所以这里针对阿里云写了一个python的脚本来解决这个问题。脚本会自动获取指定时间段的阿里云监控数据,并且与提前设置好的阈值进行对比。如果监控数据达到了设定好的阈值就会写入到文本文档中。我们只需要定时去执行这个脚本,并且查看巡检结果即可。该脚本可以配合监控大盘去使用,达到一个相互辅助的效果,让我们在日常巡检的过程中更加游刃有余。

脚本介绍

简介

脚本巡检阈值可以自行设置调整。单次执行可以对多个阿里云账号及多个地域进行巡检。

目前脚本还不断迭代中,会支持越来越多的阿里云产品。

脚本巡检内容

  1. ECS CPU使用率
  2. ECS 内存使用率
  3. ECS磁盘空间使用率
  4. OSS bucket 存储使用量
  5. OSS 资源包订购情况

脚本工作流程图

  1. 设定巡检时间
  2. 读取配置文件并生成client
  3. 获取阿里云监控数据
  4. 判断是否超过阈值并生成巡检信息
  5. 生成易读的巡检文本

脚本详解

阿里云client

当我们需要获取阿里云云监控的监控数据的时候,第一步就是要创建client,即进行鉴权。只有通过鉴权才能获取到我们想要的数据。首先我们要创建AK,这里不再详细描述如何生成AK,阿里云官方文档中有详细的步骤。这里建议使用子账号的AK进行,并且尽量缩小权限,这样可以最大限度的保证账号的安全。

创建client其实很简单,只要调用AcsClient这个方法即可。这个方法包含在阿里云python sdk的核心包里面。


云产品时序指标监控数据

当我们需要获取一些云产品在一段时间内的监控数据,就需要用到DescribeMetricList 这个接口。

接口请求参数如下:


代码如下:

这里我们通过设置request对象的参数来切换我们所需要查询的数据。其中nameSpace代表了不同的云产品,metricName代表该云产品的不同监控项。


这里需要注意的是各云产品的Namespace、Project、Metric、Period、Dimensions等参数的取值都是不一样的,可以参考如下链接:

https://help.aliyun.com/document_detail/163515.html?spm=a2c4g.11186623.2.13.7e1d7751EU8Dse

获取数据并写入数据库

有了通用的获取时序监控数据的方法后就该获取我们想要的数据了。这里我们把需要的数据写入到sqlite3数据库中备用。

代码如下:

这里首先我们设定了需要的nameSpace和metricName。然后创建了根据用户名创建了不同的ecsCPU的数据库。这里DB的名称前面加用户名是为了后续生成巡检结果的时候便于区分。

之后我们便在每个用户的数据库中创建了以实例ID为名称的表,用来存放这个实例的监控数据。这里对名称做了一下处理。首先阿里云ECS的实例ID都是以i-****开头的,但是sqlite3数据库的标明不能出现-所以将i-这部分去除掉了。去掉后的一串字符串有可能以数字开头,以数字开头的表名在sqlite3中也是不允许的,所以之前又加了ecs_作为开头以避免表名报错。

生成巡检结果

当我们获取数据后就要生成巡检结果了,这里我们只需要读取之前存好的数据并且与我们的阈值进行判断即可。

到这里我们的巡检脚本就基本完成了。


使用说明

v 0.1 版本说明

阈值修改

支持根据需求配置不同的CPU、内存和磁盘阈值

配置方法:

修改ops.py文件的ecsCpuThreshold、ecsMemThreshold、ecsDiskThreshold三项的值即可,单位为百分比

配置文件说明

复制config.ini.ex为 config.ini 修改内容即可

[test]

配置文件名称

name = aaa

个性化名称

enable = 1

是否启用,1为启用,0为不启用。不启用的配置在生成报告中会被忽略

ak = Lxxxxx9C

阿里云AccessKey ID

sk = LxxxxxUq

阿里云AccessKey Secret

region= cn-hangzhou

地域信息,目前单配置仅支持单个地域,如有多个地域请添加多个文件


已知bug

目前未对ECS信息的分页进行处理,如果实例数量较多可能会导致数据获取不全的问题,后续版本修复 (目前测试环境下上百台机器暂未发现报错)。

未进行较为详细的报错信息输出,如果报错可能会直接退出。


了解更多技术案例,可查看云掣官网。

相关推荐

总结下SpringData JPA 的常用语法

SpringDataJPA常用有两种写法,一个是用Jpa自带方法进行CRUD,适合简单查询场景、例如查询全部数据、根据某个字段查询,根据某字段排序等等。另一种是使用注解方式,@Query、@Modi...

解决JPA在多线程中事务无法生效的问题

在使用SpringBoot2.x和JPA的过程中,如果在多线程环境下发现查询方法(如@Query或findAll)以及事务(如@Transactional)无法生效,通常是由于S...

PostgreSQL系列(一):数据类型和基本类型转换

自从厂子里出来后,数据库的主力就从Oracle变成MySQL了。有一说一哈,贵确实是有贵的道理,不是开源能比的。后面的工作里面基本上就是主MySQL,辅MongoDB、ES等NoSQL。最近想写一点跟...

基于MCP实现text2sql

目的:基于MCP实现text2sql能力参考:https://blog.csdn.net/hacker_Lees/article/details/146426392服务端#选用开源的MySQLMCP...

ORACLE 错误代码及解决办法

ORA-00001:违反唯一约束条件(.)错误说明:当在唯一索引所对应的列上键入重复值时,会触发此异常。ORA-00017:请求会话以设置跟踪事件ORA-00018:超出最大会话数ORA-00...

从 SQLite 到 DuckDB:查询快 5 倍,存储减少 80%

作者丨Trace译者丨明知山策划丨李冬梅Trace从一开始就使用SQLite将所有数据存储在用户设备上。这是一个非常不错的选择——SQLite高度可靠,并且多种编程语言都提供了广泛支持...

010:通过 MCP PostgreSQL 安全访问数据

项目简介提供对PostgreSQL数据库的只读访问功能。该服务器允许大型语言模型(LLMs)检查数据库的模式结构,并执行只读查询操作。核心功能提供对PostgreSQL数据库的只读访问允许L...

发现了一个好用且免费的SQL数据库工具(DBeaver)

缘起最近Ai不是大火么,想着自己也弄一些开源的框架来捣腾一下。手上用着Mac,但Mac都没有显卡的,对于学习Ai训练模型不方便,所以最近新购入了一台4090的拯救者,打算用来好好学习一下Ai(呸,以上...

微软发布.NET 10首个预览版:JIT编译器再进化、跨平台开发更流畅

IT之家2月26日消息,微软.NET团队昨日(2月25日)发布博文,宣布推出.NET10首个预览版更新,重点改进.NETRuntime、SDK、libraries、C#、AS...

数据库管理工具Navicat Premium最新版发布啦

管理多个数据库要么需要使用多个客户端应用程序,要么找到一个可以容纳你使用的所有数据库的应用程序。其中一个工具是NavicatPremium。它不仅支持大多数主要的数据库管理系统(DBMS),而且它...

50+AI新品齐发,微软Build放大招:拥抱Agent胜算几何?

北京时间5月20日凌晨,如果你打开微软Build2025开发者大会的直播,最先吸引你的可能不是一场原本属于AI和开发者的技术盛会,而是开场不久后的尴尬一幕:一边是几位微软员工在台下大...

揭秘:一条SQL语句的执行过程是怎么样的?

数据库系统能够接受SQL语句,并返回数据查询的结果,或者对数据库中的数据进行修改,可以说几乎每个程序员都使用过它。而MySQL又是目前使用最广泛的数据库。所以,解析一下MySQL编译并执行...

各家sql工具,都闹过哪些乐子?

相信这些sql工具,大家都不陌生吧,它们在业内绝对算得上第一梯队的产品了,但是你知道,他们都闹过什么乐子吗?首先登场的是Navicat,这款强大的数据库管理工具,曾经让一位程序员朋友“火”了一把。Na...

详解PG数据库管理工具--pgadmin工具、安装部署及相关功能

概述今天主要介绍一下PG数据库管理工具--pgadmin,一起来看看吧~一、介绍pgAdmin4是一款为PostgreSQL设计的可靠和全面的数据库设计和管理软件,它允许连接到特定的数据库,创建表和...

Enpass for Mac(跨平台密码管理软件)

还在寻找密码管理软件吗?密码管理软件有很多,但是综合素质相当优秀且完全免费的密码管理软件却并不常见,EnpassMac版是一款免费跨平台密码管理软件,可以通过这款软件高效安全的保护密码文件,而且可以...