百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

阿里云自动巡检(阿里云auto scaling)

liuian 2025-06-08 22:35 6 浏览

背景简介

随着智能化的快速发展及信息通信技术的不断创新,各大企业基于对信息安全,成本等各方面的考虑开始选择上云。作为国内云服务的领军者,阿里云也成为了大家重点关注和使用的云服务之一。上云节省了我们运维人员日常的工作,再也不用担心机房的温度、湿度等一系列问题。只需要关注服务器运行状况即可。大大减少了日常的工作量。

做运维永远是预防比消防更重要相信是很多运维人员的共识。定时巡检能够及时发现设备的异常情况,避免事故的发生,保障服务的稳定运行。对于服务器巡检来说,最基础的当然就是服务器的资源使用情况。CPU使用率、内存是否有异常波动,磁盘空间是否充足。当我们服务器数量较少的时候我们可以通过监控大盘去查看,但是当服务器数量达到100台以上时,监控大盘的缺点就表现出来了。我们去观察CPU性能曲线的时候如果数量过多会导致曲线过于密集。

如果用TOP的方式去展示又有可能因为计算TOP算法的问题导致某些存在隐患的机器被掩盖掉,没有展示出来,从而导致隐患的存在。但是每一台机器去观察既浪费时间又耗费精力。所以这里针对阿里云写了一个python的脚本来解决这个问题。脚本会自动获取指定时间段的阿里云监控数据,并且与提前设置好的阈值进行对比。如果监控数据达到了设定好的阈值就会写入到文本文档中。我们只需要定时去执行这个脚本,并且查看巡检结果即可。该脚本可以配合监控大盘去使用,达到一个相互辅助的效果,让我们在日常巡检的过程中更加游刃有余。

脚本介绍

简介

脚本巡检阈值可以自行设置调整。单次执行可以对多个阿里云账号及多个地域进行巡检。

目前脚本还不断迭代中,会支持越来越多的阿里云产品。

脚本巡检内容

  1. ECS CPU使用率
  2. ECS 内存使用率
  3. ECS磁盘空间使用率
  4. OSS bucket 存储使用量
  5. OSS 资源包订购情况

脚本工作流程图

  1. 设定巡检时间
  2. 读取配置文件并生成client
  3. 获取阿里云监控数据
  4. 判断是否超过阈值并生成巡检信息
  5. 生成易读的巡检文本

脚本详解

阿里云client

当我们需要获取阿里云云监控的监控数据的时候,第一步就是要创建client,即进行鉴权。只有通过鉴权才能获取到我们想要的数据。首先我们要创建AK,这里不再详细描述如何生成AK,阿里云官方文档中有详细的步骤。这里建议使用子账号的AK进行,并且尽量缩小权限,这样可以最大限度的保证账号的安全。

创建client其实很简单,只要调用AcsClient这个方法即可。这个方法包含在阿里云python sdk的核心包里面。


云产品时序指标监控数据

当我们需要获取一些云产品在一段时间内的监控数据,就需要用到DescribeMetricList 这个接口。

接口请求参数如下:


代码如下:

这里我们通过设置request对象的参数来切换我们所需要查询的数据。其中nameSpace代表了不同的云产品,metricName代表该云产品的不同监控项。


这里需要注意的是各云产品的Namespace、Project、Metric、Period、Dimensions等参数的取值都是不一样的,可以参考如下链接:

https://help.aliyun.com/document_detail/163515.html?spm=a2c4g.11186623.2.13.7e1d7751EU8Dse

获取数据并写入数据库

有了通用的获取时序监控数据的方法后就该获取我们想要的数据了。这里我们把需要的数据写入到sqlite3数据库中备用。

代码如下:

这里首先我们设定了需要的nameSpace和metricName。然后创建了根据用户名创建了不同的ecsCPU的数据库。这里DB的名称前面加用户名是为了后续生成巡检结果的时候便于区分。

之后我们便在每个用户的数据库中创建了以实例ID为名称的表,用来存放这个实例的监控数据。这里对名称做了一下处理。首先阿里云ECS的实例ID都是以i-****开头的,但是sqlite3数据库的标明不能出现-所以将i-这部分去除掉了。去掉后的一串字符串有可能以数字开头,以数字开头的表名在sqlite3中也是不允许的,所以之前又加了ecs_作为开头以避免表名报错。

生成巡检结果

当我们获取数据后就要生成巡检结果了,这里我们只需要读取之前存好的数据并且与我们的阈值进行判断即可。

到这里我们的巡检脚本就基本完成了。


使用说明

v 0.1 版本说明

阈值修改

支持根据需求配置不同的CPU、内存和磁盘阈值

配置方法:

修改ops.py文件的ecsCpuThreshold、ecsMemThreshold、ecsDiskThreshold三项的值即可,单位为百分比

配置文件说明

复制config.ini.ex为 config.ini 修改内容即可

[test]

配置文件名称

name = aaa

个性化名称

enable = 1

是否启用,1为启用,0为不启用。不启用的配置在生成报告中会被忽略

ak = Lxxxxx9C

阿里云AccessKey ID

sk = LxxxxxUq

阿里云AccessKey Secret

region= cn-hangzhou

地域信息,目前单配置仅支持单个地域,如有多个地域请添加多个文件


已知bug

目前未对ECS信息的分页进行处理,如果实例数量较多可能会导致数据获取不全的问题,后续版本修复 (目前测试环境下上百台机器暂未发现报错)。

未进行较为详细的报错信息输出,如果报错可能会直接退出。


了解更多技术案例,可查看云掣官网。

相关推荐

vue是什么东西(vue是干什么的)

首先看看官方网站是怎么解释的,如下:Vue(读作/vju/,类似于view)是一个用于构建用户界面的渐进式框架。与其他单体框架不同,Vue从一开始就被设计为可逐步采用的。核心库仅专注于视图层,易于...

超赞 vue2/3 可视化打印设计VuePluginPrint

今天来给大家推荐一款非常不错的Vue可拖拽打印设计器Hiprint。引入使用//main.js中引入安装import{hiPrintPlugin}from'vue-plugin-...

使用VuePress2.X构建个人知识博客,域名部署到GitHub Pages中

使用VuePress2.X构建个人知识博客,并且用个人域名部署到GitHubPages中什么是VuePressVuePress是一个以Markdown为中心的静态网站生成器。你可以使用Mar...

尤雨溪新品Vite的魔力,详解(尤雨溪新品vite的魔力,详解解析)

上篇《尤雨溪是个恶魔,Vite三天10更》谈到了Webpack这一系列打包工具出现的原因。这些工具的出现是为了解决ESModules模块系统本身的环境兼容问题、以及零散的模块文件导致的...

什么是VUE?vue有什么作用?(vue的主要用途)

什么是vue?Vue.js是一套构建用户界面的渐进式框架,Vue采用自下向上增量开发的设计,其核心库只关注视图层,易于上手,同时vue完全有能力驱动采用单文件组件和Vue生态系统支持的库开发的复...

10个Vue开发技巧「实践」(vue开发需要掌握哪些知识)

作者:WahFung转发链接:https://juejin.im/post/5e8a9b1ae51d45470720bdfa路由参数解耦一般在组件内使用路由参数,大多数人会这样做:exportdef...

刚搭好vuecli结果官网建议升级vite,于是就升级下

从vue-cli迁移到Vite进行迁移的主要原因是速度。Vite的开发服务器速度很快。因为它使用原生浏览器支持JavaScript模块,所以服务器启动时间是即时的。该方法还意味着无论应用程...

无所不能,将 Vue 渲染到嵌入式液晶屏

该文章转载自公众号@前端时刻,https://mp.weixin.qq.com/s/WDHW36zhfNFVFVv4jO2vrA前言之前看了雪碧大佬的将React渲染到嵌入式液晶屏觉得很有意思,R...

【开源】基于 Vue 和 Gin 开发的前后端分离的开源框架

项目介绍Gin-vue-admin是一个基于vue和gin开发的全栈前后端分离的开发基础平台,旨在快速搭建中小型项目。拥有jwt鉴权,动态路由,动态菜单,casbin鉴权,表单生成器,代码生成器等功能...

Firefox正针对Vue.js进行优化,下版本响应速度将“显著提升”

IT之家9月7日消息,据Mozilla官方博客发文显示,Firefox浏览器正针对Vue.js进行优化,此前FireFox浏览器在面向Vue3时遇到了一些性能问题。▲图源...

vue:生命周期钩子函数及顺序(vue3.0生命周期函数)

一、vue的钩子相关顺序Vue实例有一个完整的生命周期,在newVue()后,会初始化数据,如下://初始化的入口,各种初始化工作initMixin(Vue);//数据绑定的核心方法,包括常用...

使用 Pinia ORM 管理 Vue 中的状态

转载说明:原创不易,未经授权,谢绝任何形式的转载状态管理是构建任何Web应用程序的重要组成部分。虽然Vue提供了管理简单状态的技术,但随着应用程序复杂性的增加,处理状态可能变得更具挑战性。这就是为什么...

搭建Trae+Vue3的AI开发环境(vue ide 开发工具)

从2024年2025年,不断的有各种AI工具会在自媒体中火起来,号称各种效率王炸,而在AI是否会替代打工人的话题中,程序员又首当其冲。作为一个后端开发,这篇文章基于Trae工具,来创建和运行一个简单的...

如何在Vue3中使用Nuxt进行服务端渲染开发?

服务端渲染SSR(Server-SideRendering)是一种在服务器端生成网页内容的技术,这种实现方式与传统的客户端渲染CSR(Client-SideRendering)有所不同。在SSR中...

一篇文章说清 webpack、vite、vue-cli、create-vue 的区别

webpack、vite、vue-cli、create-vue这些都是什么?看着有点晕,不要怕,我们一起来分辨一下。先看这个表格:脚手架vue-clicreate-vue构建项目vite打包代码we...