再次升级!阿里云Kubernetes日志解决方案
liuian 2025-06-08 22:35 3 浏览
背景
针对K8S日志采集存在的采集目标多、弹性伸缩难、运维成本大、侵入性高、采集性能低等问题,在18年2月份日志服务和容器服务团队一起发布了阿里云Kubernetes日志解决方案。1分钟内即可完成整个集群部署,实现该节点上宿主机日志、容器日志、容器stdout等所有数据源的一站式采集。并且后续集群动态伸缩无需对采集做任何二次部署。
今天阿里云Kubernetes日志解决方案再次升级,为您带来以下改进:
- 极致部署体验:只需一条命令一个参数即可完成整个K8S集群的日志解决方案部署。
- 支持更多配置方式:除原生控制台、SDK配置方式外,支持通过CRD方式进行配置(kubectl、控制台、K8S openapi)。
- K8S无缝集成:采集配置支持yaml方式部署,兼容K8S各种集成方式。
日志服务介绍
阿里云的日志服务(log service)是针对日志类数据的一站式服务,2013年研发,有5年多线上运行经验,经历双十一、新春红包等考验。日志采集Agent Logtail运行在100W+机器上,为万级别应用提供服务。主要特点如下:
日志服务主要包括 实时采集与消费、数据投递、查询与实时分析 等功能,接下来我们介绍下如何利用日志服务进行Kubernetes日志采集。
Kubernetes日志采集方案介绍
方案简介
阿里云Kubernetes日志采集方案如上图所示:
- K8S的每个worker 节点都会运行一个Logtail容器,该容器可采集宿主机以及该宿主机上其他容器的日志(包括标准输出和日志文件)。
- Logtail以daemon set模式运行,保证每个节点都有一个Logtail容器在运行
- 使用自定义标识机器组,支持集群动态缩/扩容
- 所有的采集配置支持通过docker lable以及环境变量过滤指定容器
- K8S内部会注册自定义资源(CRD,CustomResourceDefinition)AliyunLogConfig,并部署alibaba-log-controller
- 支持用户通过CRD方式或日志服务控制台对采集配置进行管理
运行流程
以CRD配置方式为例,内部工作流程如下:
- 用户使用kubectl或其他工具应用aliyunlogconfigs CRD配置。
- alibaba-log-controller监听到配置更新。
- alibaba-log-controller根据CRD内容以及服务端状态,自动向日志服务提交logstore创建、配置创建以及应用机器组的请求。
- 以DaemonSet模式运行的Logtail会定期请求配置服务器,获取新的或已更新的配置并进行热加载。
- Logtail根据配置信息采集各个容器(POD)上的标准输出或日志文件。
- 最终Logtail将处理、聚合好的数据发送到日志服务。
部署方法
阿里云Kubernetes用户只需一条命令即可完成日志采集部署,命令中只需输入一个参数。
- 开通阿里云日志服务,日志服务开通链接。
- 登录您的阿里云容器服务Kubernetes的Master节点,如何登录参考SSH访问集群。
- 将下述命令中的${your_k8s_cluster_id}替换为您的Kubernetes集群id,执行此命令。
wget http://logtail-release.oss-cn-hangzhou.aliyuncs.com/linux64/alicloud-log-k8s-install.sh -O alicloud-log-k8s-install.sh; chmod 744 ./alicloud-log-k8s-install.sh; sh ./alicloud-log-k8s-install.sh ${your_k8s_cluster_id}
- 非阿里云Kubernetes用户也支持,请参考Kubernetes日志采集
配置方式
日志采集配置默认支持控制台配置方式,同时针对Kubernetes微服务开发模式,我们还提供CRD的配置方式,您可以直接使用kubectl对配置进行管理或集成到其他编排服务。两种配置方式特点如下:
CRD方式控制台方式操作复杂度低一般功能项支持除控制台方式外的高级配置一般上手难度一般低网络连接连接Kubernetes集群连接互联网与组件/应用部署集成支持不支持鉴权方式Kubernetes鉴权云账号鉴权
如果您刚开始使用日志服务,建议使用控制台的配置方式,此种方式所见即所得,非常易于上手。
若后续您需要将日志采集与服务/组件发布集成,建议使用CRD的配置方式。可以直接将采集配置和服务配置放到同一个yaml文件部署和管理。
方案优势
相比其他采集方案,日志服务Kubernetes采集方案具备以下优势:
核心技术介绍
在上一篇阿里云Kubernetes日志解决方案中我们对容器数据采集、自定义标识机器组等技术做了相关的介绍。本次主要为大家带来日志采集配置与K8S无缝集成的技术实现。
K8S无缝集成
问题背景
不同于其他开源日志采集Agent,日志服务Logtail从设计之初就已经考虑到配置管理的难题。因此Logtail从第一个版本发布就支持中心化的配置管理。支持在日志服务控制台或者SDK远程对所有采集配置进行统一管理,大大降低了日志采集的管理负担。
但在K8S集群环境下,业务应用/服务/组件的持续集成和自动发布已经成为常态,使用控制台或SDK操作采集配置的方式很难与各类CI、编排框架集成,导致业务应用发布后用户只能通过控制台手动配置的方式部署与之对应的日志采集配置。
因此日志服务专门为K8S进行了扩展,用以支持原始的配置管理。
实现方式
如上图所示,日志服务为K8S新增了一个CustomResourceDefinition扩展,名为AliyunLogConfig。同时开发了alibaba-log-controller用于监听AliyunLogConfig事件。
当用户创建/删除/修改AliyunLogConfig资源时,alibaba-log-controller会监听到资源变化,并对应的在日志服务上创建/删除/修改相应的采集配置。以此实现K8S内部AliyunLogConfig与日志服务中采集配置的关联关系。
alibaba-log-controller内部实现
alibaba-log-controller主要由6个模块组成,各个模块的功能以及依赖关系如上图所示:
- EventListener:负责监听AliyunLogConfig的CRD资源。这个EventListener是广义上的listener,主要功能有初始化时会list所有的AliyunLogConfig资源注册AliyunLogConfig监听变化的事件定期再扫描全量的AliyunLogConfig资源防止事件出现遗漏或处理失效将事件打包,交由EventHandler处理
- EventHandler:负责处理对应的Create/Update/Delete事件,作为Controller的核心模块,主要功能如下:首先检查ConfigMapManager中对应的checkpoint,如该事件已经被处理(版本号相同且状态为200),则直接跳过为防止历史事件干扰处理结果,从服务端拉取最新的资源状态,检查是否为同一版本,若版本不一致,使用服务端版本替换对事件进行一定的预处理,使之符合LogSDK的基本格式需求调用LogSDKWrapper,创建日志服务Logstore,Create/Update/Delete对应的配置根据上述处理结果,更新对应AliyunLogConfig资源的状态
- ConfigMapManager:依赖于K8S的ConfigMap机制实现Controller的checkpoint管理,包括:维护checkpoint到ConfigMap的映射关系提供基础的checkpoint增删改查接口
- LogSDKWrapper:基于阿里云LOG golang sdk的二次封装,功能包括:初始化创建日志服务资源,包括Project、MachineGroup、Operation Logstore等将CRD资源转换为对应的日志服务资源操作,为1对多关系包装SDK接口,自动处理网络异常、服务器异常、权限异常负责权限管理,包括自动获取role,更新sts token等
- ScheduledSyner:后台的定期同步模块,防止进程/节点失效期间配置改动而遗漏事件,保证配置管理的最终一致性:定期刷新所有的checkpoint和AliyunLogConfig检查checkpoint和AliyunLogConfig资源的映射关系,如果checkpoint中出现不存在的配置,则删除对应的资源
- Monitor:alibaba-log-controller除了将本地运行日志输出到stdout外,还会将日志直接采集到日志服务,便于远程排查问题。采集日志种类如下:k8s api内部异常日志alibaba-log-controller运行日志alibaba-log-controller内部异常数据(自动聚合)
快速入门
总结
阿里云日志服务本次带来的提升更进一步简化了K8S日志采集的上手门槛以及集成体验。让广大用户真正体验到一个字:爽,从此日志运维人员的生活质量大大提高。
目前Logtail除支持宿主机文件、容器文件、容器stdout采集外,还支持以下多种采集方式(这些方式k8s中均支持):
- syslog采集
- Mysql binlog采集
- JDBC采集
- http采集
相关推荐
- 如何使用postman做接口测试(菜鸟级攻略)
-
首先,什么是接口呢?接口一般来说有两种,一种是程序内部的接口,一种是系统对外的接口。系统对外的接口:比如你要从别的网站或服务器上获取资源或信息,别人肯定不会把数据库共享给你,他只能给你提供一个他们写好...
- postman教程-15-Runner说明及创建业务流
-
经常我们要把编写好的用例进行回归测试,这时我们就可以通过Runner来选择我们要运行的测试集进行回归。Runner介绍进入Runner有两个入口,第一个就是选择一个集合,点击右三角进入,点击RUN;第...
- Postman 接口测试实战教程:从入门到精通,全网最全项目详解
-
什么是接口?为什么需要接口?因为接口能使我们的实体或者软件内部数据能够被外部进行修改、查询。从而使得内部和外部实现数据交互,所以,需要用到接口。软件接口:右称:API(applicationprog...
- HTTP Cookies知识-查看、发送、获取、返回
-
1简介HTTPCookies是服务器发送到用户浏览器并保存在本地的一小块数据,它会在浏览器下次向同一服务器再发起请求里被携带并发送到服务器上。Cookie主要用于以下三个方面:会话状态管理(如用...
- Jmeter和Postman测试工具的区别(postman和jmeter的优缺点)
-
区别一:用例组织方式不同的目录结构与组织方式代表不同工具的测试思想,学习一个测试工具应该首先了解其组织方式。Jmeter的组织方式相对比较扁平,它首先没有WorkSpace(工作空间)的概念,直接是T...
- Postman接口测试之:添加Cookie伪造请求
-
1、获取cookie值登录某网站,通过开发者工具(或者fiddler抓包工具),获取登录成功后的请求头中的cookie值。大家肯定奇怪,明明访问首页的时候就已经生成了cookie值,为什么还登录呢?虽...
- PostMan循环发送请求(postman重复请求)
-
我们在开发中,测试一个或者多个接口时,经常需要循环的去访问这个接口,用来测试接口的性能,使用postman可以做到这一点。不仅能循环测试一个接口,还能同时循环测试多个接口。一PostMan循环发送请求...
- 手把手教你搭建一个文件存储服务器minio,实现文件存储
-
Minio是一个开源的、自托管的对象存储服务器,它提供了类似于云存储服务的功能。你可以使用Minio搭建自己的私有云存储解决方案,或者作为公共存储服务的替代方案。安装官网:https://min.io...
- 存储_AWS的S3实践之路(aws 文件存储)
-
前言当今的开发基本已经基于云开发了,遥想当年自己也曾扛过交换机、抬过服务器和防火墙。读书人一声长叹,时代变化弹指一挥间。好吧,过去心不可得。说到云上存储,当属阿里云的OSS和亚马逊的S3。今天就入个S...
- Java 编程技巧之单元测试用例编写流程
-
温馨提示:本文较长,同学们可收藏后再看:)前言清代杰出思想家章学诚有一句名言:“学必求其心得,业必贵其专精。”意思是:学习上一定要追求心得体会,事业上一定要贵以专注精深。做技术就是这样,一件事如果做...
- 快来试试这款一行代码实现多平台文件存储的工具!
-
大家好,我是Java陈序员。文件上传下载,是我们在开发中经常会遇到的需求!无论是本地存储、还是云存储,我们可以自己封装API来实现功能。今天,给大家介绍一款一行代码实现多平台文件存储的工具,开箱...
- “全”事件触发:阿里云函数计算与事件总线产品完成全面深度集成
-
随着云原生技术的普及和落地,企业在构建业务系统时,往往需要依赖多个云产品和服务,产品互联、系统协同的需求越来越强。事件驱动架构将事件应用于解耦服务之间的触发和交互,能够帮助用户很好实现产品、系统之间...
- 2.2k star,一款业界领先的私有云+在线文档管理系统
-
简介kodbox可道云(原KodExplorer)是业内领先的企业私有云和在线文档管理系统,为个人网站、企业私有云部署、网络存储、在线文档管理、在线办公等提供安全可控,简便易用、可高度定制的私有云产品...
- 再次升级!阿里云Kubernetes日志解决方案
-
背景针对K8S日志采集存在的采集目标多、弹性伸缩难、运维成本大、侵入性高、采集性能低等问题,在18年2月份日志服务和容器服务团队一起发布了阿里云Kubernetes日志解决方案。1分钟内即可完成整个集...
- 基于Spring+SpringMVC+Mybatis分布式敏捷开发系统架构(附源码)
-
前言zheng项目不仅仅是一个开发架构,而是努力打造一套从前端模板-基础框架-分布式架构-开源项目-持续集成-自动化部署-系统监测-无缝升级的全方位J2EE企业级开发解...
- 一周热门
-
-
Python实现人事自动打卡,再也不会被批评
-
Psutil + Flask + Pyecharts + Bootstrap 开发动态可视化系统监控
-
【验证码逆向专栏】vaptcha 手势验证码逆向分析
-
一个解决支持HTML/CSS/JS网页转PDF(高质量)的终极解决方案
-
再见Swagger UI 国人开源了一款超好用的 API 文档生成框架,真香
-
网页转成pdf文件的经验分享 网页转成pdf文件的经验分享怎么弄
-
C++ std::vector 简介
-
python使用fitz模块提取pdf中的图片
-
《人人译客》如何规划你的移动电商网站(2)
-
Jupyterhub安装教程 jupyter怎么安装包
-
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- table.render (33)
- uniapp textarea (33)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)