百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

如何高效读取Linux日志文件?这些命令要熟记于心!

liuian 2025-05-28 18:44 14 浏览

在 Linux 系统中,日志文件通常存储在 /var/log 目录下。比如,/var/log/syslog(或 /var/log/messages,视发行版而定)记录系统整体事件,/var/log/auth.log 记录认证相关信息,/var/log/apache2/access.log 则是 Web 服务器的访问日志。这些文件大多是纯文本格式,方便我们用命令行工具直接操作。

但日志文件有个特点:它们往往是动态的,内容会随着系统运行不断追加。而且,有些日志会被压缩成 .gz 文件(比如 /var/log/syslog.1.gz),有些甚至被分割成多个文件(如 kern.log.1kern.log.2)。这就要求我们在读取时,既要能处理实时数据,也要能挖掘历史记录。

基础利器:cat、less 和 more

1.cat

简单粗暴的全文输出

如果你只是想快速瞥一眼日志文件的内容,cat 是最直接的选择。敲下 cat /var/log/syslog,整个文件的内容就会一股脑儿地输出到终端。不过,当日志文件很大时,屏幕会被刷得眼花缭乱,完全看不过来。

  • 小技巧:可以用 cat /var/log/syslog | head -n 50 只看前 50 行,或者 cat /var/log/syslog | tail -n 50 查看最后 50 行。
  • 进阶玩法cat /var/log/syslog | grep "error" 可以快速过滤出包含 "error" 的行,适合初步排查问题。

说明我服务器上暂时没有错误的日志,哈哈。

2.less

翻页浏览的优雅选择

当日志文件太长时,less /var/log/syslog 是更好的工具。它允许你上下滚动查看内容,按 q 退出。

  • 实用快捷键/keyword:搜索关键词(比如 /error),按 n 跳到下一个匹配项。g:跳到文件开头,G:跳到文件末尾。Ctrl+F:向前翻页,Ctrl+B:向后翻页。
  • 实时监控:如果你想边看边刷新最新内容,可以用 less +F /var/log/syslog,相当于 tail -f 的效果,按 Ctrl+C 回到普通模式。

3.more

老派但可靠

more /var/log/syslogless 类似,但功能更简单,只能向下翻页,无法回滚。按空格翻页,q 退出。虽然不如 less 灵活,但在资源紧张的老系统上,它依然是个轻量选择。

实时追踪神器:tail

日志的魅力在于它的动态性,而 tail 正是捕捉这种动态的最佳工具。

  • tail -f:实时监控
    执行 tail -f /var/log/syslog,你会看到日志的最后几行,并且新写入的内容会实时追加到屏幕上。这在排查实时问题(比如服务启动失败)时非常有用。变种tail -n 100 -f /var/log/syslog 可以先显示最后 100 行,再开始实时追踪。
  • tail + grep 的组合拳
    比如,tail -f /var/log/auth.log | grep "sshd" 可以实时监控 SSH 登录相关的日志,帮你迅速发现异常登录尝试。

历史挖掘专家:head 和 grep

1.head

快速瞄准开头

日志文件的前几行往往包含系统启动时的信息,用 head -n 20 /var/log/syslog 可以快速查看开头的 20 行。如果想结合其他工具,比如 head -n 50 /var/log/syslog | grep "kernel",就能聚焦内核相关的启动日志。

2.grep:精准过滤的利刃

grep 是日志分析的灵魂。假设你在 /var/log/apache2/access.log 中找某个 IP 的访问记录:

  • grep "192.168.1.1" /var/log/apache2/access.log
  • 高级用法-i:忽略大小写,如 grep -i "error" /var/log/syslog-r:递归搜索目录下所有文件,比如 grep -r "timeout" /var/log/-A 5:显示匹配行后 5 行,-B 5:显示前 5 行,-C 5:前后各 5 行,方便查看上下文。--color:高亮匹配内容,视觉效果更佳。
  • 实战案例:查找最近的错误日志,tail -n 1000 /var/log/syslog | grep -A 10 "error",既能看到错误行,又能了解后续影响。

处理压缩日志:zcat、zless 和 zgrep

老日志通常会被压缩成 .gz 格式,直接用 catless 是打不开的。这时,zcatzlesszgrep 登场。

  • zcat:解压并输出
    zcat /var/log/syslog.1.gz 会直接将压缩文件内容输出到终端,效果类似 cat
  • zless:翻页查看压缩文件
    zless /var/log/syslog.1.gz 让你像用 less 一样浏览压缩日志。
  • zgrep:搜索压缩日志
    zgrep "error" /var/log/syslog.1.gz 可以直接在压缩文件中搜索关键词,省去手动解压的麻烦。

小贴士:如果需要解压后操作,可以用 gunzip /var/log/syslog.1.gz,但注意备份原文件,避免覆盖。

日志切割与合并:awk 和 sed

日志文件有时需要更精细的处理,比如提取特定字段或清洗数据。这时,awksed 是你的得力助手。

1.awk

字段提取大师

假设 /var/log/apache2/access.log 的格式是 IP - - [时间] "请求" 状态码 字节数,你想提取所有状态码为 404 的请求:

  • awk '$9 == 404' /var/log/apache2/access.log$9 是第 9 个字段,通常是状态码)。
  • 再进一步,提取 IP 和请求:awk '$9 == 404 {print $1, $7}' /var/log/apache2/access.log

2.sed

文本替换与清洗

如果日志中有大量冗余信息,比如时间戳前的无关前缀,可以用 sed 清理:

  • sed 's/^[A-Za-z]\{3\} [0-9]\{2\} [0-9]\{2\}:[0-9]\{2\}:[0-9]\{2\} //' 删除 syslog 中常见的时间戳。
  • 结合管道:cat /var/log/syslog | sed '/error/d' 删除所有含 "error" 的行。

高级玩法:journalctl 和 logrotate

1.journalctl

systemd 日志的瑞士军刀

现代 Linux 系统大多用 systemd 管理日志,日志不再只存于文件,而是由 journald 收集。

  • 查看所有日志:journalctl
  • 按服务过滤:journalctl -u sshd 查看 SSH 服务日志。
  • 按时间段:journalctl --since "2025-03-09 10:00" --until "2025-03-09 12:00"
  • 实时监控:journalctl -f,类似 tail -f
  • 按优先级:journalctl -p 3 只看错误级别(0=紧急,7=调试)。

2.logrotate

管理日志文件

虽然不是直接读取工具,但 logrotate 能帮你管理日志,避免文件过大。配置文件在 /etc/logrotate.conf/etc/logrotate.d/,可以设置日志轮转周期和压缩策略。

相关推荐

Chrome浏览器必学实用技巧-建议收藏

谷歌Chrome是目前最流行的桌面浏览器,本文分享了一些实用的使用技巧,希望能够对大家的工作和生活提供一些助力。贴士:不同版本的Chrome,其功能或菜单可能存在细微差异。本文使用的Chrome浏览器...

如何使用 Chrome 中的检查元素工具

如何在Chrome中使用Inspect元素启动检查元素工具的最简单方法是右键单击网页上的任何内容。然后,只需单击列表底部的“检查”选项。通常,Element是默认启动的。如果没有,那么您可以...

Chromedriver 在 Python 中查看源代码的方法

Python中可以属性来查看需要爬取的网站的源代码。对应具体的是:chrome.page_source需要注意的是首先需要导入包fromselenium.webdriverimportChro...

手机怎么查看HTML 文件

在手机端实现对HTML文件(包含本地文件和网页源代码)的查看,可借助多种途径和工具。以下为详细的操作步骤和实用的工具推荐:一、本地HTML文件的查看(一)利用浏览器打开定位文件:在手机的文件管...

防止学生查看答案,竟然让Chrome禁止查看源码功能

Chrome现在是很多人的主力浏览器,用户多了需求也会很多。Chrome每天都会收到很多意见和功能需求。然而有一个需求很奇怪,要求Chrome禁止查看网页源码的功能。这是怎么回事呢?1.问题背景我们都...

如何查看网页的HTML源代码?这里提供详细步骤

每个主要的互联网浏览器都允许用户查看任何网页的HTML(超文本标记语言)源代码。以下部分包含有关在每个主要浏览器中查看源代码的多种方法的信息。引言查看网页的源代码时,服务器处理的信息和代码不会出现。例...

如何在浏览器账中查看网页的HTML源代码?

浏览html网页,查看其源代码,可以帮助我们了解该版网页的信息以及架构,每个浏览器都是允许用户查看他们访问的任何网页的HTML源代码的。以下编程狮小师妹就介绍几个常见浏览器的查看网页HTML源代码...

python基础快速入门

Python是一种简单易学且功能强大的编程语言,适合初学者入门学习,不论是就业还是做副业赚钱或者是提高自己办公效率都是不错的选择。1.安装Python下载Python:前往Python官...

Python 如何创建一个 JSON 对象

我们可以使用下面的代码来在Python中创建一个JSON对象。importjsondata={}data['key']='value'json...

牛啊牛啊:C#/.NET一行代码把实体类类型转换为Json数据字符串

前言:刚好要做一个类似Swagger那种可以快速访问api接口和演示的功能,于是就把做的思路写到包里面去,给有需要的小伙伴提供学习和参考。首先,安装1.0.10以及以上版本的Wesky.Net.Op...

基于Jackson封装Json工具类:Java对象与JSON字符串的高效转换

在现代的Web开发和API设计中,JSON(JavaScriptObjectNotation)作为一种轻量级的数据交换格式被广泛使用。它易于人阅读和编写,同时也易于机器解析和生成。在Java生态系...

Python数据持久化:JSON

编程派微信号:codingpy上周更新的《ThinkPython2e》第14章讲述了几种数据持久化的方式,包括dbm、pickle等,但是考虑到篇幅和读者等因素,并没有将各种方式都列全。本文将介绍...

js中关于json语法和json遍历问题

什么是JSON?JSON英文全称JavaScriptObjectNotationJSON是一种轻量级的数据交换格式。JSON是独立的语言*JSON易于理解。json对象使用js语法,但...

Python 使用 JsonPath 完成接口自动化测试中参数关联和数据验证

背景:接口自动化测试实现简单、成本较低、收益较高,越来越受到企业重视RESTFul风格的API设计大行其道JSON成为主流的轻量级数据交换格式痛点接口关联接口关联也称为关联参数。在应用业务接口...

Spark读取kafka复杂嵌套json的最佳实践

随着互联网的更进一步发展,信息浏览、搜索以及电子商务、互联网旅游生活产品等将生活中的流通环节在线化,对于实时性的要求进一步提升,而信息的交互和沟通正在从点对点往信息链甚至信息网的方向发展,这样必然带来...