百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

linux sed系列 第二篇:sed进阶技巧——地址定位与正则表达式

liuian 2025-07-09 14:13 37 浏览

“上一篇我们掌握了 sed 的基础替换,如同获得了第一把钥匙。现在,让我们更进一步,学习如何精准锁定目标行,如同拥有了导航地图,让每一次操作都直击要害!”

地址定位的四种维度

sed 的强大,很大程度上源于其灵活多变的地址定位能力。它能从四个维度锁定你的目标:

  • 行号定位:简单直接,如手术刀般精确。sed '10,20d' file 意味着删除文件的第10到20行。对于结构固定的文件,这无疑是最快捷的方式。
  • 正则匹配:模式的狩猎者。sed '/^ERROR/p' app.log 会在 app.log 中搜寻以 "ERROR" 开头的行并打印出来。这是动态文本处理的利器。
  • 范围组合:起始与终点的界定。sed '/START/,/END/s/foo/bar/' 会在匹配到 "START" 的行开始,到匹配到 "END" 的行结束的这个范围内,将 "foo" 替换为 "bar"。处理日志块或特定配置节时尤为有效。
  • 特殊符号:例如 $ 代表最后一行,1~2 代表从第一行开始,每隔一行匹配一次(奇数行)。

这些维度可以单独使用,也可巧妙组合,编织出复杂的定位逻辑。

AlmaLinux正则增强特性

在AlmaLinux(以及大多数现代Linux发行版)中,sed 的正则表达式能力得到了增强,主要体现在对POSIX扩展正则表达式(ERE)的支持上。

POSIX BRE vs ERE (PCRE-like):默认情况下,sed 使用基础正则表达式(BRE),其中像 ?, +, {}, |, () 等元字符需要转义 (\?, \+, \{\}, \|, \(\))。通过 -r (或 --regexp-extended) 选项,可以启用扩展正则,使得这些元字符无需转义,书写更简洁,可读性更强,更接近Perl兼容正则表达式(PCRE)的风格。

换行符处理与多行合并:sed 默认是逐行处理的,换行符 \n 在模式空间中通常是不可见的。但通过 N 指令,可以将下一行追加到模式空间,此时模式空间中就会包含 \n。例如,sed 'N;s/\\n//' 可以将两行合并为一行。这是实现跨行匹配和替换的关键技巧。

分支跳转实战

sed 不仅仅是简单的查找替换,它还拥有初步的逻辑控制能力——分支与跳转。这让 sed 脚本有了“思考”的能力。看这个例子,我们将日志文件中的错误行升级为CRITICAL级别并打印,其他行则直接删除:

sed '{
/error/{
    s/alert/CRITICAL/
    p
}
d
}' logfile

这里的花括号 {} 将多条指令组合在一起,作用于匹配 /error/ 的行。首先执行替换 s/alert/CRITICAL/,然后打印 p,最后无论是否匹配,所有行都会经过 d 指令(除非被 p 后通过 q 或其他方式提前退出)。这个例子中,匹配的行被处理并打印,然后被 d 删除;不匹配的行直接被 d 删除。因此,只有处理过的错误行会被输出。

保持空间进阶用法

除了模式空间(Pattern Space,当前处理行的缓冲区),sed 还有一个神秘的“后备仓库”——保持空间(Hold Space)。通过 h, H, g, G, x 等指令,我们可以在这两个空间之间巧妙地腾挪数据,实现复杂的多行操作,例如跨行计算。

想象一下,我们要从 /var/log/messages 中提取AlmaLinux系统负载的峰值信息。这通常分布在连续的几行中。我们可以这样做:

sed -n '/Load avg/{h; n; H; x; s/\\n/ /p}' /var/log/messages

解析: /Load avg/: 找到包含 "Load avg" 的行。 h: 将该行(模式空间内容)复制到保持空间(覆盖)。 n: 读取下一行到模式空间。 H: 将当前模式空间的内容追加到保持空间。 x: 交换模式空间和保持空间的内容。现在模式空间包含了之前两行的合并内容。 s/\\n/ /p: 将模式空间中的换行符替换为空格,并打印结果。 这只是冰山一角,保持空间的灵活运用是 sed 高阶技巧的试金石。

“精准定位的地图已在手中,正则表达式的利剑也已出鞘。我们甚至窥见了 sed 逻辑控制与数据暂存的曙光。下一篇,我们将正式踏入 sed 的‘编程模式’,探索其流程控制的奥秘,解锁编写复杂 sed 脚本的终极能力!”

相关推荐

教你把多个视频合并成一个视频的方法

一.情况介绍当你有一个m3u8文件和一个目录,目录中有连续的视频片段,这些片段可以连成一段完整的视频。m3u8文件打开后像这样:m3u8文件,可以理解为播放列表,里面是播放视频片段的顺序。视频片段像这...

零代码编程:用kimichat合并一个文件夹下的多个文件

一个文件夹里面有很多个srt字幕文件,如何借助kimichat来自动批量合并呢?在kimichat对话框中输入提示词:你是一个Python编程专家,完成如下的编程任务:这个文件夹:D:\downloa...

Java APT_java APT 生成代码

JavaAPT(AnnotationProcessingTool)是一种在Java编译阶段处理注解的工具。APT会在编译阶段扫描源代码中的注解,并根据这些注解生成代码、资源文件或其他输出,...

Unit Runtime:一键运行 AI 生成的代码,或许将成为你的复制 + 粘贴神器

在我们构建了UnitMesh架构之后,以及对应的demo之后,便着手于实现UnitMesh架构。于是,我们就继续开始UnitRuntime,以用于直接运行AI生成的代码。PS:...

挣脱臃肿的枷锁:为什么说Vert.x是Java开发者手中的一柄利剑?

如果你是一名Java开发者,那么你的职业生涯几乎无法避开Spring。它如同一位德高望重的老国王,统治着企业级应用开发的大片疆土。SpringBoot的约定大于配置、SpringCloud的微服务...

五年后,谷歌还在全力以赴发展 Kotlin

作者|FredericLardinois译者|Sambodhi策划|Tina自2017年谷歌I/O全球开发者大会上,谷歌首次宣布将Kotlin(JetBrains开发的Ja...

kotlin和java开发哪个好,优缺点对比

Kotlin和Java都是常见的编程语言,它们有各自的优缺点。Kotlin的优点:简洁:Kotlin程序相对于Java程序更简洁,可以减少代码量。安全:Kotlin在类型系统和空值安全...

移动端架构模式全景解析:从MVC到MVVM,如何选择最佳设计方案?

掌握不同架构模式的精髓,是构建可维护、可测试且高效移动应用的关键。在移动应用开发中,选择合适的软件架构模式对项目的可维护性、可测试性和团队协作效率至关重要。随着应用复杂度的增加,一个良好的架构能够帮助...

颜值非常高的XShell替代工具Termora,不一样的使用体验!

Termora是一款面向开发者和运维人员的跨平台SSH终端与文件管理工具,支持Windows、macOS及Linux系统,通过一体化界面简化远程服务器管理流程。其核心定位是解决多平台环境下远程连接、文...

预处理的底层原理和预处理编译运行异常的解决方案

若文章对您有帮助,欢迎关注程序员小迷。助您在编程路上越走越好![Mac-10.7.1LionIntel-based]Q:预处理到底干了什么事情?A:预处理,顾名思义,预先做的处理。源代码中...

为“架构”再建个模:如何用代码描述软件架构?

在架构治理平台ArchGuard中,为了实现对架构的治理,我们需要代码+模型描述所要处理的内容和数据。所以,在ArchGuard中,我们有了代码的模型、依赖的模型、变更的模型等,剩下的两个...

深度解析:Google Gemma 3n —— 移动优先的轻量多模态大模型

2025年6月,Google正式发布了Gemma3n,这是一款能够在2GB内存环境下运行的轻量级多模态大模型。它延续了Gemma家族的开源基因,同时在架构设计上大幅优化,目标是让...

比分网开发技术栈与功能详解_比分网有哪些

一、核心功能模块一个基本的比分网通常包含以下模块:首页/总览实时比分看板:滚动展示所有正在进行的比赛,包含比分、比赛时间、红黄牌等关键信息。热门赛事/焦点战:突出显示重要的、关注度高的比赛。赛事导航...

设计模式之-生成器_一键生成设计

一、【概念定义】——“分步构建复杂对象,隐藏创建细节”生成器模式(BuilderPattern):一种“分步构建型”创建型设计模式,它将一个复杂对象的构建与其表示分离,使得同样的构建过程可以创建...

构建第一个 Kotlin Android 应用_kotlin简介

第一步:安装AndroidStudio(推荐IDE)AndroidStudio是官方推荐的Android开发集成开发环境(IDE),内置对Kotlin的完整支持。1.下载And...