百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

Python正则表达式的使用技巧(python使用正则表达式的案例)

liuian 2025-03-14 18:47 17 浏览

1. 介绍

1.1 介绍

福哥今天要给大家讲讲Python的正则表达式的使用技巧,正则表达式(Regular expressions)就是通过一系列的特殊格式的匹配符号去描述一个字符串的工具。

使用正则表达式可以快速检测字符串的格式,也可以从字符串里面查找出符合特定规则的字符串片断,还可以将字符串按照特定的规则替换或者重组成新的字符串。

2. 正则表达式

2.1 表达式

2.1.1 re.compile

使用re.compile方法可以定义一个pattern,用来使用其他方法调用这个pattern。

Bash
url = "https://tongfu.net/home/35.html"

pattern = re.compile(r"tongfu\.net", re.I)

print(re.findall(pattern, url))

2.1.2 re.template

re.template方法和re.compile方法类似,可以达到相同的目的。

Bash
url = "https://tongfu.net/home/35.html"

pattern = re.template(r"tongfu\.net", re.I)

print(re.findall(pattern, url))

2.2 匹配

2.2.1 re.match

re.match可以实现使用pattern去匹配字符串,结果是一个对象,可以有很多功能可以使用。

re.match是从字符串开头进行匹配的,pattern如果不包含字符串开头部分的话,匹配一定会失败!

url = "https://tongfu.net/home/35.html"

match = re.match(r"https\:\/\/([^\/]+)\/home\/(\d+)\.html", url)

print(match.group())
print(match.groups())

2.2.2 re.search

re.search和re.match类型,区别在于re.search不是从字符串开头匹配的。

如果我们的pattern本身就是从字符串开头匹配的话建议使用re.match,因为效率它更快!

url = "https://tongfu.net/home/35.html"

match = re.search(r"home\/(\d+)\.html", url)

print(match.group())
print(match.groups())

2.2.3 re.findall

re.findall可以直接返回一个tuple数组,而且可以实现多组匹配。

urls = "https://tongfu.net/home/35.html," \
       "https://tongfu.net/home/8.html"

matches = re.findall(r"https\:\/\/([^\/]+)\/home\/(\d+)\.html", urls)

print(matches)

2.3 替换

2.3.1 re.sub

使用re.sub可以将pattern匹配的字符串片断替换为我们想要的内容,这里面还可以将pattern中的匹配组应用到替换内容里面。

urls = "https://tongfu.net/home/35.html," \
       "https://tongfu.net/home/8.html"

matches = re.sub(r"\/home\/(\d+)\.html", r"/homepage/\1.htm", urls)

print(matches)

2.3.2 re.subn

re.subn和re.sub在字符串替换功能上面没有区别,re.subn比re.sub多了一个替换次数的统计,这个会在返回值里面体现出来。

urls = "https://tongfu.net/home/35.html," \
       "https://tongfu.net/home/8.html"

matches = re.subn(r"\/home\/(\d+)\.html", r"/homepage/\1.htm", urls)

print(matches)

2.4 修饰符

修饰符就是参数flags,用来对pattern进行一个补充。

修饰符

描述

re.I

忽略大小写敏感,就是不管大小写问题,字母对就算匹配了。

re.L

本地化识别匹配。

re.M

多行匹配,默认正则表达式会在遇到换行符后结束匹配,设置这个之后就会一直匹配到末尾。

re.S

使字符“.”匹配换行符,默认字符“.”是不包括换行符的。

re.U

使用Unicode解析字符串,它会影响“\w”,“\W”,“\b”,“\B”的作用。

re.X

这个福哥还没有研究过,官方说法就是可以让编写pattern更加简单。

3. 总结

今天福哥带着童鞋们学习了Python的正则表达式库re的使用技巧,正则表达式在各种语言的编程时候都是非常重要的库,使用正则表达式可以让我们处理字符串变得更加简单、更加优雅~~


https://m.tongfu.net/home/35/blog/513407.html

相关推荐

那些Java架构师必知必会的技术

Java基础#Java对象的内存布局MapStruct解了对象映射的毒周末我把HashMap源码又过了一遍Java7和Java8中的ConcurrentHashMap原理解析Java中自定...

Java内存泄漏最全详解(6大原因及解决方案)

大家好,我是mikechen。内存泄漏是经常出现的线上故障,也是大厂面试经常考察的,下面我就全面来详解内存泄漏以及解决方案@mikechen本篇已收于mikechen原创超30万字《阿里架构师进阶专题...

都说Feign是RPC,没有侵入性,为什么我的代码越来越像 C++

1.概览随着SpringCloud的流行性,Feign已经成为RPC的事实标准,由于其构建与Http协议之上,对请求和返回值缺少规范约束,在日常开发过程中经常由于设计不当对系统造成一...

面试题系列-java后端面试题List 和 Set 的区别

List和Set的区别List,Set都是继承自Collection接口List特点:元素有放入顺序,元素可重复,Set特点:元素无放入顺序,元素不可重复,重复元素会覆盖掉,(...

一直不理解为什么在重写equals方法时都要重写hashCode方法

为什么在重写equals方法时都要重写hashCode方法呢?首先jdk的要求是这样的,equals与hashcode间的关系:1、如果两个对象相同(即用equals比较返回true),那么它们的ha...

翻了ConcurrentHashMap1.7 和1.8的源码,我总结了它们的主要区别

ConcurrentHashMap思考:HashTable是线程安全的,为什么不推荐使用?HashTable是一个线程安全的类,它使用synchronized来锁住整张Hash表来实现线程安全,即每次...

10 个经典的 Java 集合面试题,看你能否答得上来?

来自:evget.com/article/2014/11/27/21869.html这里有10个经典的Java面试题,也为大家列出了答案。这是Java开发人员面试经常容易遇到的问题,相信你了解和掌握之...

MyBatis3.5.11-从入门到高阶

一.课程介绍MyBatis概述MyBatis基础应用MyBatis高级MyBatis进阶二.MyBatis概述1、为什么需要MyBatis在我们程序中,运行时期产生的数据都是存放在内存中的,那么在内存...

灵魂拷问:如何检查 Java 数组中是否包含某个值?

作者|沉默王二责编|Elle在逛programcreek的时候,我发现了一些专注细节但价值连城的主题。比如说:如何检查Java数组中是否包含某个值?像这类灵魂拷问的主题,非常值得深入地研...

Java后端学习路线是什么?

关于Java后端(SpringBoot为主)学习路线:一、Java基础阶段编程语言基础掌握基本数据类型(如int、double、char等)、变量、常量的定义和使用。理解运算符(算术、关...

Mybatis配置文件XML全貌详解,再不懂我也没招了

一、为什么要使用配置文件试想,如果没有配置文件,我们的应用程序将只能沿着固定的姿态运行,几乎不能做任何动态的调整,那么这不是一套完美的设计,因为我们希望拥有更宽更灵活的操作空间和更多的兼容度,同时也能...

软件性能调优全攻略:从瓶颈定位到工具应用

性能调优是软件测试中的重要环节,旨在提高系统的响应时间、吞吐量、并发能力、资源利用率,并降低系统崩溃或卡顿的风险。通常,性能调优涉及发现性能瓶颈、分析问题根因、优化代码和系统配置等步骤,调优之前需要先...

你还在使用Guava的Lists.newArrayList()吗

Guava说起Guava,做Java开发的应该没人不知道吧,毕竟“google出品,必属精品”。虽然应该没有Spring那样让Javaer无法避开,但是其中很多工具类的封装还是让人欲罢不能。而我们今天...

JDK成长记7:3张图搞懂HashMap底层原理

HashMap基本原理和优缺点HashMap基本原理和优缺点一句话讲,HashMap底层数据结构,JDK1.7数组+单向链表、JDK1.8数组+单向链表+红黑树。HashMap的3个底层原理Hash...

如何深度理解mybatis?

深度自定义mybatis回顾mybatis的操作的核心步骤编写核心类SqlSessionFacotryBuild进行解析配置文件深度分析解析SqlSessionFacotryBuild干的核心工作编写...