Python正则匹配数字详解

正则表达式是一种强大的文本处理工具,它可以通过预定义的模式匹配文本中的内容,其中一个常见的应用是匹配数字。Python的re模块提供了丰富的正则表达式操作工具,本文将从多个方面详细介绍Python正则匹配数字的相关知识。

一、Python正则匹配数字空格

正则表达式提供了很多元字符,在匹配数字时,空格也是需要考虑的一个因素。下面是一个Python示例:

import re
text = "有8个苹果和 15 个梨子"
pattern = r"\d+\s*\w+"
match = re.findall(pattern, text)
print(match)

首先,我们使用re.findall函数对字符串text应用正则表达式pattern进行匹配。其中,\d表示数字,+表示一个或多个,\s表示空白字符,*表示0个或多个,\w表示单词字符(字母或数字),+表示一个或多个。因此,该模式匹配一个或多个数字加上可能存在的一个或多个空格,再加上一个或多个单词字符。

上述代码输出的结果是:[‘8个苹果’, ’15个梨子’],即匹配到两个数字加上其后面的单词。这个例子中,正则表达式中的\s*这个部分意思是,可能存在0个或多个空格,所以8和15前面可能有0到多个空格,都可以匹配到。

二、Python正则匹配文件名

有时,我们需要从文件路径中抽取文件名,匹配文件名的正则表达式通常是从文件路径中使用\倒数第一个斜杠后面的字符。下面是Python实现这个功能的示例:

import re
path = "C:/Users/User/Desktop/example.txt"
filename = re.findall(r"[^\\/:*?\"|]+\.[^\\/:*?\"|]+", path)
print(filename)

其中,[^\\/:*?\”|]表示匹配任何不是\、/、:、*、?、”、、|的字符,+表示一个或多个。.后面再加上一个[^\\/:*?\”|]+表示匹配除了\、/、:、*、?、”、、|以外的任何字符。因此,该正则表达式匹配的是路径中的最后一个斜杠后面的字符,即文件名以及文件扩展名,输出结果为[‘example.txt’]。

三、Python正则匹配数字开头的字符串

如果想要匹配以数字开头的字符串,可以使用字符串的内建函数isdigit(),其返回值为True或False,该方法返回True说明字符串全为数字。下面是一个用正则表达式匹配数字开头字符串的Python示例:

import re
text = "2021 is a good year!"
pattern = r"^\d+\D+"
match = re.findall(pattern, text)
print(match)

其中,^表示从字符串开头开始匹配,\d表示一个或多个数字,\D表示不是数字的字符,+表示一个或多个。因此,该正则表达式表示匹配以一个或多个数字开头,后面跟着一个或多个非数字字符的字符串。

上述代码输出的结果为[‘2021 is a’],即匹配到了以数字2021开头,后面跟着一个空格的字符串。

四、Python正则匹配

在Python的re模块中,我们可以通过compile创建一个正则表达式对象,然后使用match或者search方法进行匹配。

import re

text1 = "11aabbcc"
text2 = "aabb11cc"
regex_obj = re.compile(r"\d+\w+")
print(regex_obj.match(text1))
print(regex_obj.match(text2))
print(regex_obj.search(text2))

其中,\d表示数字,+表示一个或多个,\w表示字母或数字,+表示一个或多个。因此,该正则表达式匹配的是至少一个数字加上至少一个字母或数字。

上述代码中,regex_obj.match(text1)返回的是匹配的结果,因为text1的开头就是数字,所以可以匹配成功;而regex_obj.match(text2)返回的是None,因为text2的开头是字母,与\d不匹配。

因此,我们可以使用regex_obj.search(text2)方法,从text2中找到与正则表达式pattern匹配的第一个字符串’11cc’

五、Python正则匹配数字1-2

有时候我们并不关心一个数究竟能否被解析为浮点数,我们只是想匹配一到两位数字,下面是Python实现的一个示例:

import re
text = "123 abc 5678 12345"
pattern = r"\b\d{1,2}\b"
match = re.findall(pattern, text)
print(match)

其中,\d表示数字,{1,2}表示匹配1到2个数字,\b表示单词边界,即匹配单独的数值,不会匹配到任意两个数字间的临时字符。因此,该正则表达式匹配的是所有单独的1到2位数字。

上述代码输出的结果为[’23’, ’78’],即匹配到了单独的23和78。而数字123和数字5678后面都跟了非数字的字符,所以不会被匹配。

六、Python正则匹配数字字母

有时候我们需要匹配既有数字又有字母的字符串,可以使用[a-zA-Z0-9]这个字符类来匹配,下面是Python实现的一个示例:

import re
text = "My code is 20210618"
pattern = r"[a-zA-Z0-9]+"
match = re.findall(pattern, text)
print(match)

其中,[a-zA-Z0-9]表示数字或字母,+表示一个或多个。因此,该正则表达式匹配的是文本中所有既有数字又有字母的字符串。

上述代码输出的结果为[‘My’, ‘code’, ‘is’, ‘20210618’],即匹配到了4个既有数字又有字母的字符串。

七、Python正则匹配数字连续

有时候我们需要匹配连续的数字,我们可以使用\d+进行匹配,下面是Python实现的一个示例:

import re
text = "7, 8, 11, 20"
pattern = r"\d+"
match = re.findall(pattern, text)
print(match)

其中,\d表示数字,+表示一个或多个。因此,该正则表达式匹配的是文本中所有连续的数字。

上述代码输出的结果为[‘7’, ‘8’, ’11’, ’20’],即匹配到了4个连续的数字。

八、Python正则表达式规则

正则表达式是一种强大的文本处理工具,但同时也比较复杂。下面是一些常见的正则表达式规则:

  • \d:匹配数字
  • \w:匹配字母或数字
  • \s:匹配空格
  • ^:匹配字符串开头
  • $:匹配字符串结尾
  • *
  • +:匹配一个或多个

九、Python正则匹配任意字符

有时候我们需要匹配任意字符,可以使用点号”.”完成匹配。下面是Python实现的一个示例:

import re
text = "going somewhere new? meet someone new!"
pattern = r"n.w"
match = re.findall(pattern, text)
print(match)

其中,.表示匹配任意字符,而w前面的正则表达式字符n和后面的字符w是固定的。因此,该正则表达式匹配的是所有包括一个n和一个w之间只隔了一个任意字符的字符串。

上述代码输出的结果为[‘new’, ‘new’],即匹配到了两个字符串’new’。

十、Python正则表达式匹配数字

Python中的re模块提供了很多操作函数,下面是一个匹配数字的示例。

import re

text = "this is a test message, with 10 numbers: 123, 456, 789, 987, 654, 321"
pattern = r"\d+"
res = re.findall(pattern, text)
print(res)

其中,\d表示匹配数字字符,+表示匹配一到多个数字字符。因此,该正则表达式匹配的是字符串中包含的所有数字。

上述代码输出结果为[’10’, ‘123’, ‘456’, ‘789’, ‘987’, ‘654’, ‘321’],即匹配到了7个数字字符串。

本文从多个方面详细介绍了Python正则表达式中如何匹配数字的相关知识。通过学习,我们可以准确快速地匹配到我们所需要的数字字符串,方便地进行后续的数据分析和处理。

原创文章,作者:小蓝,如若转载,请注明出处:https://www.506064.com/n/285404.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
小蓝小蓝
上一篇 2024-12-22 15:44
下一篇 2024-12-22 15:44

相关推荐

  • Python中引入上一级目录中函数

    Python中经常需要调用其他文件夹中的模块或函数,其中一个常见的操作是引入上一级目录中的函数。在此,我们将从多个角度详细解释如何在Python中引入上一级目录的函数。 一、加入环…

    编程 2025-04-29
  • Python计算阳历日期对应周几

    本文介绍如何通过Python计算任意阳历日期对应周几。 一、获取日期 获取日期可以通过Python内置的模块datetime实现,示例代码如下: from datetime imp…

    编程 2025-04-29
  • Python列表中负数的个数

    Python列表是一个有序的集合,可以存储多个不同类型的元素。而负数是指小于0的整数。在Python列表中,我们想要找到负数的个数,可以通过以下几个方面进行实现。 一、使用循环遍历…

    编程 2025-04-29
  • 如何查看Anaconda中Python路径

    对Anaconda中Python路径即conda环境的查看进行详细的阐述。 一、使用命令行查看 1、在Windows系统中,可以使用命令提示符(cmd)或者Anaconda Pro…

    编程 2025-04-29
  • Python周杰伦代码用法介绍

    本文将从多个方面对Python周杰伦代码进行详细的阐述。 一、代码介绍 from urllib.request import urlopen from bs4 import Bea…

    编程 2025-04-29
  • python强行终止程序快捷键

    本文将从多个方面对python强行终止程序快捷键进行详细阐述,并提供相应代码示例。 一、Ctrl+C快捷键 Ctrl+C快捷键是在终端中经常用来强行终止运行的程序。当你在终端中运行…

    编程 2025-04-29
  • 蝴蝶优化算法Python版

    蝴蝶优化算法是一种基于仿生学的优化算法,模仿自然界中的蝴蝶进行搜索。它可以应用于多个领域的优化问题,包括数学优化、工程问题、机器学习等。本文将从多个方面对蝴蝶优化算法Python版…

    编程 2025-04-29
  • Python清华镜像下载

    Python清华镜像是一个高质量的Python开发资源镜像站,提供了Python及其相关的开发工具、框架和文档的下载服务。本文将从以下几个方面对Python清华镜像下载进行详细的阐…

    编程 2025-04-29
  • Python程序需要编译才能执行

    Python 被广泛应用于数据分析、人工智能、科学计算等领域,它的灵活性和简单易学的性质使得越来越多的人喜欢使用 Python 进行编程。然而,在 Python 中程序执行的方式不…

    编程 2025-04-29
  • Python字典去重复工具

    使用Python语言编写字典去重复工具,可帮助用户快速去重复。 一、字典去重复工具的需求 在使用Python编写程序时,我们经常需要处理数据文件,其中包含了大量的重复数据。为了方便…

    编程 2025-04-29

发表回复

登录后才能评论