Python正则表达式常用函数总结

  • Post category:Python

Python正则表达式常用函数总结

正则表达式是一种强大的文本处理工具,可以用于各种文本处理,如数据清洗、文本分析、信息提取等。在Python中,我们可以使用re模块提供的函数来操作正则表达式。本攻略将详细讲解Python中正则表达式常用函数的用法,包括re.search()、re.match()、re.findall()和re.sub()。

re.search()

re.search()函数用于在字符串中搜索匹配正则表达式的第一个位置,并返回一个匹配对象。如果没有找到匹配的位置,则返回None。下面是一个示例:

import re

text = 'The quick brown fox jumps over the lazy dog.'
result = re.search(r'fox', text)
print(result)

在上面的代码中,我们使用re.search()函数搜索字符串中是否包含单词”fox”。运行代码后,输出结果为<re.Match object; span=(16, 19), match='fox'>,表示在字符串中找到了匹配的位置。

re.match()

re.match()函数用于从字符串的开头开始匹配正则表达式,并返回一个匹配对象。如果没有找到匹配的位置,则返回None。下面是一个示例:

import re

text = 'The quick brown fox jumps over the lazy dog.'
result = re.match(r'The', text)
print(result)

在上面的代码中,我们使用re.match()函数从字符串的开头开始匹配单词”The”。运行代码后,输出结果为<re.Match object; span=(0, 3), match='The'>,表示在字符串开头找到了匹配的位置。

re.findall()

re.findall()函数用于搜索字符串中匹配正则表达式的子串,并返回一个列表。下面是一个示例:

import re

text = 'The quick brown fox jumps over the lazy dog.'
result = re.findall(r'\w+', text)
print(result)

在上面的代码中,我们使用re.findall()函数搜索字符串中所有的单词,并返回一个列表。\w+表示配一个或多个字母、数字或下划线。运行代码后,输出结果为['The', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog']

re.sub()

re.sub()函数用于将字符串中所有匹正则表达式的子串替换为指定的字符串,并返回替换后的字符串。下面是一个示例:

import re

text = 'The quick brown fox jumps over the lazy dog.'
result = re.sub(r'fox', 'cat', text)
print(result)

在上面的代码中,我们使用re.sub()函数将字符串中所有的单词”fox”替换为”cat”。运行代码后,输出结果为The quick brown cat jumps over the lazy dog.

示例1:使用正则表达式匹配IP地址

下面是一个例子,演示如何使用正则表达式匹配IP地址:

import re

text = 'My IP address is 192.168.0.1.'
result = re.findall(r'\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}', text)
print(result)

在上面的代码中,我们使用正则表达式\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}匹配文本中的IP地址。\d{1,3}表示匹配一个到三个数字,\.表示匹配一个点号。运行代码后,输出结果为['192.168.0.1']

示例2:使用正则表达式匹配邮箱地址

下面是另一个例子,演示如何使用正则表达式匹配邮箱地址:

import re

text = 'My email address is example@example.com.'
result = re.findall(r'\w+@\w+\.\w+', text)
print(result)

在上面的代码中,我们使用正则表达式\w+@\w+\.\w+匹配文本中的邮箱地址。\w+表示匹配一个或多个字母、数字或下划线,@表示匹配一个@符号,\.表示匹配一个点。运行代码后,输出结果为['example@example.com']

总结

本攻略详细讲解了Python中正则表达式常用函数的用法,包括re.search()、re.match()、re.findall()和re.sub()。正则表达式是一种强大的文本处理工具,熟练掌握正则表达式的用法可以大大提高我们的工作效率。除此之外,我们还演示了如何使用正则表达式匹配IP地址和邮箱地址,希望读者可以通过这些示例更好地理解正则表达式的应用。