Python3正则匹配re.split，re.finditer及re.findall函数用法详解

在Python中，正则表达式是一种强大的文本处理工具，可以用于字符串匹配、替换、分割等操作。re块是Python中处理正则表达式的标准库，提供了一系列函数，包括re.split，re.finditer及re.findall函数，用于处理正则表达式。本攻略将详细讲解Python3正则匹配re.split，re.finditer及re.findall函数的用法，包括如何使用这些函数实现常见的文本处理需求。

re.split函数

在Python中，re.split函数用于根据正则表达式分割字符串。下面是一个例子，演示如何使用re.split函数分割字符串：

import re

text = 'hello world'
pattern = r'\s'
result = re.split(pattern, text)
print(result)

在上面的代码中，我们使用re.split函数进行分割。re.split函数接受两个参数，第一个参数是正则表达式，第二个参数是要分割的字符串。如果匹配成功，re.split函数返回一个列表，包含分割后的字符串。我们可以使用print函数输出分割后的结果。运行代码后，结果为：

['hello', 'world']

在上面的代码中，我们使用了正则表达式\s进行分割。这个正则表达式匹配空格字符。然后，我们使用re.split函数进行分割操作。re.split函数返回分割后的结果。如果匹配成功，我们使用print函数输出分割后的结果。

示例1：分割字符串中的URL

下面是一个例子，演示如何使用re.split函数分割字符串中的URL：

import re

text = 'Visit my website at https://www.example.com'
pattern = r'https?://\S+'
result = re.split(pattern, text)
print(result)

在上面的代码中，我们re.split函数进行字符串分割。这个正则表达式使用https?://\S+匹配URL。然后，我们使用re.split函数进行分割操作。re.split函数分割后的结果。如果匹配成功，我们使用print函数输出分割后的结果。运行代码后，结果为：

['Visit my website at ', '']

在上面的代码中，我们使用了正则表达式https?://\S+进行分割。这个正则表达式匹配URL。然后，我们使用re.split函数进行分割操作。re.split函数返回分割后结果。如果匹配成功，我们使用print函数输出分割后的结果。

re.finditer函数

在Python中，re.finditer函数用于在字符串中查找正则表达式匹配的所有子串。下面是一个例子，演示如何使用re.finditer函数找字符串中的所有单词：

import re

text = 'hello world'
pattern = r'\w+'
result = re.finditer(pattern, text)
for match in result:
    print(match.group())

在上面的代码中，我们使用re.finditer函数进行正则表达式匹配。re.finditer函数接受两个参数，第一个参数是正则表式，第二个参数是要匹配的字符串。如果匹配成功，re.finditer函数返回一个迭代器，包含所有匹配到的子串。我们可以使用for循环遍历迭代器，使用group方法获取匹配到的子串如果匹配成功，我们使用print函数输出匹配到的子串。运行代码后，结果为：

hello
world

在上面的中，我们使用了正则表达式\w+进行匹配。这个正则表达式匹配一个或多个单词字符。然后，我们使用re.finditer函数进行匹配操作。re.finditer函数返回一个迭代器，包含所有匹配到的子串。我们使用for循环遍历迭代器，使用group方法获取匹配到的子串。如果匹配成功，我们使用print函数匹配到的子串。

示例2：查找字符串中的日期

下面是一个例子，演示如何使用re.finditer函数查找字符串中的日期：

import re

text = 'Today is 2023-05-14'
pattern = r'\d{4}-\d{2}-\d{2}'
result = re.finditer(pattern, text)
for match in result:
    print(match.group())

在上面的代码中，我们使用re.finditer函数进行正则表达式匹配。这个正则表达式使用\d{4}-d{2}-\d{2}匹配日期。然后，我们使用re.finditer函数进行匹配操作。re.finditer函数返回一个迭代器，包含所有匹配到的子串。我们使用for循环遍历迭代器，使用group方法获取配到的子串。如果匹配成功，我们使用print函数输出匹配到的子串。运行代码后，结果为：

2023-05-14

在上面的代码中，我们使用了正则表达式\d{4}-\d{2}-\d{2}进行匹配。这个正则表达式匹配日期。然后，我们使用re.finditer函数进行匹配操作。re.finditer函数返回一个迭代器，包含所有匹配到的子。我们for循环遍历迭代器，使用group方法获取匹配到的子串。如果匹配成功，我们使用print函数输出匹配到的子串。

re.findall函数

在Python中，re.findall函数用于在字符串中查找正则表达式匹配的所有子串，并返回一个列表。下面是一个例子，演示如何使用re.findall函数查找字符串中的所有单词：

import re

text = 'hello world'
pattern = r'\w+'
result = re.findall(pattern, text)
print(result)

在上面的代码中，我们使用re.findall函数进行正则表达式匹配。re.findall函数接受两个参数，第一个参数是正则表达式，第二个参数是要匹配的字符串。如果匹配成功，re.findall函数返回一个列表，包含所有匹配到的子串。我们可以使用print函数输出匹配到的子串。运行代码后，结果为：

['hello', 'world']

在上面的代码中，我们使用了正则表达式\w+进行匹配。这个正则表达式匹配一个或多个单词字符。然后，我们使用re.findall函数进行匹配操作。re.findall函数返回一个列表，包含所有匹配到的子串。我们可以使用print函数输出匹配到的子串。

示例3查找字符串中的URL

下面是一个例子，演示如何使用re.findall函数查找字符串中的URL：

import re

text = 'Visit my website at https://www.example.com'
pattern = r'https?://\S+'
result = re.findall(pattern, text)
print(result)

在上面的代码中，我们使用re.findall函数进行正则表达式匹配。这个正则表达式使用https?://\S+匹配URL。然后，我们使用re.findall函数进行配操作。re.findall函数返回一个列表，包含所有匹配到的子串。我们使用print函数输出匹配到的子串。运行代码后，结果为：

['https://www.example.com']

在上面的代码中，我们使用了正则表达式https?://\S+进行配。这个正则表达式匹配URL。然后，我们使用re.findall函数进行匹配操作。re.findall函数返回一个列表，含所有匹到的子串。我们可以使用print函数输出匹配到的子串。

以上是Python3正则匹配re.split，re.finditer及re.findall函数的攻略。实际应用中，我们可以根据具体情况选择合适的函数，以快速、准确地实现文本处理需求。

总结

本攻略详细讲解了Python3正则匹配re.split，re.finditer及re.findall函数的用法，包括如何使用这些函数实现常见的文本处理需求。在实际应用中，我们可以根据具体情况选择合适的函数，以快速、准确地实现文本处理需求。

Python3正则匹配re.split，re.finditer及re.findall函数用法详解

re.split函数

示例1：分割字符串中的URL

re.finditer函数

示例2：查找字符串中的日期

re.findall函数

示例3查找字符串中的URL

总结

你可能也喜欢

python正则表达式查找和替换内容的实例详解

Python 定义数字类

python里使用正则的findall函数的实例详解