正则表达式替换

正则表达式（Regular Expression）在文本处理中有着广泛的应用，其中之一就是替换。在文本中进行替换是经常用到的一个操作，而使用正则表达式进行替换，则可以更加灵活方便地处理文本。

替换函数

在使用正则表达式进行替换时，常用的函数是re.sub()。其语法为：

re.sub(pattern, repl, string, count=0, flags=0)

其中，pattern是需要匹配的正则表达式，repl是替换后的字符串，string则是需要进行替换的原始字符串。count和flags是可选参数，分别表示最多替换的次数和匹配模式，在此不进行过多阐述。

示例代码：

import re

str = 'This is a test string.'
new_str = re.sub(r'\ba\b', 'the', str)

print(new_str)

以上代码使用正则表达式\ba\b匹配字符串中的单词a，并将其替换为the。该代码输出结果为：

This is the test string.

在实际中使用时，pattern和repl都可以是字符串或函数。当repl为函数时，该函数会在每一次匹配后被调用，返回值将作为替换字符串。如下所示：

import re

def multiply(matched):
    value = int(matched.group('value'))
    return str(value * 2)

str = '1 apple, 2 pears, 3 bananas.'
new_str = re.sub(r'(?P<value>\d+)', multiply, str)

print(new_str)

以上代码中，multiply函数将匹配到的数字乘2，作为替换字符串。该代码输出结果为：

2 apple, 4 pears, 6 bananas.

常用替换表达式

在正则表达式的替换过程中，有很多常用的替换表达式。下面列举几个常见的表达式及其示例：

\1、\2、\3…：用于在替换字符串中引用正则表达式中的分组。示例代码如下：
```
import re

str = 'Hello World, Goodbye World.'
new_str = re.sub(r'(\b\w+\b) (\b\w+\b)', r'\2 \1', str)

print(new_str)
```
以上代码中，使用\1和\2引用了两个\b\w+\b分组，使得匹配到的单词前后位置交换。该代码输出结果为：

“`bash
World Hello, World Goodbye.
“`

\g<name>：用于引用命名分组中的内容。示例代码如下：
```
import re

str = 'Hello {name}, Welcome to {place}!'
new_str = re.sub(r'\{(?P<name>\w+)\}', r'\g<name>', str)

print(new_str)
```
以上代码中使用命名分组(?P<name>)匹配字符串中的花括号内的内容，并使用\g<name>引用该内容。该代码输出结果为：

“`bash
Hello name, Welcome to place!
“`

re.I、re.IGNORECASE：用于忽略大小写，示例代码如下：
```
import re

str = 'This is 123 Test String.'
new_str = re.sub(r'test', 'new', str, flags=re.IGNORECASE)

print(new_str)
```
以上代码使用re.IGNORECASE忽略大小写进行匹配。该代码输出结果为：

“`bash
This is 123 New String.
“`