Python常用的正則表達式處理函數詳解
正則表達式是一個特殊的字符序列,用於簡潔表達一組字符串特徵,檢查一個字符串是否與某種模式匹配,使用起來十分方便。
在Python中,我們通過調用re庫來使用re模塊:
import re
下面介紹Python常用的正則表達式處理函數。
re.match函數
re.match 函數從字符串的起始位置匹配正則表達式,返回match對象,如果不是起始位置匹配成功的話,match()就返回None。
re.match(pattern, string, flags=0)
pattern:匹配的正則表達式。
string:待匹配的字符串。
flags:標誌位,用於控制正則表達式的匹配方式,如:是否區分大小寫,多行匹配等等。具體參數爲:
re.I:忽略大小寫。
re.L:表示特殊字符集 w, W, , B, s, S 依賴於當前環境。
re.M:多行模式。
re.S:即 . ,並且包括換行符在內的任意字符(. 不包括換行符)。
re.U:表示特殊字符集 w, W, , B, d, D, s, S 依賴於 Unicode 字符屬性數據庫。
re.X:爲了增加可讀性,忽略空格和 # 後面的註釋。
import re#從起始位置匹配r1=re.match('abc','abcdefghi')print(r1)#不從起始位置匹配r2=re.match('def','abcdefghi')print(r2)
運行結果:
其中,span表示匹配成功的整個子串的索引。
使用group(num) 或 groups() 匹配對象函數來獲取匹配表達式。
group(num):匹配的整個表達式的字符串,group() 可以一次輸入多個組號,這時它將返回一個包含那些組所對應值的元組。
groups():返回一個包含所有小組字符串的元組,從 1 到 所含的小組號。
import res='This is a demo'r1=re.match(r'(.*) is (.*)',s)r2=re.match(r'(.*) is (.*?)',s)print(r1.group())print(r1.group(1))print(r1.group(2))print(r1.groups())print()print(r2.group())print(r2.group(1))print(r2.group(2))print(r2.groups())
運行結果:
上述代碼中的(.*)和(.*?)表示正則表達式的貪婪匹配與非貪婪匹配。
re.search函數
re.search函數掃描整個字符串並返回第一個成功的匹配,如果匹配成功則返回match對象,否則返回None。
re.search(pattern, string, flags=0)
pattern:匹配的正則表達式。
string:待匹配的字符串。
flags:標誌位,用於控制正則表達式的匹配方式,如:是否區分大小寫,多行匹配等等。
import re#從起始位置匹配r1=re.search('abc','abcdefghi')print(r1)#不從起始位置匹配r2=re.search('def','abcdefghi')print(r2)
運行結果:
使用group(num) 或 groups() 匹配對象函數來獲取匹配表達式。
group(num=0):匹配的整個表達式的字符串,group() 可以一次輸入多個組號,這時它將返回一個包含那些組所對應值的元組。
groups():返回一個包含所有小組字符串的元組,從 1 到 所含的小組號。
import res='This is a demo'r1=re.search(r'(.*) is (.*)',s)r2=re.search(r'(.*) is (.*?)',s)print(r1.group())print(r1.group(1))print(r1.group(2))print(r1.groups())print()print(r2.group())print(r2.group(1))print(r2.group(2))print(r2.groups())
運行結果:
從上面不難發現re.match與re.search的區別:re.match只匹配字符串的起始位置,只要起始位置不符合正則表達式就匹配失敗,而re.search是匹配整個字符串,直到找到一個匹配爲止。
re.compile 函數
compile 函數用於編譯正則表達式,生成一個正則表達式對象,供 match() 和 search() 這兩個函數使用。
re.compile(pattern[, flags])
pattern:一個字符串形式的正則表達式。
flags:可選,表示匹配模式,比如忽略大小寫,多行模式等。
import re#匹配數字r=re.compile(r'd+') r1=r.match('This is a demo')r2=r.match('This is 111 and That is 222',0,27)r3=r.match('This is 111 and That is 222',8,27) print(r1)print(r2)print(r3)
運行結果:
findall函數
搜索字符串,以列表形式返回正則表達式匹配的所有子串,如果沒有找到匹配的,則返回空列表。
需要注意的是,match 和 search 是匹配一次,而findall 匹配所有。
findall(string[, pos[, endpos]])
string:待匹配的字符串。
pos:可選參數,指定字符串的起始位置,默認爲0。
endpos:可選參數,指定字符串的結束位置,默認爲字符串的長度。
import re#匹配數字r=re.compile(r'd+') r1=r.findall('This is a demo')r2=r.findall('This is 111 and That is 222',0,11)r3=r.findall('This is 111 and That is 222',0,27) print(r1)print(r2)print(r3)
運行結果:
re.finditer函數
和 findall 類似,在字符串中找到正則表達式所匹配的所有子串,並把它們作爲一個迭代器返回。
re.finditer(pattern, string, flags=0)
pattern:匹配的正則表達式。
string:待匹配的字符串。
flags:標誌位,用於控制正則表達式的匹配方式,如是否區分大小寫,多行匹配等。
import re r=re.finditer(r'd+','This is 111 and That is 222')for i in r: print (i.group())
運行結果:
re.split函數
將一個字符串按照正則表達式匹配的子串進行分割後,以列表形式返回。
re.split(pattern, string[, maxsplit=0, flags=0])
pattern:匹配的正則表達式。
string:待匹配的字符串。
maxsplit:分割次數,maxsplit=1分割一次,默認爲0,不限次數。
flags:標誌位,用於控制正則表達式的匹配方式,如:是否區分大小寫,多行匹配等。
import re r1=re.split('W+','This is 111 and That is 222') r2=re.split('W+','This is 111 and That is 222',maxsplit=1) r3=re.split('d+','This is 111 and That is 222') r4=re.split('d+','This is 111 and That is 222',maxsplit=1) print(r1)print(r2)print(r3)print(r4)
運行結果:
re.sub函數
re.sub函數用於替換字符串中的匹配項。
re.sub(pattern, repl, string, count=0, flags=0)
pattern:正則中的模式字符串。
repl:替換的字符串,也可爲一個函數。
string:要被查找替換的原始字符串。
count:模式匹配後替換的最大次數,默認0表示替換所有的匹配。
import re r='This is 111 and That is 222'# 刪除字符串中的數字r1=re.sub(r'd+','',r)print(r1)# 刪除非數字的字符串 r2=re.sub(r'D','',r)print(r2)
運行結果:
到此這篇關於Python常用的正則表達式處理函數詳解的文章就介紹到這了,希望大家以後多多支持好二三四!
<link rel="stylesheet" href="https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c9715bcbac9/4c8b2fbfaddf.css" type="text/css" /><link rel="stylesheet" href="https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c9715bcbac9/4c8b38b8bad702ecfe21037ca964.css" type="text/css" /><script type="text/javascript" src="https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b24b9b8d20bc1fc2f166cb7.js"></script> <script>SyntaxHighlighter.autoloader( 'applescript https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90fe9eb370e6c96732d53f9d4.js', 'actionscript3 as3 https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90fe9c874.js', 'bash shell https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90feafa340a.js', 'coldfusion cf https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90febf42b064fb0633655e7.js', 'cpp c https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90febeb37.js', 'obj-c objc https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90fe7f92d21.js', 'c# c-sharp csharp https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90febc82f037bb5.js', 'css https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90febe834.js', 'delphi pascal https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90fecfe2b1261ac.js', 'diff patch pas https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90fecf22104.js', 'erl erlang https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90fede92b0367a2.js', 'groovy https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90fefe9280d7fbc.js', 'haxe hx https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90fe0fa3f07.js', 'java https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90fe2fa3103.js', 'jfx javafx https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90fe2fa31034f9d.js', 'js jscript javascript https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90fe2c8241060b564.js', 'perl pl https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90ff8fe350e.js', 'php https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90ff8f337.js', 'text plain https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90ff8f7260b67.js', 'py python https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90ff8e2330a66ab.js', 'ruby rails ror rb https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90ffaee251b.js', 'scala https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90ffbf8260e68.js', 'sql https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90ffbea2b.js', 'vb vbnet https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90ffef9.js', 'ps powershell https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90ff8f430077b96783a56e5.js', 'xml xhtml xslt html https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90ff0f62b.js', 'go golang https://js.how234.com/559000b9bd/4c9a02a4bec20fc1fc2f0e60a2782b5ffb/4c801eb9afce149aab7550/4c8b2ea2aac90feff4.js' );</script> <script type="text/javascript"> SyntaxHighlighter.all(); </script>
-
學習雷鋒小故事,關於學習雷鋒精神的故事
1、《用心學雷鋒》一個陽光明媚的星期天,我與幾個同學一起走在回家的路上的時候無意中前面路上一個亮晶晶的像小手指大小的東西映入我的眼簾。“什麼東西呀?”我問。但沒有一個人回答我,因爲她們也看不清楚到底是什麼。走進一看,唉!原來是個小螺絲呀!還以爲啥好東...
-
用正菜造句子
造句指懂得並使用字詞,按照一定的句法規則造出字詞通順、意思完整、符合邏輯的句子。依據現代語文學科特徵,可延伸爲寫段、作文的基礎,是學生寫好作文的基本功。造句來源清俞樾《春在堂隨筆》卷八:“其用意,其造句,均以纖巧勝。”夏丏尊葉聖陶《文心雕龍》四:“造句也...
-
用源清流潔造句子
造句指懂得並使用字詞,按照一定的句法規則造出字詞通順、意思完整、符合邏輯的句子。依據現代語文學科特徵,可延伸爲寫段、作文的基礎,是學生寫好作文的基本功。造句來源清俞樾《春在堂隨筆》卷八:“其用意,其造句,均以纖巧勝。”夏丏尊葉聖陶《文心雕龍》四:“造句也...
-
小局造句
造句指懂得並使用字詞,按照一定的句法規則造出字詞通順、意思完整、符合邏輯的句子。依據現代語文學科特徵,可延伸爲寫段、作文的基礎,是學生寫好作文的基本功。造句來源清俞樾《春在堂隨筆》卷八:“其用意,其造句,均以纖巧勝。”夏丏尊葉聖陶《文心雕龍》四:“造句也...