re【正規表現】^{3.1, 3.3, 3.4, 3.6, 3.7, 3.8}

検索フラグ 正規表現パターン 属性一覧 メソッド一覧 検索 全検索 全検索 (イテレータ) 分割 置換 キャプチャ参照 マッチ位置インデックス

メモ

正規表現操作モジュール
- 正規表現パターンを使用し、文字列の検索・置換・分割を行う
- 正規表現パターンは、通常 raw 文字列記法 を使用 ( "\\w\\\\" → r"\w\\" )
- 正規表現パターン・検索元文字列は、文字列 (str)・バイト文字列 (bytes)

モジュールコンテンツ・オブジェクト

同一の正規表現パターンで複数回処理する場合、Pattern【正規表現オブジェクト】を使用
但し、数回の使用であれば、re【正規表現モジュールコンテンツ】のキャッシュで十分

Match【マッチオブジェクト】で検索結果を処理

モジュールコンテンツ・オブジェクト	備考
re【正規表現モジュールコンテンツ】
Pattern【正規表現オブジェクト】	re.compile()【コンパイル】で返却
Match【マッチオブジェクト】	下記で返却 fullmatch()【検索 (全体一致)】 match()【検索 (先頭一致)】 search()【検索】

関連

検索フラグ・正規表現パターン

検索フラグ	備考
re.A re.ASCII	ASCII 文字限定
re.DEBUG	デバッグ情報表示
re.I re.IGNORECASE	大小文字の区別なし
re.L re.LOCALE	大小文字の区別なし (ロケール) ( バイト文字列 (bytes)のみ可 ^3.6 )
re.M re.MULTILINE	複数行検索 ( ^【先頭】・$【末尾】を各行に対応 )
re.S re.DOTALL	改行検索 ( .【改行以外の文字】を改行も対応 )
re.U re.UNICODE	Unicode 対応 (後方互換の為、冗長)
re.X re.VERBOSE	コメント対応

正規表現パターン	備考
.	改行以外の文字 ( DOTALL【改行検索】指定：改行を含む )
^	先頭 ( MULTILINE【複数行検索】指定：各行の先頭を含む )
$	末尾 ( MULTILINE【複数行検索】指定：各行の末尾を含む )
パターン_*	パターンの 0 回以上の繰り返し ( 最長一致 )
パターン_*?	パターンの 0 回以上の繰り返し ( 最短一致 )
パターン+	パターンの 1 回以上の繰り返し ( 最長一致 )
パターン+?	パターンの 1 回以上の繰り返し ( 最短一致 )
パターン?	パターンの 0 回か 1 回 ( 最長一致 )
パターン??	パターンの 0 回か 1 回 ( 最短一致 )
パターン{`m`}	パターンの `m` 回の繰り返し ( `m`：正数 )
パターン{`m`,`n`}	パターンの `m` 回～ `n` 回の繰り返し ( 最長一致 ) ( `m`・`n`：正数 / `m` または `n` は省略可能 )
パターン{`m`,`n`}?	パターンの `m` 回～ `n` 回の繰り返し ( 最短一致 ) ( `m`・`n`：正数 / `m` または `n` は省略可能 )
[文字の集合]	集合：文字の集合内の文字 ( - で範囲指定 )
[^文字の集合]	補集合：文字の集合内の文字以外
パターンA\|パターンB	パターンを区切り、どちらかのパターンと一致
(パターン)	キャプチャ (後方参照：\キャプチャ番号)
(?:パターン)	キャプチャ (後方参照不可)
(?P<キャプチャ名> パターン)	名前付きキャプチャ ( 後方参照：(?P=キャプチャ名) ・\キャプチャ番号 )
(?P=キャプチャ名)	名前付きキャプチャの後方参照 ( 名前付きキャプチャ： (?P<キャプチャ名>パターン) )
(?(キャプチャ番号 / キャプチャ名) 存在ありパターン \|存在なしパターン)	キャプチャ存在判定存在なしパターンは省略可 ( 対になった括弧のチェック等に有用 )
(?#コメント)	コメント
パターン(?=パターン (後))	肯定先読み：パターンにパターン (後) が続く
パターン(?!パターン (後))	否定先読み：パターンにパターン (後) が続かない
(?<=パターン (前))パターン	肯定後読み：パターン (前) にパターンが続く
(?<!パターン (前))パターン	否定後読み：パターン (前) でない後にパターンが続く
(?aiLmsux)	検索フラグ指定 ( 全体 ) aiLmsux の１個以上を指定 (以下に対応) ・re.A【ASCII 文字限定】・re.I【大小文字の区別なし】・re.L【大小文字の区別なし (ロケール)】・re.M【複数行検索】・re.S【改行検索】・re.U【Unicode 対応 (後方互換)】・re.X【コメント対応】
(?aiLmsux-imsx: パターン) ^3.6	検索フラグ設定・解除 ( 個別 ) 設定する aiLmsux の０個以上 - 解除する imsx の１個以上を指定 (省略可) 対応フラグ：(?aiLmsux) 参照 ( aLu 追加 ^3.7 )
\～	エスケープシーケンス (以下参照) 未定義の ASCII 文字指定はエラー ^3.6
\ooo	8進数定義 (先頭が０または３桁)
\キャプチャ番号 (1～99)	キャプチャの後方参照
\\	バックスラッシュ
\a	ビープ音 (\u0007)
\A	文字列の先頭
\b	単語の区切り ( アンダースコア(_) を含む ) ( ASCII フラグ指定：ASCII 限定 )
\B	単語の区切り以外 ( アンダースコア(_) を含まない ) ( ASCII フラグ指定：ASCII 限定 )
\d	文字列 (str)：10進数 ( ASCII フラグ指定：ASCII 限定 / [0-9] と等価 ) バイト文字列 (bytes)：10 進数 ( [0-9] と等価 )
\D	非 10 進数 (\d の逆) ( ASCII フラグ指定：ASCII 限定 / [^0-9] と等価 )
\f	改ページ (\u000C)
\n	改行 (\u000A)
\N{Unicode 文字名} ^3.8	Unicode 文字 (例：\N{COPYRIGHT SIGN} )
\r	復帰 (\u000D)
\s	文字列 (str)：空白文字 ( ASCII フラグ指定：ASCII 限定 / [ \t\n\r\f\v] と等価 ) バイト文字列 (bytes)：空白文字 ( [ \t\n\r\f\v] と等価 )
\S	空白文字以外 (\s の逆) ( ASCII フラグ指定：ASCII 限定 / [^ \t\n\r\f\v] と等価 )
\t	タブ (\u0009)
\uhhhh ^3.3	16進数定義 (16 bit) バイト文字列 (bytes)：エラー
\Uhhhhhhhh ^3.3	16進数定義 (32 bit) バイト文字列 (bytes)：エラー
\v	垂直タブ (\u000B)
\w	文字列 (str)：単語文字 ( 文字・数字・アンダースコア(_) ) ( ASCII フラグ指定：ASCII 限定 / [a-zA-Z0-9_] と等価 ) バイト文字列 (bytes)：[a-zA-Z0-9_] と等価
\W	単語文字以外 ( \w の逆 )
\xhh	16進数定義 (8 bit)
\Z	文字列の末尾

パターン：検索位置移動
パターン：検索位置移動なし

属性・メソッド・例外クラス

属性	備考
Pattern
Pattern.flags【検索フラグ】	参考：検索フラグ
Pattern.groups【キャプチャ数】
Pattern.groupindex【キャプチャ名辞書】	キャプチャ名・キャプチャ番号
Pattern.pattern【正規表現パターン】
Match
Match.endpos【検索最終位置インデックス】
Match.lastindex【最終キャプチャ番号】
Match.lastgroup【最終キャプチャ名】	不一致またはキャプチャ名が未指定：None
Match.pos【検索開始位置インデックス】
Match.re【正規表現オブジェクト】
Match.string【検索元文字列】

メソッド	re	Pattern	Match	戻り値
__getitem__()【キャプチャ参照 (添字参照)】			●	マッチ文字列
compile()【コンパイル】	●			Pattern【正規表現オブジェクト】
end()【マッチ位置インデックス (末尾)】			●	末尾のマッチ位置インデックス
escape()【特殊文字エスケープ】	●			エスケープ後の文字列
expand()【キャプチャ参照展開】			●	展開後の文字列
findall()【全検索】	●	●		検索結果リスト
finditer()【全検索 (イテレータ)】	●	●		イテレータ (Match【マッチオブジェクト】)
fullmatch()【検索 (全体一致)】	●	●		Match【マッチオブジェクト】
group()【キャプチャ参照】			●	引数０個：マッチ文字列全体引数１個：マッチ文字列引数２個以上：マッチ文字列のタプル
groupdict()【キャプチャ参照 (辞書)】			●	辞書 (キャプチャ名・キャプチャ値)
groups()【キャプチャ参照 (タプル)】			●	タプル (キャプチャ値)
match()【検索 (先頭一致)】	●	●		Match【マッチオブジェクト】
purge()【正規表現キャッシュクリア】	●			なし
search()【検索】	●	●		Match【マッチオブジェクト】
span()【マッチ位置インデックス】			●	マッチ位置インデックス (タプル：先頭・末尾)
split()【分割】	●	●		分割リスト
start()【マッチ位置インデックス (先頭)】			●	先頭のマッチ位置インデックス
sub()【置換】	●	●		置換後の文字列
subn()【置換・置換個数取得】	●	●		タプル (置換後の文字列・置換個数)

例外クラス	属性 ^3.5	備考
re.error(msg, pattern=None, pos=None)	msg	エラーメッセージ
	pattern	正規表現パターン
	pos	エラー発生位置インデックス
	lineno	pos に対応する行
	colno	pos に対応する列

compile()【コンパイル】

メモ

コンパイル
- 同一の正規表現パターンで複数回処理する場合、 コンパイルしてPattern【正規表現オブジェクト】を使用
  但し、数回の使用であれば、re【正規表現モジュールコンテンツ】のキャッシュで十分
関連
- re.compile(pattern, flags=0)

構文

re.compile(pattern, flags=0)

戻り値Pattern【正規表現オブジェクト】
pattern正規表現パターン
flags検索フラグ
例外re.error

例

import re

s1 = "The quick brown fox jumps over the lazy dog."
s2 = "THE QUICK BROWN FOX JUMPS OVER THE LAZY DOG."

pattern = re.compile(r"(\w+) (\w+)")
print(pattern.search(s1))
print(pattern.search(s2))

【出力例】
<re.Match object; span=(0, 9), match='The quick'>
<re.Match object; span=(0, 9), match='THE QUICK'>

search()【検索】・match()【検索 (先頭一致)】・fullmatch()【検索 (全体一致)】^3.4

メモ

正規表現パターンで検索
- 任意の部分が一致する検索：search()【検索】
- 先頭が一致する検索：match()【検索 (先頭一致)】
- 全体が一致する検索：fullmatch()【検索 (全体一致)】
関連

構文

re.search(pattern, string, flags=0)
re.match(pattern, string, flags=0)
re.fullmatch(pattern, string, flags=0) ^3.4

Pattern.search(string[, pos[, endpos]])
Pattern.match(string[, pos[, endpos]])
Pattern.fullmatch(string[, pos[, endpos]]) ^3.4

戻り値Match【マッチオブジェクト】 (一致無し：None)
pattern正規表現パターン
string検索元文字列
flags検索フラグ
pos検索開始位置インデックス (省略：0)
endpos検索終了位置インデックス
例外re.error

例

import re

s = "The quick brown fox jumps over the lazy dog."
print(re.search(r"\w*x\w*", s))
print(re.search(r"\w*y\w*", s))
print(re.search(r"\w*z\w*", s))
print(re.search(r"\w*@\w*", s))

pattern = re.compile(r"\w+")
match = pattern.search(s)
print(match)
match = pattern.search(s, match.end())
print(match)
match = pattern.search(s, match.end())
print(match)

【出力例】
<re.Match object; span=(16, 19), match='fox'>
<re.Match object; span=(35, 39), match='lazy'>
<re.Match object; span=(35, 39), match='lazy'>
None
<re.Match object; span=(0, 3), match='The'>
<re.Match object; span=(4, 9), match='quick'>
<re.Match object; span=(10, 15), match='brown'>

import re

s = "The quick brown fox jumps over the lazy dog."
p1 = r"\w*h\w*"
p2 = r"\w*x\w*"

print(re.match(p1, s))
print(re.match(p2, s))

pattern = re.compile(p1)
print(pattern.match(s))
pattern = re.compile(p2)
print(pattern.match(s))

【出力例】
<re.Match object; span=(0, 3), match='The'>
None
<re.Match object; span=(0, 3), match='The'>
None

import re

s = "abc_xyz"
p1 = r"a\w*z"
p2 = r"z\w*a"

print(re.fullmatch(p1, s))
print(re.fullmatch(p2, s))

pattern = re.compile(p1)
print(pattern.fullmatch(s))
pattern = re.compile(p2)
print(pattern.fullmatch(s))

【出力例】
<re.Match object; span=(0, 7), match='abc_xyz'>
None
<re.Match object; span=(0, 7), match='abc_xyz'>
None

split()【分割】

メモ

正規表現パターン部分で分割
関連
- re.split(pattern, string, maxsplit=0, flags=0)
- Pattern.split(string, maxsplit=0)

構文

re.split(pattern, string, maxsplit=0, flags=0)
Pattern.split(string, maxsplit=0)

戻り値分割リスト
pattern正規表現パターン
string分割元文字列
maxsplit最大分割数 (0：制限なし)
flags検索フラグ ^3.1
例外re.error

例

import re

s = "The quick brown fox jumps over the lazy dog."

print(re.split(" ", s))
print(re.split(" ", s, 3))

pattern = re.compile(" ")
print(pattern.split(s))
print(pattern.split(s, 3))

【出力例】
['The', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog.']
['The', 'quick', 'brown', 'fox jumps over the lazy dog.']
['The', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog.']
['The', 'quick', 'brown', 'fox jumps over the lazy dog.']

findall()【全検索】

メモ

正規表現パターンを全て検索、結果はリスト
関連
- re.findall(pattern, string, flags=0)
- Pattern.findall(string[, pos[, endpos]])

構文

re.findall(pattern, string, flags=0)
Pattern.findall(string[, pos[, endpos]])

戻り値検索結果リスト
キャプチャ２個未満：文字列のリスト
キャプチャ２個以上：キャプチャのタプルのリスト
pattern正規表現パターン
string検索元文字列
flags検索フラグ
pos検索開始位置インデックス (省略：0)
endpos検索終了位置インデックス
例外re.error

例

import re

s = "The quick brown fox jumps over the lazy dog."

print(re.findall(r"\w+", s))
print(re.findall(r"(\w+)", s))
print(re.findall(r"(\w+) (\w+)", s))

pattern = re.compile(r"\w+")
print(pattern.findall(s))
print(pattern.findall(s, 4, 19))

【出力例】
['The', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog']
['The', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog']
[('The', 'quick'), ('brown', 'fox'), ('jumps', 'over'), ('the', 'lazy')]
['The', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog']
['quick', 'brown', 'fox']

finditer()【全検索 (イテレータ)】

メモ

正規表現パターンを全て検索、結果はイテレータ
関連
- re.finditer(pattern, string, flags=0)
- Pattern.finditer(string[, pos[, endpos]])

構文

re.finditer(pattern, string, flags=0)
Pattern.finditer(string[, pos[, endpos]])

戻り値イテレータ (Match【マッチオブジェクト】)
pattern正規表現パターン
string検索元文字列
flags検索フラグ
pos検索開始位置インデックス (省略：0)
endpos検索終了位置インデックス
例外re.error

例

import re

s = "The quick brown fox jumps over the lazy dog."

print("re.finditer()")
for item in re.finditer(r"\w+", s):
    print(item)

print("pattern.finditer()")
pattern = re.compile(r"\w+")
for item in pattern.finditer(s):
    print(item)

print("pattern.finditer(, 4, 19)")
for item in pattern.finditer(s, 4, 19):
    print(item)

【出力例】
re.finditer()
<re.Match object; span=(0, 3), match='The'>
<re.Match object; span=(4, 9), match='quick'>
<re.Match object; span=(10, 15), match='brown'>
<re.Match object; span=(16, 19), match='fox'>
<re.Match object; span=(20, 25), match='jumps'>
<re.Match object; span=(26, 30), match='over'>
<re.Match object; span=(31, 34), match='the'>
<re.Match object; span=(35, 39), match='lazy'>
<re.Match object; span=(40, 43), match='dog'>
pattern.finditer()
<re.Match object; span=(0, 3), match='The'>
<re.Match object; span=(4, 9), match='quick'>
<re.Match object; span=(10, 15), match='brown'>
<re.Match object; span=(16, 19), match='fox'>
<re.Match object; span=(20, 25), match='jumps'>
<re.Match object; span=(26, 30), match='over'>
<re.Match object; span=(31, 34), match='the'>
<re.Match object; span=(35, 39), match='lazy'>
<re.Match object; span=(40, 43), match='dog'>
pattern.finditer(, 4, 19)
<re.Match object; span=(4, 9), match='quick'>
<re.Match object; span=(10, 15), match='brown'>
<re.Match object; span=(16, 19), match='fox'>

sub()【置換】・subn()【置換・置換個数取得】

メモ

正規表現パターンを使用して置換
- キャプチャの参照
  置換文字列内：\g<name>・\g<number> ・\number
  置換関数内：Match.group()【キャプチャ参照】
関連

構文

re.sub(pattern, repl, string, count=0, flags=0 ^3.1)
re.subn(pattern, repl, string, count=0, flags=0 ^3.1)

Pattern.sub(repl, string, count=0)
Pattern.subn(repl, string, count=0)

戻り値処理結果
sub()置換後の文字列
subn()タプル (置換後の文字列, 置換個数)
pattern置換パターン (正規表現パターン・Pattern【正規表現オブジェクト】)
repl置換文字列 または 置換文字列を返却する置換関数 (引数：Match【マッチオブジェクト】)
(キャプチャの参照については、メモ 参照)
string置換元文字列
count最大置換数 (0：全置換)
flags検索フラグ
例外re.error

例

import re

s = "The quick brown fox jumps over the lazy dog."
p = r"\s"
repl = " / "

print(re.sub(p, repl, s))
print(re.subn(p, repl, s, 3))

pattern = re.compile(p)
print(pattern.sub(repl, s))
print(pattern.subn(repl, s, 3))

【出力例】
The / quick / brown / fox / jumps / over / the / lazy / dog.
('The / quick / brown / fox jumps over the lazy dog.', 3)
The / quick / brown / fox / jumps / over / the / lazy / dog.
('The / quick / brown / fox jumps over the lazy dog.', 3)

import re

s = "The quick brown fox jumps over the lazy dog."
p = r"(\w+) (?P<group2>\w+) (\w+)"
repl = r"[\3 \g<group2> \g<1>]"

print(re.sub(p, repl, s))
print(re.subn(p, repl, s, 2))

pattern = re.compile(p)
print(pattern.sub(repl, s))
print(pattern.subn(repl, s, 2))

【出力例】
[brown quick The] [over jumps fox] [dog lazy the].
('[brown quick The] [over jumps fox] the lazy dog.', 2)
[brown quick The] [over jumps fox] [dog lazy the].
('[brown quick The] [over jumps fox] the lazy dog.', 2)

import re

def repl(match):
    s = match.group(0)
    return s + "(" + str(len(s)) + ")"

s = "The quick brown fox jumps over the lazy dog."
p = r"\w+"

print(re.sub(p, repl, s))
print(re.subn(p, repl, s, 3))

pattern = re.compile(p)
print(pattern.sub(repl, s))
print(pattern.subn(repl, s, 3))

【出力例】
The(3) quick(5) brown(5) fox(3) jumps(5) over(4) the(3) lazy(4) dog(3).
('The(3) quick(5) brown(5) fox jumps over the lazy dog.', 3)
The(3) quick(5) brown(5) fox(3) jumps(5) over(4) the(3) lazy(4) dog(3).
('The(3) quick(5) brown(5) fox jumps over the lazy dog.', 3)

import re

def repl(match):
    return "[" + match.group("group2") + " " + match.group(1) + "]"

s = "The quick brown fox jumps over the lazy dog."
p = r"(\w+) (?P<group2>\w+)"
pattern = re.compile(p)

print("(A)", re.sub(p, repl, s))
print("(B)", re.sub(pattern, repl, s))
print("(C)", pattern.sub(repl, s))

print("(D)", re.subn(p, repl, s, 2))
print("(E)", re.subn(pattern, repl, s, 2))
print("(F)", pattern.subn(repl, s, 2))

【出力例】
(A) [quick The] [fox brown] [over jumps] [lazy the] dog.
(B) [quick The] [fox brown] [over jumps] [lazy the] dog.
(C) [quick The] [fox brown] [over jumps] [lazy the] dog.
(D) ('[quick The] [fox brown] jumps over the lazy dog.', 2)
(E) ('[quick The] [fox brown] jumps over the lazy dog.', 2)
(F) ('[quick The] [fox brown] jumps over the lazy dog.', 2)

escape()【特殊文字エスケープ】

メモ

特殊文字のエスケープ
関連
- re.escape(pattern)

構文

re.escape(pattern)

戻り値エスケープ後の文字列
pattern文字列

例

import re

print(re.escape("()[].+*?"))

【出力例】
\(\)\[\]\.\+\*\?

purge()【正規表現キャッシュクリア】

メモ

正規表現キャッシュのクリア
関連
- re.purge()

構文

re.purge()

戻り値なし

Match.expand()【キャプチャ参照展開】^3.6

メモ

キャプチャ参照の展開
- キャプチャの参照： \g<name>・\g<number>・\number
関連

構文

Match.expand(template)

戻り値展開後の文字列
templateテンプレート文字列 (キャプチャの参照については、メモ 参照)
例外re.error

例

import re

s = "The quick brown fox jumps over the lazy dog."
match = re.search(r"(\w+) (?P<group2>\w+) (\w+) (?P<group4>\w+)", s)
print(match)
print(match.expand(r"\g<group4> \g<3> \g<group2> \1"))

【出力例】
<re.Match object; span=(0, 19), match='The quick brown fox'>
fox brown quick The

Match.getitem()【キャプチャ参照 (添字参照)】^3.6
Match.group()【キャプチャ参照】
Match.groupdict()【キャプチャ参照 (辞書)】
Match.groups()【キャプチャ参照 (タプル)】

メモ

キャプチャの参照
関連

構文

Match.__getitem__(g) ^3.6

戻り値キャプチャ値
gキャプチャ番号 または キャプチャ名
例外IndexError

Match.group([group1, ...])

戻り値
引数０個：マッチ文字列全体
引数１個：キャプチャ値
引数２個以上：キャプチャ値のタプル
groupNキャプチャ番号 または キャプチャ名
例外IndexError

Match.groupdict(default=None)

戻り値辞書 (キャプチャ名, キャプチャ値)
default一致しないキャプチャの対応値

Match.groups(default=None)

戻り値タプル (キャプチャ値)
default一致しないキャプチャの対応値

例

import re

s = "The quick brown fox jumps over the lazy dog."
match = re.search(r"(\w+) (?P<group2>\w+) (\w+) (?P<group4>\w+)", s)
print(match[0])
print(match[1])
print(match[2])
print(match[3])
print(match["group2"])
print(match["group4"])

【出力例】
The quick brown fox
The
quick
brown
quick
fox

import re

s = "The quick brown fox jumps over the lazy dog."
match = re.search(r"(\w+) (?P<group2>\w+) (\w+) (?P<group4>\w+)", s)
print(match.group(0))
print(match.group(1))
print(match.group(2))
print(match.group(3))
print(match.group("group2"))
print(match.group("group4"))
print(match.group(3, "group4"))

【出力例】
The quick brown fox
The
quick
brown
quick
fox
('brown', 'fox')

import re

s = "The quick brown fox jumps over the lazy dog."
match = re.search(r"(\w+) (?P<group2>\w+) (\w+) (?P<group4>\w+)", s)
print(match.groupdict())

match = re.search(r"(?P<group1>\w+) (?P<group2>\w+) (?P<group9>xyz\w+)?", s)
print(match.groupdict())
print(match.groupdict("EMPTY"))

【出力例】
{'group2': 'quick', 'group4': 'fox'}
{'group1': 'The', 'group2': 'quick', 'group9': None}
{'group1': 'The', 'group2': 'quick', 'group9': 'EMPTY'}

import re

s = "The quick brown fox jumps over the lazy dog."
match = re.search(r"(\w+) (?P<group2>\w+) (\w+) (?P<group4>\w+)", s)
print(match.groups())

match = re.search(r"(?P<group1>\w+) (?P<group2>\w+) (?P<group9>xyz\w+)?", s)
print(match.groups())
print(match.groups("EMPTY"))

【出力例】
('The', 'quick', 'brown', 'fox')
('The', 'quick', None)
('The', 'quick', 'EMPTY')

Match.start()【マッチ位置インデックス (先頭)】・Match.end()【マッチ位置インデックス (末尾)】・Match.span()【マッチ位置インデックス】

メモ

マッチ位置のインデックスを取得
関連

構文

Match.start([group])
Match.end([group])

戻り値先頭または末尾のマッチ位置インデックス
groupキャプチャ番号 または キャプチャ名

Match.span([group])

戻り値タプル (先頭マッチ位置インデックス, 末尾マッチ位置インデックス)
groupキャプチャ番号 または キャプチャ名 (省略 / 0：マッチ部分全体)

例

import re

s = "The quick brown fox jumps over the lazy dog."
match = re.search(r"\w*c\w*", s)
print(match)
print(match.start())
print(match.end())
print(match.span())
print()

match = re.search(r"(\w+) (?P<group2>\w+) (\w+) (?P<group4>\w+)", s)
print(match)
print(match.start())
print(match.end())
print(match.span())
print()
print(match.start(1))
print(match.end(1))
print(match.span(1))
print()
print(match.start("group4"))
print(match.end("group4"))
print(match.span("group4"))

【出力例】
<re.Match object; span=(4, 9), match='quick'>
4
9
(4, 9)

<re.Match object; span=(0, 19), match='The quick brown fox'>
0
19
(0, 19)

0
3
(0, 3)

16
19
(16, 19)

特記なし・^3.0	バージョン3.0で実装
^x.x	バージョンx.xで実装
^x.x	バージョンx.xで変更
	インデント
パスカルケース	単語の先頭を大文字とし結合 (例：PascalCase)
キャメルケース	単語の先頭を大文字とし結合、全体の先頭を小文字 (例：camelCase)
スネークケース	単語の先頭を小文字とし _ で結合 (例：snake_case)
構文：[～]	～は省略可能
構文：[～]	[と] はそのまま記述
構文：x\|y	x または y
構文： \|	\| はそのまま記述
Link	別リファレンスリンク
Link	外部リンク

re【正規表現】3.1, 3.3, 3.4, 3.6, 3.7, 3.8

メモ

検索フラグ・正規表現パターン

属性・メソッド・例外クラス

compile()【コンパイル】

メモ

構文

例

search()【検索】・match()【検索 (先頭一致)】・fullmatch()【検索 (全体一致)】3.4

メモ

構文

例

split()【分割】

メモ

構文

例

findall()【全検索】

メモ

構文

例

finditer()【全検索 (イテレータ)】

メモ

構文

例

sub()【置換】・subn()【置換・置換個数取得】

メモ

構文

例

escape()【特殊文字エスケープ】

メモ

構文

例

purge()【正規表現キャッシュ クリア】

メモ

構文

Match.expand()【キャプチャ参照展開】3.6

メモ

構文

例

Match.__getitem__()【キャプチャ参照 (添字参照)】3.6Match.group()【キャプチャ参照】Match.groupdict()【キャプチャ参照 (辞書)】Match.groups()【キャプチャ参照 (タプル)】

メモ

構文

例

Match.start()【マッチ位置インデックス (先頭)】・Match.end()【マッチ位置インデックス (末尾)】 ・Match.span()【マッチ位置インデックス】

メモ

構文

例

re【正規表現】^{3.1, 3.3, 3.4, 3.6, 3.7, 3.8}

search()【検索】・match()【検索 (先頭一致)】・fullmatch()【検索 (全体一致)】^3.4

purge()【正規表現キャッシュクリア】

Match.expand()【キャプチャ参照展開】^3.6

Match.getitem()【キャプチャ参照 (添字参照)】^3.6
Match.group()【キャプチャ参照】
Match.groupdict()【キャプチャ参照 (辞書)】
Match.groups()【キャプチャ参照 (タプル)】

Match.start()【マッチ位置インデックス (先頭)】・Match.end()【マッチ位置インデックス (末尾)】・Match.span()【マッチ位置インデックス】