カテゴリー:
正規表現
閲覧数:560 配信日:2018-07-26 10:20
サブパターン
- | 内容 | 読み方 | 備考 |
---|---|---|---|
( ) | グループ化。括弧を使うと、グループにできる | 丸括弧 | - |
\1 \2 ... \n | 後方参照。n 番目の括弧(正規 表現 ( ) グルーピング)にマッチした文字列にマッチ | - | - |
(?: ) | 後方参照を伴わないグループ化。つまり、\1, \2 (あるいは、 $1, $2)などの対象にはならず、 単純なグループ化の用途で使用 | - | - |
具体例
1回以上のab、かつ行頭ab、かつ行末ab
print_r(preg_match("#^(ab)+$#i", "ababab")); //1回マッチ。最初にマッチした時点でpreg_match()は検索を止めるため
print_r(preg_match("#^(ab)+$#i", "ababa")); //0マッチ
後方参照
後方参照とは?
・正規表現中のある位置にマッチした文字列を、後から使い回すこと
・後方参照を行うには、後から参照したい部分パターンを予めグループ化しておく
・すると、グループ化した(括弧で括った)正規表現にマッチした部分文字列は、正規表現内でキャッシュされる
・使う時にそのグループの出現位置を指定することでそこにマッチした文字列を参照
・つまり、括弧で括ったグループは、後で使いまわせる
・具体的には、\g1とか\g2とかに割り当てられていて、正規表現中で利用可能
※gには特別な意味がある。省略は可能だが、 違うアルファベットでは意味を成さない
\g1、\g2は、O.K.
\k1、\k2は、NG
非格納グループ(非キャプチャグループ)
非格納グループとは?
・通常、グループ化すると後方参照用にキャッシュされるが、 「(?:)」を利用すると、割り当てから外れ、キャッシュされなくなる(その結果、参照されなくなる)こと
・グループはないものとして扱われる
・正規表現