今回はPythonを使って、パターンにマッチする部分を置換する方法を紹介します。
これも応用がきくと思うので、一緒に覚えましょうね。
\前回の内容はこちら/
reモジュールのsub関数
Pythonでは正規表現と呼ばれる表記を使用すると、柔軟な文字置換が行えます。
正規表現を扱うためにPythonに用意されている標準モジュールがreモジュール。
任意のパターン文字列を使うことができます。
そんなreモジュールの中でも、パターンとマッチする範囲を別の文字列で置換するにはsub関数を用います。
関数:sub(pattern, repl ,string ,count=0, flags=0)
pattern:パターン repl:置換後の文字列 string:検索対象の文字列
count:置換が実行される最大回数。省略か0ですべてが実行
flags:検索条件を設定するフラグ
説明:stringに対してpatternで指定したパターンにマッチする部分をreplで指定した文字列で置換する
特殊文字の説明
sub関数では特殊文字を使います。
どのように使用するかはこちらの表を参考にしてください。
特殊文字 | 内容 |
.(ドット) | 改行以外の任意の1文字 |
^ | 文字列の先頭 |
$ | 文字列の末尾 |
* | 直前のパターンを0回繰り返す |
+ | 直前のパターンを1回以上繰り返す |
? | 直前のパターンを0回または1回繰り返す |
実際にパターンにマッチする部分を置換する
文字列「”python python python”」の行頭の「python」を「Python」に置換するには次のように示します。
import re
print(re.sub(“^python”, “Python”, “python python python”))
結果:Python python python
^を使用したので、行頭の「python」が「Python」に置換されました。
またreモジュールを使用するには、モジュールのインポートが必要!
コードの初めに「import re」と記載をしましょう。
はじめに、 「import re」 と入力することでモジュールがインポートされるよ
Pythonでパターンにマッチする部分を置換する まとめ
今回の内容をまとめておきます。
- reモジュールのインポート
コードの初めに import re を記載 - パターンにマッチする部分を置換
print(re.sub(“パターンの特殊記号 置換されたい文字”, “置換したい文字”, “検索される文字列”))
\次回の内容はこちら/
コメント