Tcl-正規表現
「regexp」コマンドは、Tclの正規表現と一致させるために使用されます。正規表現は、検索パターンを含む文字のシーケンスです。これは複数のルールで構成されており、次の表でこれらのルールと対応する使用法について説明します。
シニア番号 | ルールと説明 |
---|---|
1 | x 完全に一致。 |
2 | [a-z] azからの小文字。 |
3 | . 任意の文字。 |
4 | ^ 開始文字列は一致する必要があります。 |
5 | $ 終了文字列は一致する必要があります。 |
6 | \^ 特殊文字に一致するバックラッシュシーケンス^。同様に、他の文字にも使用できます。 |
7 | () 上記のシーケンスを括弧内に追加して、正規表現を作成します。 |
8 | x* 前のxの0回以上の出現と一致する必要があります。 |
9 | x+ 前のxの1つ以上のオカレンスと一致する必要があります。 |
10 | [a-z]? 前のxの0または1回の出現と一致する必要があります。 |
11 | {digit} 以前の正規表現の数字の出現に正確に一致します。0〜9を含む数字。 |
12 | {digit,} 前の正規表現の3桁以上のオカレンスに一致します。0〜9を含む数字。 |
13 | {digit1,digit2} オカレンスは、前の正規表現のディジット1とディジット2のオカレンス間の範囲と一致します。 |
構文
正規表現の構文を以下に示します-
regexp optionalSwitches patterns searchString fullMatch subMatch1 ... subMatchn
ここでは、正規表現がコマンドです。オプションのスイッチについては後で説明します。パターンは前述のルールです。検索文字列は、正規表現が実行される実際の文字列です。完全一致とは、一致した正規表現の結果を保持する変数です。Submatch1からSubMatchnは、サブマッチパターンの結果を保持するオプションのsubMatch変数です。
複雑な例に飛び込む前に、いくつかの簡単な例を見てみましょう。アルファベットを含む文字列の簡単な例。他の文字が正規表現に遭遇すると、検索は停止されて返されます。
#!/usr/bin/tclsh
regexp {([A-Za-z]*)} "Tcl Tutorial" a b
puts "Full Match: $a"
puts "Sub Match1: $b"
上記のコードを実行すると、次の結果が得られます。
Full Match: Tcl
Sub Match1: Tcl
複数のパターン
次の例は、複数のパターンを検索する方法を示しています。これは、任意のアルファベット、任意の文字、任意のアルファベットのパターンの例です。
#!/usr/bin/tclsh
regexp {([A-Za-z]*).([A-Za-z]*)} "Tcl Tutorial" a b c
puts "Full Match: $a"
puts "Sub Match1: $b"
puts "Sub Match2: $c"
上記のコードを実行すると、次の結果が得られます。
Full Match: Tcl Tutorial
Sub Match1: Tcl
Sub Match2: Tutorial
サブパターンに複数のパターンを含めることができることを示すための上記のコードの修正バージョンを以下に示します-
#!/usr/bin/tclsh
regexp {([A-Za-z]*.([A-Za-z]*))} "Tcl Tutorial" a b c
puts "Full Match: $a"
puts "Sub Match1: $b"
puts "Sub Match2: $c"
上記のコードを実行すると、次の結果が得られます。
Full Match: Tcl Tutorial
Sub Match1: Tcl Tutorial
Sub Match2: Tutorial
正規表現コマンドのスイッチ
Tclで利用可能なスイッチのリストは次のとおりです。
nocase −大文字と小文字を区別するために使用されます。
indices −一致した文字ではなく、一致したサブパターンの場所を保存します。
line−改行センシティブマッチング。改行の後の文字を無視します。
start index −検索パターンの開始のオフセットを設定します。
スイッチの終わりを示します
上記の例では、すべてのアルファベットに意図的に[AZ、az]を使用しています。以下に示すように、-nocaseを簡単に使用できます。
#!/usr/bin/tclsh
regexp -nocase {([A-Z]*.([A-Z]*))} "Tcl Tutorial" a b c
puts "Full Match: $a"
puts "Sub Match1: $b"
puts "Sub Match2: $c"
上記のコードを実行すると、次の結果が得られます。
Full Match: Tcl Tutorial
Sub Match1: Tcl Tutorial
Sub Match2: Tutorial
スイッチを使用した別の例を以下に示します-
#!/usr/bin/tclsh
regexp -nocase -line -- {([A-Z]*.([A-Z]*))} "Tcl \nTutorial" a b
puts "Full Match: $a"
puts "Sub Match1: $b"
regexp -nocase -start 4 -line -- {([A-Z]*.([A-Z]*))} "Tcl \nTutorial" a b
puts "Full Match: $a"
puts "Sub Match1: $b"
上記のコードを実行すると、次の結果が得られます。
Full Match: Tcl
Sub Match1: Tcl
Full Match: Tutorial
Sub Match1: Tutorial