PHP - Reguläre Ausdrücke
Reguläre Ausdrücke sind nichts anderes als eine Folge oder ein Muster von Zeichen. Sie bilden die Grundlage für die Funktion zur Mustererkennung.
Mit regulären Ausdrücken können Sie eine bestimmte Zeichenfolge in einer anderen Zeichenfolge suchen, eine Zeichenfolge durch eine andere Zeichenfolge ersetzen und eine Zeichenfolge in mehrere Blöcke aufteilen.
PHP bietet Funktionen, die für zwei Sätze von Funktionen für reguläre Ausdrücke spezifisch sind und jeweils einem bestimmten Typ von regulären Ausdrücken entsprechen. Sie können jeden von ihnen basierend auf Ihrem Komfort verwenden.
- POSIX Reguläre Ausdrücke
- Reguläre Ausdrücke im PERL-Stil
POSIX Reguläre Ausdrücke
Die Struktur eines regulären POSIX-Ausdrucks unterscheidet sich nicht von der eines typischen arithmetischen Ausdrucks: Verschiedene Elemente (Operatoren) werden zu komplexeren Ausdrücken kombiniert.
Der einfachste reguläre Ausdruck ist ein Ausdruck, der einem einzelnen Zeichen wie g in Zeichenfolgen wie g, feilschen oder bag entspricht.
Lassen Sie uns einige Konzepte erläutern, die im regulären POSIX-Ausdruck verwendet werden. Danach werden wir Ihnen Funktionen für reguläre Ausdrücke vorstellen.
Klammern
Klammern ([]) haben eine besondere Bedeutung, wenn sie im Zusammenhang mit regulären Ausdrücken verwendet werden. Sie werden verwendet, um eine Reihe von Zeichen zu finden.
Sr.Nr. | Ausdruck & Beschreibung |
---|---|
1 | [0-9] Es stimmt mit jeder Dezimalstelle von 0 bis 9 überein. |
2 | [a-z] Es entspricht jedem Zeichen von Kleinbuchstaben a bis Kleinbuchstaben z. |
3 | [A-Z] Es entspricht jedem Zeichen von Großbuchstaben A bis Großbuchstaben Z. |
4 | [a-Z] Es entspricht jedem Zeichen von Kleinbuchstaben a bis Großbuchstaben Z. |
Die oben gezeigten Bereiche sind allgemein; Sie können auch den Bereich [0-3] verwenden, um eine beliebige Dezimalstelle im Bereich von 0 bis 3 abzugleichen, oder den Bereich [bv], um ein beliebiges Kleinbuchstaben im Bereich von b bis v abzugleichen.
Quantifizierer
Die Häufigkeit oder Position von Zeichenfolgen in Klammern und einzelnen Zeichen kann durch ein Sonderzeichen angegeben werden. Jedes Sonderzeichen hat eine bestimmte Konnotation. Das +, *,?, {Int. range} und $ flags folgen alle einer Zeichenfolge.
Sr.Nr. | Ausdruck & Beschreibung |
---|---|
1 | p+ Es stimmt mit jeder Zeichenfolge überein, die mindestens ein p enthält. |
2 | p* Es stimmt mit jeder Zeichenfolge überein, die null oder mehr ps enthält. |
3 | p? Es stimmt mit jeder Zeichenfolge überein, die null oder ein ps enthält. |
4 | p{N}} Es stimmt mit jeder Zeichenfolge überein, die eine Folge von enthält N p's |
5 | p{2,3} Es stimmt mit jeder Zeichenfolge überein, die eine Folge von zwei oder drei Ps enthält. |
6 | p{2, } Es stimmt mit jeder Zeichenfolge überein, die eine Folge von mindestens zwei ps enthält. |
7 | p$ Es stimmt mit jedem String mit p am Ende überein. |
8 | ^p Es stimmt mit jedem String mit p am Anfang überein. |
Beispiele
Die folgenden Beispiele verdeutlichen Ihre Konzepte zu übereinstimmenden Zeichen.
Sr.Nr. | Ausdruck & Beschreibung |
---|---|
1 | [^a-zA-Z] Es stimmt mit jeder Zeichenfolge überein, die keine der Zeichen von a bis z und A bis Z enthält. |
2 | p.p Es stimmt mit jeder Zeichenfolge überein, die p enthält, gefolgt von einem beliebigen Zeichen, gefolgt von einem weiteren p. |
3 | ^.{2}$ Es stimmt mit jeder Zeichenfolge überein, die genau zwei Zeichen enthält. |
4 | <b>(.*)</b> Es stimmt mit jeder Zeichenfolge überein, die in <b> und </ b> eingeschlossen ist. |
5 | p(hp)* Es stimmt mit jeder Zeichenfolge überein, die ap enthält, gefolgt von null oder mehr Instanzen der Sequenz php. |
Vordefinierte Zeichenbereiche
Für Ihre Programmierfreundlichkeit stehen mehrere vordefinierte Zeichenbereiche zur Verfügung, die auch als Zeichenklassen bezeichnet werden. Zeichenklassen geben einen ganzen Zeichenbereich an, z. B. das Alphabet oder eine Ganzzahl.
Sr.Nr. | Ausdruck & Beschreibung |
---|---|
1 | [[:alpha:]] Es stimmt mit jeder Zeichenfolge überein, die alphabetische Zeichen aA bis zZ enthält. |
2 | [[:digit:]] Es stimmt mit jeder Zeichenfolge überein, die die Ziffern 0 bis 9 enthält. |
3 | [[:alnum:]] Es stimmt mit jeder Zeichenfolge überein, die alphanumerische Zeichen aA bis zZ und 0 bis 9 enthält. |
4 | [[:space:]] Es stimmt mit jeder Zeichenfolge überein, die ein Leerzeichen enthält. |
Regexp POSIX-Funktionen von PHP
PHP bietet derzeit sieben Funktionen zum Suchen von Zeichenfolgen mit regulären Ausdrücken im POSIX-Stil.
Sr.Nr. | Bedienungsanleitung |
---|---|
1 | ereg ()
Die Funktion ereg () durchsucht eine durch string angegebene Zeichenfolge nach einer durch pattern angegebenen Zeichenfolge und gibt true zurück, wenn das Muster gefunden wird, andernfalls false. |
2 | ereg_replace ()
Die Funktion ereg_replace () sucht nach einer durch das Muster angegebenen Zeichenfolge und ersetzt das Muster durch das Ersetzen, falls es gefunden wird. |
3 | eregi ()
Die Funktion eregi () durchsucht eine durch Muster angegebene Zeichenfolge nach einer durch Zeichenfolge angegebenen Zeichenfolge. Bei der Suche wird nicht zwischen Groß- und Kleinschreibung unterschieden. |
4 | eregi_replace ()
Die Funktion eregi_replace () funktioniert genau wie ereg_replace (), außer dass bei der Suche nach Mustern in Zeichenfolgen nicht zwischen Groß- und Kleinschreibung unterschieden wird. |
5 | Teilt()
Die Funktion split () unterteilt eine Zeichenfolge in verschiedene Elemente, wobei die Grenzen jedes Elements auf dem Auftreten eines Musters in der Zeichenfolge basieren. |
6 | spliti ()
Die Funktion spliti () funktioniert genauso wie die Funktion split (), außer dass die Groß- und Kleinschreibung nicht berücksichtigt wird. |
7 | sql_regcase ()
Die Funktion sql_regcase () kann als Dienstprogrammfunktion betrachtet werden, die jedes Zeichen in der Eingabeparameterzeichenfolge in einen Ausdruck in Klammern mit zwei Zeichen konvertiert. |
Reguläre Ausdrücke im PERL-Stil
Reguläre Ausdrücke im Perl-Stil ähneln ihren POSIX-Gegenstücken. Die POSIX-Syntax kann fast austauschbar mit den regulären Ausdrucksfunktionen im Perl-Stil verwendet werden. Tatsächlich können Sie jeden der im vorherigen POSIX-Abschnitt vorgestellten Quantifizierer verwenden.
Lassen Sie uns einige Konzepte erläutern, die in regulären PERL-Ausdrücken verwendet werden. Danach stellen wir Ihnen Funktionen für reguläre Ausdrücke vor.
Meta-Zeichen
Ein Metazeichen ist einfach ein alphabetisches Zeichen, dem ein Backslash vorangestellt ist, der der Kombination eine besondere Bedeutung verleiht.
Sie können beispielsweise mit dem Metazeichen '\ d' nach großen Geldsummen suchen: /([\d]+)000/, Hier \d sucht nach einer beliebigen Zeichenfolge mit numerischen Zeichen.
Im Folgenden finden Sie eine Liste der Metazeichen, die in regulären Ausdrücken im PERL-Stil verwendet werden können.
Character Description
. a single character
\s a whitespace character (space, tab, newline)
\S non-whitespace character
\d a digit (0-9)
\D a non-digit
\w a word character (a-z, A-Z, 0-9, _)
\W a non-word character
[aeiou] matches a single character in the given set
[^aeiou] matches a single character outside the given set
(foo|bar|baz) matches any of the alternatives specified
Modifikatoren
Es stehen verschiedene Modifikatoren zur Verfügung, die Ihnen die Arbeit mit regulären Ausdrücken erheblich erleichtern können, z. B. Groß- und Kleinschreibung, Suche in mehreren Zeilen usw.
Modifier Description
i Makes the match case insensitive
m Specifies that if the string has newline or carriage
return characters, the ^ and $ operators will now
match against a newline boundary, instead of a
string boundary
o Evaluates the expression only once
s Allows use of . to match a newline character
x Allows you to use white space in the expression for clarity
g Globally finds all matches
cg Allows a search to continue even after a global match fails
Regexp PERL-kompatible Funktionen von PHP
PHP bietet folgende Funktionen zum Suchen von Zeichenfolgen mit Perl-kompatiblen regulären Ausdrücken:
Sr.Nr. | Bedienungsanleitung |
---|---|
1 | preg_match ()
Die Funktion preg_match () durchsucht die Zeichenfolge nach dem Muster und gibt true zurück, wenn das Muster vorhanden ist, andernfalls false. |
2 | preg_match_all ()
Die Funktion preg_match_all () entspricht allen Vorkommen von Mustern in Zeichenfolgen. |
3 | preg_replace ()
Die Funktion preg_replace () funktioniert genauso wie ereg_replace (), außer dass reguläre Ausdrücke in den Eingabeparametern Muster und Ersatz verwendet werden können. |
4 | preg_split ()
Die Funktion preg_split () funktioniert genau wie split (), außer dass reguläre Ausdrücke als Eingabeparameter für Muster akzeptiert werden. |
5 | preg_grep ()
Die Funktion preg_grep () durchsucht alle Elemente von input_array und gibt alle Elemente zurück, die dem regulären Ausdrucksmuster entsprechen. |
6 | preg_ quote ()
Zitieren Sie Zeichen mit regulären Ausdrücken |