"Reguläre Ausdrücke" (Regular Expressions) ist eine Methode, um anzugeben, wie ein Wort oder eine Gruppe an Wörtern aufgebaut sein soll.
| Besondere Zeichen | |
|---|---|
| z | ein beliebiges Zeichen z |
\\ |
zum Suchen nach einem normalem \ (Backslash) |
\t |
Tabulator |
\n |
Zeilenumbruch im Unix-Format |
\r |
Zeilenumbruch im (alten, d. h. vor dem Jahr 1999) Mac-Format |
\e |
Escape |
| Vordefinierte Zeichenklassen | |
|---|---|
. |
(fast) jedes Zeichen (Einstellbar ob auch Umbrüche enthalten sind) |
\d |
eine Ziffer, also [0-9] |
\D |
ein Zeichen, das keine Ziffer ist, also [^\d] |
\s |
meist zumindest das Leerzeichen, als auch \t \n \x0B
\f \r |
\S |
ein Zeichen, das kein Whitespace ist, also [^\s] |
\w |
ein Buchstabe, eine Ziffer oder der Unterstrich, also [a-zA-Z_0-9] |
\W |
ein Zeichen, das weder Buchstabe noch Zahl noch Unterstrich ist, also [^\w] |
| Eigene Zeichenauswahl | |
|---|---|
[fng] |
f, n oder g, (Einfache Zeichenauswahl) |
[^fng] |
Alles außer f, n oder g (Negierung) |
[f-z] bzw [0-5] |
f bis z
oder F bis Z bzw. 0 bis 5 (Bindestriche sind
Indikator für einen Bereich)
|
[f-m[n-p]] |
f bis m
oder n bis p; identisch mit [f-dm-p] (Vereinigung)
|
[a-z&&[egf]] |
e, g oder f (Untermenge) |
[a-z&&[^bc]] |
a bis z,
ohne b und ohne c (Zeichenbereich mit Auschluss)
|
| Grenzbezüge | |
|---|---|
^ |
steht für den Zeilenanfang (nicht zu verwechseln mit ^ bei der Zeichenauswahl mittels [ und ]) |
$ |
kann je nach Kontext für das Zeilen- oder Zeichenketten-Ende stehen |
\b |
leere Zeichenkette am Wortanfang oder am Wortende |
\B |
leere Zeichenkette, die nicht den Anfang oder das Ende eines Wortes bildet |
\A |
steht für den beginn des Textes (wie ^) |
\Z |
steht für das Ende des Textes (wie ^) |
\z |
steht für das Ende des Textes (wie ^) |
| Quantitäten | |
|---|---|
X{min,max} |
Der voranstehende Ausdruck muss mindestens min-mal und darf maximal max-mal vorkommen |
X{n} |
Der voranstehende Ausdruck muss exakt n-mal vorkommen, also {n,n} |
X{min,} |
Der voranstehende Ausdruck muss mindestens min-mal vorkommen |
X? |
Der voranstehende Ausdruck kommt kein- oder einmal vor, er ist „optional“, also {0,1} |
X* |
Der voranstehende Ausdruck darf beliebig oft, auch keinmal, vorkommen. Dies entspricht {0,}
|
X+ |
Der voranstehende Ausdruck muss mindestens einmal vorkommen, darf aber auch mehrfach vorkommen. Dies
entspricht {1,} |
| Quantitäten (so wenig wie möglich) | |
|---|---|
*? |
0-mal oder beliebig oft (minimale Übereinstimmung). |
+? |
1-mal oder beliebig oft (minimale Übereinstimmung). |
{n,}? |
Mindestens n-mal (minimale Übereinstimmung). |
{n,m}? |
Zwischen n- und m-mal (minimale Übereinstimmung). |
| Quantitäten (so viel wie möglich) | |
|---|---|
*+ |
0-mal oder beliebig oft (maximale Übereinstimmung ohne Rückverfolgung). |
++ |
1-mal oder beliebig oft (maximale Übereinstimmung ohne Rückverfolgung). |
{n,}+ |
Mindestens n-mal (maximale Übereinstimmung ohne Rückverfolgung). |
{n,m}+ |
Zwischen n- und m-mal (maximale Übereinstimmung ohne Rückverfolgung). |
| Aneinanderreihung und Gruppierung | |
|---|---|
| AB | Direkte Abfolge: Erst Ausdruck A, dann Ausdruck B. |
A|B |
Alternative: Entweder Ausdruck A oder Ausdruck B. |
(A) |
Gruppierung mit Trefferspeicherung (für spätere Referenzierung). |
(?:A) |
Gruppierung ohne Trefferspeicherung (nur zur logischen Zusammenfassung). |