Einstieg
Ist die E-Mail-Adresse korrekt?
Viele Internetseiten bieten die Möglichkeit zur Registrierung. Auf inf-schule.de würde so eine Seite wie hier abgebildet aussehen. Man gibt eine E-Mail-Adresse und ein Passwort ein und schon ist man registriert.
Da der Registrierungsprozess automatisiert abläuft, ist es sinnvoll, falsche E-Mail-Adressen sofort bei der Eingabe zu erkennen. Dazu muss genau definiert werden, wie eine E-Mail-Adresse aufgebaut sein muss.
Eine Möglichkeit hierfür ist die Definition über einen regulären Ausdruck. Dieser gibt ein Muster vor, nach dem alle Wörter der formalen Sprache „gültige E-Mail-Adresse” gebildet werden müssen. Mithilfe dieses Ausdrucks kann sofort geprüft werden, ob eine Benutzereingabe eine E-Mail-Adresse ist.
Da das Beispiel E-Mail sehr komplex ist, werden im folgenden Abschnitt Vereinfachungen vorgenommen. Dennoch lernst du hier alle wichtigen Aspekte von regulären Ausdrücken kennen.
Vereinfachte E-Mail-Adressen
Zur Vereinfachung sollen hier folgende Einschränkungen gelten:
- Es gibt nur noch den Buchstaben b. Das b steht also für einen beliebigen Buchstaben.
- Eine E-Mail-Adresse soll von der Form
Benutzername@Domain.Länderkennung
sein. - Der Benutzername kann mehrere mit Punkten getrennte Namensteile haben.
- Als Länderkennung sind nur de, at und ch erlaubt.
Aufgabe 1 - Der Benutzername
Hier unten siehst du Beispiele und Gegenbeispiele für erlaubte Benutzernamen bei E-Mail-Adressen. Der eingetragene reguläre Ausdruck
b definiert nur den Benutzernamen "b". Entsprechend
hat in der Liste der Beispiele auch nur die Zeile mit dem "b" ein grünes Häkchen.
- Wenn du möchtest, dass der Benutzername auch aus mehreren b's besteht, dann musst du im regulären Audruck ein "+" hinter das b schreiben: b+. Probiere es aus!
- Teste jetzt den regulären Ausdruck b+.b+. Was hat sich verändert?
- Die Zeichenfolge ".b+" soll auch wegfallen können ("bbbbb") oder häufig vorkommen können ("b.b.b.b"). Das kann man mit einem * (Stern) erreichen. Entsprechend muss der reguläre Ausdruck für den Benutzernamen insgesamt b+(.b+)* lauten. Dabei wird das ".b+" durch Klammern zu einer Elementgruppe zusammengefasst. Diese kann sich dann beliebig oft wiederholen. Probiere es aus!
Aufgabe 2 - Domain und Länderkennung
Hier findest du Beispiele und Gegenbeispiele für erlaubte Domains und Länderkennungen. Der eingetragene reguläre Ausdruck erkennt aber nur "b.de".
- Ergänze den regulären Ausdruck, damit auch längere Domains erkannt werden.
- Bei der Länderkennung muss jetzt noch eine Auswahl der Endungen "de", "at" und "ch" möglich sein. Diese Auswahl aus mehreren Möglichkeiten funktioniert so: (de|at|ch). Teste jetzt den regulären Ausdruck mit dieser Auswahl!
Aufgabe 3 - komplette vereinfachte E-Mail-Adressen
Jetzt sollte es dir möglich sein, erlaubte E-Mail-Adressen mit einem regulären Ausdruck zu definieren.
- Schreibe den kompletten regulären Ausdruck für vereinfachte E-Mail-Adressen!
- Ändere deinen regulären Ausdruck, damit auch das Beispiel mit der belgischen Adresse (.be) gültig wird.
- Ändere deinen regulären Ausdruck, damit auch das letzte Gegenbeispiel mit dem zusätzlichen Buchstaben "a" gültig wird.
Auf dieser Seite hast du fast alle wichtigen Symbole für reguläre Audrücke kennen gelernt. Auf der folgenden Seite findest du dazu eine systematische Übersicht!