Regex für Akzente in der Internationalisierung

Die Internationalisierung schreitet vorran. Um dem gerecht zu werden, kann sich ein Entwickler mit der Validierung von Eingaben auch mit Zeichen beschäftigen. Im deutschen Alphabet kommen viele Zeichen nicht vor.

Herausforderung

Sicherlich wird es immer schwieriger, je andersartiger die Zeichen zur nativen Sprachen werden. Hier denke ich beispielsweise ans Kyrillische oder Chinesische. Aber auch einfache Prüfungen können bereits fehlschlagen, sollte man sich darüber keine Gedanken machen. Allein beim Namen “André” schlägt ein Regulärer Ausdruck fehl, der auf das deutsche Alphabet prüft.

Hier finden sich einige reguläre Ausdrücke zur Erkennung von Buchstaben mit Akzenten.

x = new RegExp("^[a-zÀ-ÿ]+$",'i');
x.test("Hallo"); // true
x.test("Hàllò"); // true
x.test("Hallo123"); // false

update für UTF-8 Probleme:

x = new RegExp("^[a-z\u00E0-\u00FC]+$",'i');

Hut - Internationalisierung

This entry was posted in JavaScript. Bookmark the permalink.

Leave a Reply

Your email address will not be published. Required fields are marked *