Internationalized Domain Names
Zeichen-Chaos im Netz

Allgemein

Seit Anfang März können die neuen internationalisierten Domain-Namen unter der Top-Level-Domain de registriert werden. Internet Professionell zeigt deren Vor- und Nachteile.

Umlaute und Akzente

Internationalized Domain Names

Bislang durften Zeichen in Domain-Namen lediglich aus bestimmten Zeichen des Ascii-Codes bestehen ? den 26 lateinischen Buchstaben, den zehn Ziffern sowie dem Bindestrich. Für den deutschen Sprachraum reichte dies in der Regel aus, lediglich Umlaute mussten umschrieben werden, beispielsweise »ue« statt »ü«. Seit dem ersten März ermöglicht die Denic (
www.denic.de
), Vergabestelle für Domain-Namen unter der Top-Level-Domain de, auch die Nutzung von Umlauten und Buchstaben mit diakritischen Zeichen wie Akzente.

Die neuen Domain-Namen bezeichnet man als Internationalized Domain Names, kurz IDNs, welche im RFC 3490 (
ftp://ftp.rfc-editor.org/in-notes/rfc3490.txt
), Internationalizing Domain Names in Applications (IDNA), festgelegt sind. Der Standard schließt neben den oben genannten neuen Zeichen auch andere Schriften als die lateinischen Buchstaben ein, beispielsweise griechische, kyrillische oder chinesische Buchstaben.

Welche der zahlreichen verfügbaren Zeichen tatsächlich unter einer Top-Level-Domain nutzbar sind, entscheiden die einzelnen Registrierungsstellen der jeweiligen Nation. Im Rahmen dieses Beitrags erläutern wir Ihnen die Regelung für die Top-Level-Domain de.


Neue Zeichen unter .de

Internationalized Domain Names

Die Denic hat sich für 92 zusätzliche Zeichen entschieden. Hierbei handelt es sich um Kleinbuchstaben der Unicode-Blöcke Latin-1-Supplement und Latin-Extended-A, welche nach der Normalisierung durch die Funktion Nameprep noch zur Verfügung stehen. Dazu gehören unter anderem die Umlaute »ä«, »ö« und »ü« sowie Buchstaben mit Akzenten und anderen diakritischen Zeichen. Eine Liste der neuen Zeichen finden Sie auf den Webseiten der Denic unter
www.denic.de/de/domains/idns/liste.html
. Wollte man weitere Zeichen zur Nutzung zur Verfügung stellen, vor allem solche, die nicht auf lateinischen Buchstaben basieren, wäre dies nur mit hohen Kosten zu implementieren und die damit einhergehenden Schwierigkeiten wären nicht abzuschätzen. Die Einbeziehung zusätzlicher Zeichen wird daher zurückgestellt und soll je nach Bedarf zu einem späteren Zeitpunkt schrittweise erfolgen.


Was ist mit dem ß?

Internationalized Domain Names

Manch einer wird sich sicherlich schon gefragt haben, warum das deutsche »ß« nicht nutzbar ist. Die neuen internationalisierten Domain-Namen müssen in die bisher erlaubten Zeichen konvertiert werden, bevor diese im Domain Name System (DNS) nutzbar sind. Dies geschieht in einem zweistufigen Prozess. Zuerst wird mit dem bereits oben genannten Nameprep-Verfahren die Domain normalisiert. Das Nameprep-Verfahren ist in RFC 3491 festgelegt (
ftp:// ftp.rfc-editor.org/in-notes/rfc3491.txt
). Alle Großbuchstaben werden dabei in Kleinbuchstaben umgewandet und Zeichen, die einander äquivalent sind, in eine normalisierte Form überführt. Dies betrifft auch das deutsche »ß«, welches nach den Unicode-Regeln äquivalent ist mit »ss«. Erst im zweiten Schritt werden die internationalisierten Domain-Namen in Ascii-Zeichenketten konvertiert. Da das »ß« jedoch bereits im ersten Schritt zu »ss« wurde, kann hier nicht unterschieden werden. Somit wäre im Ergebnis keine Unterscheidung zwischen den beiden Domain-Namen straße.de und strasse.de möglich.


Länge der Domain-Namen

Internationalized Domain Names

Wie bei den bisherigen Domain-Namen beträgt die Mindestlänge bei de-Domains drei Zeichen. Allerdings wurde die Maximallänge nun auf 63 Zeichen beschränkt. Dabei ist jedoch zu beachten, dass damit die Darstellung gemeint ist, in der eine Domain im Domain-Name-System abgelegt ist ? also die codierte Form, der ACE-String, Ascii Compatible Encoding.

Einem Domain-Namen lässt sich jedoch nicht ansehen, aus wie vielen Zeichen sein ACE-String besteht. So wird aus der kurzen Domain üöä.de der vergleichsweise lange Punycode xn?4ca9ar.de
. Punycode ist eine Vorschrift, die in eindeutiger Weise eine Zuordnung von Unicode-Zeichen zu Ascii-Zeichenketten beschreibt. Details hierzu finden Sie in RFC 3492 (
ftp://ftp.rfc-editor.org/in-notes/rfc 3492.txt
). Die Denic stellt auf ihren Webseiten unter
www.denic.de/de/domains/idns/ tool.jsp
ein Konvertierungsprogramm zur Verfügung. Mit diesem können Sie die Länge des gewünschten Domain-Namens überprüfen.


Keine Nameserver

Internationalized Domain Names

Die neuen erweiterten Domain-Namen können jedoch nicht für Nameserver verwendet werden. Der Grund liegt darin, dass die Einträge direkt übernommen werden und keine Übersetzung stattfindet. Daher sind für Nameserver nur Domain-Namen mit den bisherigen Ascii-Zeichen erlaubt. Dies bedeutet, dass als Nameserver die Punycode-Kodierung dns.xn?4ca9ar.de verwendet werden kann, nicht aber dns.üöä.de.


Nachteile

Internationalized Domain Names

Die erweiterten Domain-Namen bringen auf den ersten Blick eine Menge Vorteile, beispielsweise zahlreiche neue Varianten von Domain-Namen. Wie alles haben aber auch diese zwei Seiten. So hat es beispielsweise ein Amerikaner nicht leicht, wenn er eine deutsche Webseite mit einer Umlaut-Domain öffnen möchte. Zum einen kennen US-Tastaturen diese Zeichen nicht, zum anderen hat kaum jemand die entsprechenden Ascii-Codes im Kopf.

Ein ähnliches Problem stellt sich, wenn Nutzer hier zu Lande versuchen, eine Domain mit chinesischen Zeichen zu öffnen. Und dass man in Zukunft zum Surfen stets eine Ascii-Tabelle oder gar mehrere Tastaturen auf den Schreibtisch liegen haben müsste, kann kaum Sinn und Zweck der neuen IDNs sein.


Browser und IDNs

Internationalized Domain Names

Seitens der Webbrowser braucht man sich kaum Sorgen zu machen: Fast alle aktuellen Browser kommen bereits mit den neuen IDNs zurecht. Lediglich der Browser aus Redmond kennt diese noch nicht. Auch ein entsprechendes Update lässt bis dato auf sich warten. Unter der Adresse www.idnnow.com können Sie sich jedoch vom Verisign ein entsprechendes Plug-in für den Internet Explorer herunterladen.

Ein ganz anderes Problem bereiten noch entsprechende Mail-Adressen. Die meisten Mail-Clients verarbeiten die neuen Adressen noch nicht und meckern.

Hier hilft dann nur, direkt den entsprechenden Punycode anzugeben. Also müssten Anwender künftig neben der Ascii-Tabelle und mehreren Tastaturen auch gleich noch ein Konvertierungs-Tool für den Punycode bereithalten ? viele neue Hürden, die sich mit den Internationalized Domain Names auftun.


Domain-Name-System im Überblick

Internationalized Domain Names

Name statt Zahlen: Auf Grund des DNS muss sich der Surfer für den Zugriff auf Webseiten keine umständlichen Zahlenkombinationen merken. Alle Rechner in einem TCP/IP-Netz werden über eine eindeutige IP-Adresse identifiziert.

Diese 32 Bit lange Zahl ist kompliziert und anfällig für Tippfehler zugleich. Aus diesem Grund wurde vor 20 Jahren das Domain-Name-System (DNS) ins Leben gerufen. Es ermöglicht, Hosts über den zugehörigen Domain-Namen zu erreichen, etwa internet-pro.de. Das DNS kennt keine zentrale Datenbank mit der gesamten Information über die Rechner im Internet. Die Informationen werden vielmehr über Tausende von so genannten Nameservern verteilt. Das DNS ist damit eine verteilte Datenbank, deren zentrale Komponente die Nameserver sind. Sie verwalten die Mapping-Informationen, in denen die IP-Adressen und die Rechnernamen einander zugeordnet sind, auch Resource-Records (MX) genannt.

Wenn man im Webbrowser eine aufzurufende Domain eingibt, stellt der eigene Rechner eine Anfrage an einen Nameserver zur Auflösung des Domain-Namens in eine IP-Adresse. Dies geschieht mittels eines so genannten Resolvers. Dabei existiert der Resolver nicht als eigenständiges Programm. Vielmehr besteht er aus einer Bibliothek von Software-Routinen, dem Resolver-Code. Diese Bibliothek weiß, wie Anfragen über Rechner an den Nameserver formuliert werden.

Aber was passiert, wenn auf dem Nameserver die angeforderten Daten nicht verfügbar sind? Dieser muss die Anfrage dann an einen anderen Nameserver umleiten. Dabei weiß ein Nameserver nicht zwangsläufig, welcher andere Server für die Anfrage zuständig ist beziehungsweise die notwendigen Daten gespeichert hat. Es ist ausreichend, wenn jeder Nameserver weiß, wie die so genannten Root-Server kontaktiert werden. Diese kennen die Adressen aller autoritativen Nameserver für alle Second Level Domains.

Man unterscheidet zwischen zwei Abfragetypen: rekursive und iterative Namensauflösung. Der Client übermittelt in beiden Fällen den Host-Namen und legt den Abfragetyp fest. Für den Client ist es am einfachsten, eine rekursive Anfrage an einen Nameserver zu stellen. In diesem Fall ist der angesprochene Server für die komplette Namensauflösung zuständig. Er fragt der Reihe nach selbst bei allen Servern an, bis der Name vollständig aufgelöst ist. Bei der iterativen Auflösung teilt der Nameserver lediglich die Adresse des als Nächstes abzufragenden Servers mit.