Computer

English version

Online-Tool zur URL-Kodierung/Dekodierung

Auf dieser Seite können Sie eine Zeichenfolge für eine URL gemäß RFC 3986 und RFC 3629 kodieren/dekodieren.

Inhaltsverzeichnis

  1. Was versteht man unter einer URL-Kodierung?
  2. Wofür benötigt man eine URL-Kodierung?
  3. Welches Zeichen sind in einer URL erlaubt?
  4. Eine Zeichenfolge kodieren/dekodieren
  5. Weblinks

Was versteht man unter einer URL-Kodierung?

Bei einer URL-Kodierung geht es darum, bestimmte Zeichen in einer URL durch eine oder mehrere Dreiergruppen aus speziellen anderen Zeichen zu ersetzen. Die Dreiergruppen bestehen dabei aus dem Prozentzeichen "%" gefolgt von einer zweistelligen hexadezimalen Zahl. Die zweistellige Hexadezimalzahl einer oder auch mehrerer Dreiergruppen stellt bzw. stellen dann den Zahlenwert des ersetzten Zeichens dar.

Der Begriff der URL-Kodierung ist etwas ungenau. In der Sache ist die URL-Kodierung nicht auf URLs (Uniform Resource Locators) beschränkt, sondern grundsätzlich bei allen URIs (Uniform Resource Identifiers) anwendbar, so zum Beispiel auch bei URNs Uniform Resource Names). Im Englischen wird die URL-Kodierung daher auch als "percent-encoding" (etwa Prozentkodierung) bezeichnet.

Wofür benötigt man eine URL-Kodierung?

Eine URL-Kodierung benötigt man in zwei Fällen, um Informationen in einer URL darzustellen:

  1. Das Zeichen, das der darzustellenden Informationen entspricht, ist ein Zeichen, das nicht innerhalb einer URL verwendet werden darf. Zum Beispiel ist das Leerzeichen eine solches unerlaubtes Zeichen. Um es dennoch in einer URL verwenden zu können, muß man es als "%20" kodieren.
  2. Das Zeichen, das der darzustellenden Informationen entspricht, ist ein reserviertes Zeichen, das eine besondere Bedeutung hat. Wenn es notwendig ist, das Zeichen mit einer anderen Bedeutung als der reservierten Bedeutung zu verwenden, dann muß das Zeichen URL-kodiert werden. Zum Beispiel hat das reservierte Zeichen "/" die reservierte Bedeutung, ein Trennzeichen zwischen einzelnen Pfadbestandteilen zu sein. Vergleiche dazu etwa die URL des englischen Wikipedia-Artikels "Percent-encoding":

    http://en.wikipedia.org/wiki/Percent-encoding

    Soll aber nun das Zeichen "/" innerhalb eines Pfadbestandteils vorkommen, dann muß es URL-kodiert werden. Vergleiche dazu die kodierte URL für den fiktiven Wikipedia-Artikel "URL-/Percent-encoding":

    http://en.wikipedia.org/wiki/URL-%2FPercent-encoding

Welches Zeichen sind in einer URL erlaubt?

Gemäß RFC 3986 dürfen in einer URL nur die ASCII-Zeichen vorkommen, die der Gruppe der reservierten bzw. nicht-reservierten Zeichen zugeordnet wurden. Andere Zeichen sind in einer URL nicht erlaubt.

Die nicht-reservierten Zeichen können URL-kodiert werden; es wird allerdings empfohlen, sie nicht zu kodieren. Zur Gruppe der nicht-reservierten Zeichen gehören:

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
a b c d e f g h i j k l m n o p q r s t u v w x y z
0 1 2 3 4 5 6 7 8 9 - _ . ~

Die reservierten Zeichen müssen nur unter bestimmten Voraussetzungen URL-kodiert werden (siehe oben). Zur Gruppe der reservierten Zeichen gehören:

! * ' ( ) ; : @ & = + $ , / ? % # [ ]

Eine Zeichenfolge kodieren/dekodieren

RFC 3986 bestimmt nicht, nach welcher Zeichentabelle Nicht-ASCII-Zeichen kodiert werden sollen (z. B. die Umlaute ä, ö, ü). Da zur URL-Kodierung eine zweistellige Hexadezimalzahl verwendet wird und da eine zweistellige Hexadezimalzahl acht Bits entspricht, wäre es theoretisch möglich, eine der 8-Bit-Zeichentabellen zu verwenden (z. B. ISO-8859-1 bei Umlauten).

Da aber viele Sprachen eine eigene 8-Bit-Zeichentabelle haben, wäre es eine ziemlich mühselige Angelegenheit, all diese verschiedenen Zeichentabellen handhaben zu müssen. Manche Sprachen lassen sich noch nicht einmal mit einer 8-Bit-Zeichentabelle darstellen (z. B. Chinesisch). Aus diesem Grund schlägt RFC 3629 vor, Nicht-ASCII-Zeichen nach der UTF-8-Zeichentabelle darzustellen. Das folgende Tool erlaubt daher, zwischen der ASCII- und der UTF-8-Zeichentabelle zu wählen. Wird die ASCII-Zeichentabelle gewählt, dann wird auf vorhandene Nicht-ASCII-Zeichen hingewiesen.

Klartext:
URL-kodierter Text:
| | Zeichenkodierung:

Hinweis: Das Tool steht unter der GNU General Public License (GPL) und setzt aktiviertes JavaScript im Browser voraus.

Weblinks

Kommentare, Kritik, Korrekturen zu diesem Beitrag? Schreiben Sie eine E-Mail!