¿Te ha gustado el artículo?
0
¿Te ha gustado el artículo?
0

IDN: direcciones web con caracteres especiales

Internet es cada vez más internacional. De acuerdo con la Unión Internacional de Telecomunicaciones (ITU), más de tres mil millones de personas utilizan hoy en día las posibilidades que brinda la red informática mundial, es decir, la World Wide Web (WWW), y cada vez es más común que estos usuarios hagan uso de ellas en su propia lengua materna. Esto es posible gracias a los nombres de dominio internacionalizados, conocidos como IDN por sus siglas en inglés, que están a disposición de los usuarios de Internet desde 2003.

¿Qué es un nombre de dominio internacionalizado (IDN)?

Hasta el año 2003, los nombres de dominio podían contener caracteres del alfabeto latino, cifras árabes de 0 a 9 y guiones (-). La razón se ha de ir a buscar al DNS o Sistema de Nombres de Dominio, que es el encargado de traducir direcciones URL y direcciones IP y que se basa en el código ASCII (American Standard Code for Information Interchange). Este hace necesario el uso de un teclado diferente en caso de cambiar al inglés y no resulta muy representativo para un proyecto internacional como lo es Internet. Para evitar esta situación, el protocolo de Nombres de dominio internacionalizados en aplicaciones (IDNA) define una traducción estandarizada del código Unicode al código ASCII. Esto posibilita el uso de los caracteres significativos de todos los sistemas de signos conocidos en los dominios internacionales.

IDNA se convierte, así, en una de las implementaciones más revolucionarias en la historia de Internet y de él pueden beneficiarse, sobre todo, aquellas personas que usan alfabetos asiáticos, africanos o árabes y que quieren crear ofertas online para la misma región lingüística. En teoría, todos los caracteres Unicode pueden usarse en nombres de dominio internacionales. En la práctica, las autoridades encargadas de los dominios regulan de manera individual cuáles son los caracteres especiales que pueden registrarse. La selección de unos u otros varía en función del dominio de nivel superior (TLD).

Consejo

¿Sabías que ya puedes conseguir un dominio por un precio muy económico con 1&1?

¿Cómo funcionan los IDNA?

Para garantizar que los nombres de dominio internacionalizados también puedan ser utilizados por los numerosos sistemas en Internet que solo soportan el conjunto de caracteres ASCII, cada IDN en Unicode puede traducirse en el formato ACE, que está basado en caracteres ASCII. De esta manera, mientras que en el navegador se mostrarán direcciones URL con diéresis, por ejemplo, el servidor las transforma de forma que sean compatibles con ASCII. Este proceso es especificado tanto en el estándar de Internet IDNA2003 como en la revisión IDNA2008, autorizada en 2010. La traducción de Unicode a ASCII se lleva a cabo por la parte del cliente (en el navegador web, en el software de correo electrónico, etc.) teniendo como base un procedimiento estandarizado de codificación que recibe el nombre de Punycode.

Punycode

El Punycode estandarizado en RFC 3492 fue desarrollado para poder representar secuencias Unicode en caracteres ASCII de manera clara y sin que se produzcan pérdidas. Para ello, todos los caracteres que no sean ASCII se eliminan del nombre de dominio, se codifican y se adjuntan separados por un guión. Esta secuencia de códigos contiene la información sobre el tipo de caracteres Unicode de que se trata, así como de su posición en el nombre del dominio. En cada ACE creado, además, se antepone el prefijo xn--, el cual señala la secuencia de caracteres de manera inequívoca como IDN, codificado de acuerdo con el protocolo IDNA y Punycode. El siguiente ejemplo arroja claridad al funcionamiento de los IDNA:

IDN: coruña-electrodomésticos.es

ACE: xn-- corua-electrodomesticos-vhc.es

Al prefijo xn--, que marca el dominio como ACE, le sigue el nombre de dominio con los caracteres no ASCII resultantes de coruña-electrodomésticos. Los caracteres especiales codificados vhc aparecen separados por un guión.

En Internet se pueden encontrar algunos conversores gratuitos como el de cyberneticos.com o el de opcion5.com para poder convertir dominios en los códigos Puny o IDN correspondientes o viceversa.

Diferencias entre IDNA2003 e IDNA2008

En sus comienzos en 2003, las direcciones URL internacionalizadas se normalizaron en el algoritmo Nameprep antes de la codificación en Punycode. Para ello, las mayúsculas se convirtieron en minúsculas, se eliminaron los caracteres de control y se uniformaron los caracteres equivalentes. Desde la aparición de la implementación IDNA2008, Nameprep ya no forma parte del proceso de traducción. IDNA, por su parte, ya no fija ninguna normalización, aunque sí recomienda la utilización de un algoritmo que transforme las mayúsculas en minúsculas.

Para poder leer un análisis detallado sobre las diferencias entre IDNA2003 e IDNA2008, puedes acceder al Unicode Technical Standard #46.

Problemas con los IDN

En la actualidad todos los programas de Internet deberían poder entender los IDN. Sin embargo, debido a que la conversión de IDNA2003 a IDNA2008 en Internet no ha podido llevarse a cabo aún de un modo consecuente, a menudo surgen problemas con los nombres internacionales. En español, uno de los problemas más frecuentes surge con uso de dominios con ñ o aquellos que incluyen términos con tildes, ya que lo más probable es que los sistemas no sepan reconocerlas y, en su lugar, la conversión dé como resultado el ejemplo expuesto en el apartado de Punycode. Esto puede ser más notable en el caso de las redes sociales o de navegadores en el extranjero, ya que la ñ, por ejemplo, no podrá escribirse en la URL. Asimismo, este problema también se extiende a los clientes de correo.

Para evitar este tipo de dificultades los administradores de páginas web pueden registrar ambas variantes y pueden redirigir el segundo dominio a la grafía que más prioridad tenga por medio de las opciones para redireccionar una página web.

TLDs Glosario Navegador