![]()
|
||||||||||
|
Volver a Acentuando en la red |
|
Soluciones a los problemas de la transferencia
por Álvaro Ibáñez
Este artículo está dirigido a todas aquellas
personas que trabajan habitualmente con correo electrónico en Internet
en cualquier plataforma: Windows, Macintosh, Unix, OS/2 u otras y que sufren
lo que popularmente se conoce como "el problema de los acentos".
Se denomina así coloquialmente a los "errores" de transferencia
por correo electrónico de caracteres internacionales, denominación
que engloba las letras con tildes, la eñe, y otros signos ortográficos
y caracteres propios del español y otros idiomas distintos del inglés. Con el fin de explicar el problema y las soluciones, este artículo
está dividido en tres partes que siguen a la introducción: - La primera parte describe de forma técnica
los orígenes del problema y los formatos (ASCII, SMTP, MIME)
empleados en Internet. Es interesante para aquellas personas a las que
les gusta conocer el porqué de las cosas e indagar en el funcionamiento
del software y de Internet. - La segunda parte explica de forma práctica
cómo solucionar los problemas, con ejemplos para los programas
de correo electrónico más comunes. El lector puede dirigirse
directamente a esta parte ("La solución para comunicarse sin
problemas") si lo único que desea es saber cómo comunicarse
sin quebraderos de cabeza, configurando correctamente su software. - La tercera parte añade algunos
consejos y ejemplos prácticos adicionales: cómo saber
qué software está usando "la otra parte" para resolver
problemas y cómo dar solución a otros pequeños detalles
en la comunicación. [Nota: se puede hacer clic sobre las pantallas del artículo
para ampliarlas.] La situación que trata este artículo no es nueva: el lector
muchas veces habrá recibido mensajes de otras personas convertidos
en un galimatías, o, como respuesta a mensajes perfectamente escritos
y enviados con todos sus acentos y signos ortográficos, un "no
puedo leer nada de lo que has enviado: está lleno de basura." Ante la frustración de no recibir correctamente el correo (o enviarlo
y que no se reciba bien), mucha gente opta por escribir sin acentos y pedir
a otras personas que así lo hagan. Grave error. Esta actitud no sólo
va contra todas las reglas de la ortografía española, sino
que supone una pérdida de tiempo, comodidad y calidad en la comunicación.
Para la mayoría, es incómodo escribir sin acentos (y terrible
leer del mismo modo). Pensando en otros, basta imaginar el trabajo que supone
para un editor recibir sin acentos, eñes y otros signos ortográficos
los artículos para una revista o el texto de un libro de cientos
de páginas. Aunque a veces parezca lo contrario, el comúnmente llamado "problema
de los acentos" es una situación que ya está resuelta
por diversos estándares internacionales, al menos en sus dos facetas
más importantes: el correo electrónico y la World Wide Web. Si bien en la WWW casi nadie tiene problemas porque el estándar
HTML es muy claro en este aspecto, tanto en la publicación web como
en la lectura de páginas mediante programas navegadores, en el correo
electrónico son muchos los programas que se usan en diversas plataformas
y con distintos métodos de codificación, lo cual puede llevar
a confusión a las personas menos expertas. Como cualquiera puede suponer, para que todo funcione es necesario que
la mayoría de los usuarios de Internet, tanto los que envían
mensajes como los que los reciben, trabajen con software que admita estos
estándares. Por fortuna, el software de correo electrónico
que los acepta es cada vez más común y, en muchos casos, gratuito
para cualquier plataforma informática. Los ordenadores, y por extensión, Internet, han trabajado desde
casi sus orígenes con textos en el denominado código ASCII
(American Standard Code for Information Interchange, Código estándar
americano para el intercambio de información). El código ASCII,
como su propio nombre indica, tuvo origen americano, más concretamente
en el instituto ANSI. Al contrario de lo que mucha gente piensa, el ASCII codifica un conjunto
de caracteres (letras, números y símbolos) de sólo
128 caracteres, numerados del 0 a 127. Esto se debe a que emplea sólo
7 bits, algo que parecía suficiente en la época en que se
propuso el estándar. Mucha gente cree que el código ASCII
tiene 256 caracteres (numerados del 0 al 255, con los 8 bits que componen
un byte), pero lo cierto es que lo que se denomina "ASCII puro"
se compone de sólo 7 bits y 128 caracteres. En los 128 caracteres del código ASCII original (también
conocido como US-ASCII) se encuentran las letras del alfabeto inglés
en mayúsculas y minúsculas, los números y algunos signos
comunes (espacio en blanco, paréntesis, corchetes, suma y resta,
dólar, porcentaje, etc.) además de otros que habitualmente
sirven de control (retorno de carro, tabulador, etc.) Cuando los ordenadores se volvieron internacionales, se cayó en
la cuenta que esos 128 caracteres no eran suficientes para trabajar con
los signos de otros idiomas (tildes, signos especiales como las interrogaciones
o exclamaciones de apertura, letras como la eñe, la cedilla y otras),
de modo que los fabricantes comenzaron a usar un conjunto de caracteres
ASCII ampliado de 8 bits (256 caracteres) al que añadieron, en los
128 caracteres adicionales, todas las letras y signos especiales de uso
común en lenguas europeas, como el español. Por desgracia, en aquel momento no se siguieron estándares únicos
ni hubo una decisión clara internacional (ni la definición
de ASCII era perfecta e inmutable, como se vio más adelante). Cada
fabricante de ordenadores y software usó su propio código
pseudo-ASCII en variaciones nacionales o de sistema operativo... sin pensar
en los problemas que esto acarrearía en el futuro, por ejemplo, en
el conectado mundo de Internet. Así, en la actualidad, el "ASCII extendido" de 256 caracteres
de los PC es distinto en MS-DOS y en Windows (incluso entre Windows 95 y
Windows NT, que usa otra codificación más moderna, Unicode),
distinto a su vez del "ASCII Macintosh" y con diferencias entre
todos ellos, el ASCII Unix, el de algunos sistemas de IBM y desde luego
con otros muchos sistemas operativos antiguos y modernos. Este problema hace que al transferir mensajes de texto entre distintas
plataformas (algo muy común en Internet) en caso de usar códigos
ASCII extendidos diferentes haya un problema de legibilidad. Una letra como
la "á" en Windows puede corresponderse con "ñ"
en Macintosh, "ü" en MS-DOS o algo todavía más
ininteligible. Incluso entre ordenadores parecidos (un PC con MS-DOS y otro
con Windows) pueden surgir estos problemas. En la actualidad existen codificaciones de caracteres internacionales
mejorados, siendo los más comunes el estándar ISO 8859-1 de
8 bits, también conocido como ISO Latin-1, o el Unicode (que emplea
más bits y permite codificar caracteres adicionales de muchas más
lenguas, por ejemplo en Windows NT). En Internet, punto de unión de todo tipo de sistemas operativos,
máquinas e idiomas, un problema añadido al de los diferentes
códigos ASCII es el funcionamiento del protocolo SMTP (Simple Mail
Transfer Protocol, Protocolo de transferencia de correo sencillo). El SMTP
es la base del correo Internet y lo que "mueve" los mensajes entre
los buzones electrónicos POP3 que casi todo el mundo utiliza hoy
en día en su conexión. El SMTP se desarrolló de forma
que funcionara aceptando únicamente el código ASCII original
de 7 bits (128 caracteres), sin tener en cuenta el caótico estado
de los sistemas ASCII extendidos o las alternativas. Actualmente, el SMTP sigue aceptando como base únicamente ASCII
puro de 7 bits, por lo que si se envía correo electrónico
(texto) con letras o signos tecleables en el ordenador que estén
fuera del grupo de los 128 básicos (como letras con tildes, la eñe,
etc.) el servidor de correo simplemente se confundirá. Dependiendo
de la pasarela de correo y el servidor SMTP, en unos casos esos caracteres
se eliminarán; en el mejor de los casos se simplifican (a por á, n por ñ) haciendo que sean más o menos legibles; o,
en el peor de los casos, se transformarán de 8 a 7 bits eliminando
el último bit de forma matemática, convirtiendo un mensaje
de texto en una maraña de signos ininteligibles (è por %,
por ejemplo). En la actualidad, la comunidad informática sigue trabajado en
diversos estándares, tanto de codificación de caracteres como
de transferencia de correo, que hagan posible una comunicación transparente
entre diversos idiomas. La World Wide Web, por ejemplo, ha empleado el conjunto
ISO Latin-1 en la especificación del lenguaje HTML desde sus orígenes.
Con unas reglas claras sobre su utilización ha significado un gran
paso adelante en este sentido: la WWW es realmente universal, y muchos navegadores
aceptan incluso otras modalidades más generales que permiten conjuntos
de caracteres más especiales todavía, como las variantes usadas
en chino, hebreo y japonés. Otros estándares de cada vez de mayor implantación hacen
que en la actualidad sea posible comunicarse sin problemas independientemente
del software y la plataforma que se esté utilizando (MS-DOS, Windows,
Macintosh u otras). Como suele suceder, muchos de estas propuestas encuentran el beneplácito
de los usuarios y se hacen populares (especialmente, las de la Internet
Engineering Task Force [IETF], que desarrolla
los estándares TCP/IP para Internet), mientras que otras más
globales, como el Unicode, siguen evolucionando para proporcionar una solución
mejor y más global en el futuro. En 1991 la IETF comenzó a desarrollar la especificación
MIME (Multi-Purpose Internet Mail Extensions, Extensiones de correo Internet
multipropósito), una serie de convenciones dirigidas a que se pudieran
intercambiar a través de Internet todo tipo de archivos (texto, audio,
vídeo, etc.) de forma transparente para el usuario. Una parte importante
del MIME está dedicada a mejorar las posibilidades de la transferencias
de texto internacional por correo electrónico. Todas las extensiones MIME están especificadas desde 1993 de forma
detallada en diversos documentos oficiales disponibles en Internet (RFC
1521, 1522, 1523 y otros), y en la actualidad ningún programa de
correo electrónico o navegación puede considerarse completo
si no acepta MIME en sus diferentes facetas (texto y formatos de archivo). En lo relativo al problema de los caracteres especiales, MIME incluye
una práctica extensión de codificación denominada "quoted-printable"
(que aquí traduciremos como "código imprimible")
que codifica los caracteres según diversos conjuntos de caracteres
estándar, en ASCII puro. De este modo, un mensaje de texto en español, empleando cualquier
tipo de sistema operativo y codificación original (ASCII Macintosh,
ASCII Windows, etc.) puede ser enviado por un programa de correo en código
imprimible MIME y descodificado por otro programa en el ASCII del equipo
en el que se reciba la comunicación. Lo más normal es que
ese viaje intermedio haya sido codificado en ISO Latin-1, aunque existen
otras modalidades. El viaje codificado de un mensaje por Internet podría ser algo
así como: ASCII Mac -> Código imprimible MIME (ISO Latin-1)
-> ASCII Windows La primera parte indica la codificación en la pantalla del usuario
que envía el mensaje (en este caso, un usuario de Macintosh); la
segunda, la transformación a ASCII puro mediante código imprimible
MIME (según el conjunto de caracteres ISO Latin-1); y finalmente
la descodificación en la pantalla del receptor (un usuario de Windows
95, por ejemplo) en el ASCII extendido correspondiente. El código imprimible MIME convierte una letra de cualquier ASCII
extendido como la "é" en un código hexadecimal,
como "=E9" según un conjunto de caracteres determinado,
habitualmente, ISO Latin-1. Esto se hace tanto al enviar el mensaje como
al recibirlo, de modo que los programas de correo electrónico saben
que: a) Se está usando MIME b) Se está usando "código imprimible" (tipo
de codificación) c) Cuál es el conjunto de caracteres empleado Con estos datos, cada programa de correo se encarga de convertir el texto
desde/hacia el ASCII de la plataforma sobre la que se ejecuta el software
de correo electrónico (Windows, Mac OS, Unix, etc.) Hay otros dos detalles importantes: el primero, que además de
esta sencilla conversión hexadecimal para los caracteres especiales,
el código MIME ha de codificar también el signo "="
(igual), con lo que aparecerá en el texto del mensaje como "=3D";
el segundo, que una limitación de este código es que las líneas
del mensaje deben tener 76 caracteres como máximo. Los programas de correo que funcionan con MIME solucionan todos estos
detalles de conversión de la siguiente forma: En primer lugar, convierten todos los caracteres especiales a códigos
hexadecimales, del tipo "=E1", convirtiendo también los
signos originales "=" a "=3D". En segundo lugar, cortan las líneas del mensaje cada 76 caracteres
si es necesario, añadiendo un signo "=" al principio de
las líneas cortadas. Esto permite unirlas de nuevo en la recepción,
respetando los retornos originales. (Adicionalmente, también se
evitan los espacios en blanco al final de las líneas, convirtiéndolos
en códigos =20, dado que algunos programas de correo que no funcionan
con MIME los incluyen por otras razones). El resultado final queda pues en ASCII puro (US-ASCII) que viaja bien
a través de los buzones POP3 y los servidores de correo SMTP de plataforma
a plataforma. El ejemplo de la figura 1 lo muestra de forma práctica:
Figura 1a
Figura 1b Como puede observarse, el programa de correo codifica el texto original (figura 1a) en MIME (figura 1b), añadiendo unas cabeceras especiales sobre el sistema empleado (MIME, Content) y convirtiendo cada uno de los caracteres internacionales del cuerpo del mensaje. La figura 1b muestra lo que en realidad se envía a través de Internet, de forma transparente para el usuario, que en realidad lo está viendo en su pantalla tal y como lo ha escrito, es decir, como la figura 1a. El programa de correo que reciba el mensaje de la figura 1b sabrá que se está empleando MIME (gracias a las cabeceras, que el usuario normalmente no ve) y realizará la descodificación convenientemente, mostrando al receptor el texto original, independientemente de la plataforma, programa y sistema operativo que esté usando. Obsérvese, además, que la persona que ha enviado el primer mensaje lo ha escrito sin retornos de carro (como en los tratamientos de texto, sin pulsar retorno al final de cada línea), y que esto se respeta también en la recepción, haciendo que se pueda cortar y pegar el texto (por largo que sea) con total exactitud en otro programa (por ejemplo, un tratamiento de textos). La solución para comunicarse sin problemasComo se ha visto en la primera parte del artículo, la solución para comunicarse de forma estándar y comprensible en idiomas distintos del inglés en Internet es que ambas partes (emisor y receptor) usen un programa de correo electrónico que funcione y acepte el estándar MIME, más específicamente su variante "código imprimible" (quoted-printable). Gracias al MIME, podrá intercambiar correo sin problemas con otras personas, en cualquier idioma, y entre distintas plataformas (ej. Windows, Macintosh, Unix). Casi todos los programas de la actualidad funcionan con MIME. Algunos de los más populares son Eudora, Claris Emailer, Pegasus, Forte Agent y los módulos de correo electrónico de Netscape Navigator y Microsoft Explorer (Outlook, Exchange, MS Mail). El consejo práctico para comunicarse sin problemas puede resumirse en una frase:
No hay excusa para no emplear esta norma: MIME es un estándar aceptado por la comunidad Internet (usuarios y fabricantes de software); los programas de correo que aceptan MIME son populares y de excelente calidad y, para hacerlo más fácil todavía, en muchos casos son gratuitos (en versiones completas o reducidas). Naturalmente, si se envía un mensaje codificado con MIME (en la modalidad "código imprimible ") pero el receptor usa un software que no soporte este estándar (por anticuado o mal configurado), verá el texto con los códigos MIME en ASCII (signos como "=E1", etc.) y le resultará bastante incómodo. En este caso, solo caben dos opciones: decir al otro usuario que cambie de software o lo configure correctamente para MIME (lo más recomendable) o enviar el mensaje sin MIME... lo cual devolvería a ambos a una situación anticuada e incómoda: trabajar sin acentos y otros caracteres. Por lo tanto: asegúrese siempre de usar versiones recientes de los programas de correo electrónico (algunos de los más antiguos tal vez no acepten MIME), y también de informar a sus interlocutores, en caso de problemas, de que usen cualquier programa moderno que acepte MIME, no sólo para comunicarse con usted sino también para evitar problemas de este tipo con otras personas, dando un paso adelante en la comunicación cómoda y global a través de Internet. Situaciones en la práctica Dos programas que "hablen" MIME (como Netscape, Emailer, Eudora, Outlook, Exchange, MS Mail) deben entenderse perfectamente y convertir los acentos y otros caracteres de maravilla, siempre que estén correctamente configurados. Algunos ejemplos de configuración:
Outlook Express puede configurarse fácilmente para MIME.
Otros programas populares en entorno Windows como Pegasus o Forte Agent también funcionan con MIME, y se pueden configurar fácilmente desde sus respectivas ventanas de preferencias y configuración de correo. Sobre la conveniencia o no de usar el nuevo correo HTML, última tendencia de Internet, que permite enviar correo con estilos, gráficos y todo tipo de elementos adicionales, lea el cuadro "Correo HTML."
Consejos prácticosComo ya se ha explicado, la solución para una comunicación perfecta es usar programas que funcionen con MIME y estén correctamente configurados. Sin embargo, es normal recibir con errores mensajes de otras persona y no poder averiguar por qué, especialmente cómo están codificados (labor que realizan automáticamente los programas de correo). Si sucede esto, hay algunos trucos prácticos para saber qué está usando la otra persona (su software de correo, codificación y) y ayudarla a hacer un envío correcto. Para ello es necesario "descifrar" las cabeceras de Internet del mensaje, que normalmente están ocultas al usuario (con excepción de los campos De:, A:, CC:, Fecha: y Tema:). Según el programa que se esté usando, esto se consigue de diferentes formas: en algunos, se pueden ver al principio de mensaje, pero la mayor parte de las veces hay que seleccionar alguna opción especial:
En la cabecera, buscando con un poco de paciencia, suelen aparecer los siguientes campos:
Estos campos no siempre aparecen, pero su presencia puede servir de ayuda. Por ejemplo, para decir a la otra persona: "Veo que usas Eudora, pero que no tienes configurado correctamente el MIME. Marca el icono QP antes de mandar tus mensajes, por favor, y recibiré correctamente tus acentos, y el resto de la gente también." [Detalle: En el campo X-Mailer, Netscape Navigator suele aparecer como "Mozilla", nombre original del programa.] En caso de problemas, se puede ver si el emisor ha usado MIME o no (la ausencia del campo MIME-Version indicaría que no), y pedirle (si no lo ha hecho) que lo active para una mejor comunicación. Los campos Content funcionan de forma automática: el programa de correo con el que trabaje los entenderá. Conociendo el "charset" (juego de caracteres) empleado por la otra parte se puede cambiar, en Netscape Navigator o Internet Explorer, la conversión ASCII (o en Eudora, las tablas) para leerlo correctamente. Esto tiene utilidad no sólo para lenguas extranjeras exóticas, sino también para envíos que no usen MIME, sino un ASCII que no sea el de la plataforma con la que se está trabajando (por ejemplo, entre Windows y Macintosh). Si por alguna razón hay que enviar un mensaje a otra persona que no tenga un programa que funcione con MIME, y no pueda conseguirlo de ninguna forma, las opciones son sólo dos: enviar el texto sin acentos o usar acentos y reconfigurar el programa de correo antes de enviarlo, para que no use MIME, sino ASCII de 8 bits, esperando que el receptor tenga el mismo tipo de ordenador que el emisor. Si esto último falla, escribir sin acentos o mandar el texto como archivo vinculado (indicando el formato) es el único, e incómodo, remedio. Trucos y detallesAdemás de todo lo expuesto, hay otros detalles finales a tener en cuenta.
ConclusiónComo se ha explicado, comunicarse en español por Internet no es tan difícil: tan sólo cuestión de elegir el software adecuado y dedicar algo de tiempo a configurarlo correctamente y saber cómo funciona. Cuando el lector haya hecho esto y resuelto sus problemas, no olvide que enseñar a otros usuarios principiantes cómo hacerlo será parte de su contribución a Internet. (C) Copyright 1997. Álvaro Ibáñez (alvy@idg.es; http://bbs.seker.es/~alvy) es Director de iWorld, la revista de Internet de IDG Communications. Su próximo libro está dedicado a Internet, y será publicado por ITP/Paraninfo a principios de 1998. Este artículo ha sido publicado en el Manual Fomativo de ACTA (Asociación de Autores Científico-Técnicos) y está disponible para su consulta en Internet por cortesía de ITP/Paraninfo e iWorld, en la dirección http://www.idg.es/iworld/especial /correo.html. Prohibida su reproducción en cualquier medio sin permiso expreso por escrito.
El original de este texto y muchos otros pueden hallarse en
![]() al comienzo
|
|
| ||||