conv

conv es un programa que permite hacer conversiones de formatos de ciertos caracteres especiales entre diferentes tablas de códigos (latin1, IBM437, IBM850) y HTML. Elige tu versión:

Incluyo a continuación el fichero LEEME que acompaña al programa.
MANUAL DE USO
-------------

conv es un programa que permite hacer conversiones entre distintas
formas de representar caracteres especiales (como por ejemplo las
vocales acentuadas del castellano, o la eñe). Se puede hacer
cualquier conversión entre los formatos HTML (el que se usa en las
páginas de WWW, donde, por ejemplo, una eñe se escribe como ñ),
latin1 (llamado en realidad ISO_8859-1:1987, es el que se utiliza en
Windows y en casi todas las variantes de UNIX), IBM437 e IBM850 (dos
tablas de códigos de MS-DOS; la 437 es la que usa MS-DOS por defecto, y
es la más frecuente; la 850 se usa a veces en nuestro país, y se
diferencia de la anterior en que en el lugar de algunos caracteres
gráficos se incluyen vocales mayúsculas acentuadas).

La motivación inicial de este programa fue el poder escribir cómodamente
documentos HTML, sin tener que preocuparse por los problemas que plantean
ciertos caracteres. Mediante este programa se puede escribir el texto de
forma directa, para luego convertirlo a HTML correcto. Debido a este
"origen", la conversión sólo se hace con los caracteres
áéíóúÁÉÍÓÚüÜñÑ¡¿, es decir, los que afectan directamente al idioma
castellano. En cualquier caso, resulta inmediato añadir nuevos
caracteres al programa.

El manejo del programa es muy sencillo: toma el texto original por la
entrada estándar y lo saca, ya traducido, por la salida estándar. Hay
que especificar mediante dos parámetros los formatos de entrada y salida:
conv formato-entrada formato-salida. Los formatos válidos, como ya se ha
dicho con anterioridad, son HTML, latin1, IBM437 e IBM850.


ALGUNOS EJEMPLOS
----------------

Para convertir los caracteres especiales de un texto editado con Windows
(y por tanto escrito con códigos latin1) al estándar de HTML, se puede
escribir:

conv latin1 html < pagina.txt > pagina.htm

De esa forma, por ejemplo, los signos de abrir interrogación se convierten
en '&#191;', y las letras á en '&aacute;'.

Para hacer la conversión contraria:

conv html latin1 < cosa.htm > cosa.txt

Para hacer lo mismo si el fichero inicial se escribió en MS-DOS, con la
tabla de códigos 437:

conv ibm437 html < fich.txt > fich.htm

Si tenemos un fichero escrito en UNIX (con códigos latin1) y queremos
convertir los acentos y similares al formato de MS-DOS (tabla 850),
podemos hacer:

conv latin1 ibm850 < carta.UNIX > carta.dos


NOTAS
-----

Un par de advertencias:

-La tabla de códigos IBM437 no tiene, por ejemplo, una letra A mayúscula
 acentuada. El comportamiento del programa cuando se tiene que traducir
 un carácter que no existe en la tabla de códigos de destino es no hacer
 nada. Es decir, si se traduce de HTML, quedará literalmente 'Á' 
 en el texto traducido. Si se traduce de latin1, por ejemplo, el carácter
 no se tocará, con lo cual en el texto final quedará un carácter gráfico
 "extraño".
-Si lo que se quiere hacer es traducir un texto de una tabla de códigos
 a otra (por ejemplo de latin1 a IBM437), sería mucho más recomendable
 utilizar un programa más serio, como recode, de GNU, que traduce tablas
 completas (no sólo unos pocos caracteres, como éste).


-----------------------------------------------------------------------------

Para cualquier sugerencia, puedes mandar correo electrónico a
alvaro@etsit.upm.es

(C) 1995 Alvaro Martínez Echevarría <alvaro@etsit.upm.es>

Para cualquier sugerencia, puedes mandar correo electrónico a alvaro@etsit.upm.es