Incluyo a continuación el fichero LEEME que acompaña al programa.
MANUAL DE USO ------------- conv es un programa que permite hacer conversiones entre distintas formas de representar caracteres especiales (como por ejemplo las vocales acentuadas del castellano, o la eñe). Se puede hacer cualquier conversión entre los formatos HTML (el que se usa en las páginas de WWW, donde, por ejemplo, una eñe se escribe como ñ), latin1 (llamado en realidad ISO_8859-1:1987, es el que se utiliza en Windows y en casi todas las variantes de UNIX), IBM437 e IBM850 (dos tablas de códigos de MS-DOS; la 437 es la que usa MS-DOS por defecto, y es la más frecuente; la 850 se usa a veces en nuestro país, y se diferencia de la anterior en que en el lugar de algunos caracteres gráficos se incluyen vocales mayúsculas acentuadas). La motivación inicial de este programa fue el poder escribir cómodamente documentos HTML, sin tener que preocuparse por los problemas que plantean ciertos caracteres. Mediante este programa se puede escribir el texto de forma directa, para luego convertirlo a HTML correcto. Debido a este "origen", la conversión sólo se hace con los caracteres áéíóúÁÉÍÓÚüÜñÑ¡¿, es decir, los que afectan directamente al idioma castellano. En cualquier caso, resulta inmediato añadir nuevos caracteres al programa. El manejo del programa es muy sencillo: toma el texto original por la entrada estándar y lo saca, ya traducido, por la salida estándar. Hay que especificar mediante dos parámetros los formatos de entrada y salida: conv formato-entrada formato-salida. Los formatos válidos, como ya se ha dicho con anterioridad, son HTML, latin1, IBM437 e IBM850. ALGUNOS EJEMPLOS ---------------- Para convertir los caracteres especiales de un texto editado con Windows (y por tanto escrito con códigos latin1) al estándar de HTML, se puede escribir: conv latin1 html < pagina.txt > pagina.htm De esa forma, por ejemplo, los signos de abrir interrogación se convierten en '¿', y las letras á en 'á'. Para hacer la conversión contraria: conv html latin1 < cosa.htm > cosa.txt Para hacer lo mismo si el fichero inicial se escribió en MS-DOS, con la tabla de códigos 437: conv ibm437 html < fich.txt > fich.htm Si tenemos un fichero escrito en UNIX (con códigos latin1) y queremos convertir los acentos y similares al formato de MS-DOS (tabla 850), podemos hacer: conv latin1 ibm850 < carta.UNIX > carta.dos NOTAS ----- Un par de advertencias: -La tabla de códigos IBM437 no tiene, por ejemplo, una letra A mayúscula acentuada. El comportamiento del programa cuando se tiene que traducir un carácter que no existe en la tabla de códigos de destino es no hacer nada. Es decir, si se traduce de HTML, quedará literalmente 'Á' en el texto traducido. Si se traduce de latin1, por ejemplo, el carácter no se tocará, con lo cual en el texto final quedará un carácter gráfico "extraño". -Si lo que se quiere hacer es traducir un texto de una tabla de códigos a otra (por ejemplo de latin1 a IBM437), sería mucho más recomendable utilizar un programa más serio, como recode, de GNU, que traduce tablas completas (no sólo unos pocos caracteres, como éste). ----------------------------------------------------------------------------- Para cualquier sugerencia, puedes mandar correo electrónico a alvaro@etsit.upm.es (C) 1995 Alvaro Martínez Echevarría <alvaro@etsit.upm.es>
Para cualquier sugerencia, puedes mandar correo electrónico a alvaro@etsit.upm.es