Problemas en la importación de registros, cambios en LC

8 views
Skip to first unread message

Fernando Gómez

unread,
Nov 12, 2005, 2:58:44 PM11/12/05
to Catalis
Esta noticia es de interés para quienes importen en Catalis registros
MARC del catálogo de LC.

Quizás hayan notado que durante los últimos días hubo algunos
problemas en el funcionamiento de ese catálogo, que eran debidos a las
tareas de actualización del sistema, que ahora trabaja con Unicode
(http://en.wikipedia.org/wiki/Unicode). Lamento informarles que este
cambio ha producido efectos colaterales no deseados.

Ante todo, deben notar que hubo un rediseño del formulario que se usa
para solicitar el registro MARC: aparece un menú con 4 opciones, dos
de las cuales corresponden a MARC:

MARC (non-Unicode/MARC-8)
MARC (Unicode/UTF-8)

¿Y cuál elegimos? Como en Catalis no estamos trabajando con Unicode,
parece que debiéramos elegir la primera opción. Y en efecto todo va
bien con la 1ª opción (y con la 2ª también, en realidad), siempre y
cuando los registros se limiten a utilizar los caracteres
"inofensivos", es decir, nada de acentos ni símbolos fuera del ASCII
básico (0-127). Si necesitamos catalogar material en inglés, gran
parte del tiempo no encontraremos problemas.

Los caracteres acentuados, y algunos símbolos, hasta ahora se venían
importando correctamente con Catalis debido a que LC no los estaba
entregando como MARC-8, sino como latin1; de esa manera no era
necesario realizar ninguna conversión durante la importación y todo
andaba bien. Pero ahora que han quitado la opción de exportar como
latin1, tenemos problemas tanto si pedimos MARC-8 como si pedimos
Unicode/UTF-8. Se presentan entonces las siguientes alternativas:

#1. solicitar a LC que restablezcan la opción de bajar registros en
latin1
#2. implementar en Catalis la conversión de MARC-8 a latin1 durante la
importación
#3. modificar Catalis para que trabaje con Unicode

Creo que voy a comenzar por la #1, escribiendo un mensaje a LC.

La #2 es una vieja deuda, dado que MARC-8 es la codificación "oficial"
para los registros MARC, y así es como los entregan otras fuentes de
registros que no sean LC, y por lo tanto Catalis debiera ser capaz de
aceptar MARC-8.

Finalmente, la #3 parece ser la más saludable a largo plazo, pues
dicen que el mundo está yendo hacia Unicode, pero en este momento no
tengo en claro cómo convertir a Catalis en una aplicación
Unicode-compatible.

En conclusión, les comunico que mientras demos con una solución
satisfactoria para este problema, deberán prestar atención y revisar
cuidadosamente el contenido de los registros importados cada vez que
éstos contengan caracteres acentuados y símbolos. Pero qué estoy
diciendo... por supuesto que ustedes siempre revisan cuidadosamente
cada registro, verdad? :-)

Saludos.

--Fernando

Horacio Degiorgi

unread,
Nov 12, 2005, 3:44:38 PM11/12/05
to cat...@googlegroups.com
es posible la tercera opcion ? wxis funciona con unicode ? una de
las grandes críticas al formato actual de las bases ISIS es justamente
la imposiblidad de guardar unicode en el maestro-

Horaciod


El 12/11/05, Fernando Gómez<fjg...@gmail.com> escribió:
--
Horacio Degiorgi
http://blog.codigophp.com
Mendoza - Argentina

Fernando Gómez

unread,
Nov 12, 2005, 4:28:11 PM11/12/05
to cat...@googlegroups.com
Horacio Degiorgi escribió:

> es posible la tercera opcion ? wxis funciona con unicode ? una de
> las grandes críticas al formato actual de las bases ISIS es justamente
> la imposiblidad de guardar unicode en el maestro-

Cuando mencioné la posibilidad de llevar Catalis a Unicode estaba
pensando en Malete, no en wxis. Malete funciona con Unicode; queda por
delante el laburo de hacer que Catalis funcione con Malete + PHP
(interesante tarea, si no fuera que aún tengo un par de miles de
libros para catalogar...)


--
Fernando

Fernando Gómez

unread,
Nov 13, 2005, 7:52:49 PM11/13/05
to Catalis
Decidí empezar por la opción #2 de mi lista. Modifiqué el archivo
import.js para que realice la conversión ANSEL -> Latin-1, y ya lo
pueden bajar desde aquí:


http://inmabb.criba.edu.ar/catalis/dl/correcciones/import-ansel.js.zip

Al descomprimirlo, renómbrenlo como "import.js" y ubíquenlo en

DOCUMENT_ROOT/catalis_pack/catalis/js/

(es decir, allí mismo donde está el import.js original, el cual se
recomienda preservar por si hace falta).

ADVERTENCIA 1: para que esta conversión funcione, deben seleccionar la
opción

MARC (non-Unicode/MARC-8)

cuando bajen registros de LC.

ADVERTENCIA 2: Esta es una solución como para salir del apuro, en caso
de que alguien necesite seguir trabajando con registros de LC (como es
mi caso). Con esta modificación, Catalis aplicará la conversión de
prepo a cualquier registro que se importe, y eso naturalmente traerá
problemas si se llega a importar registros que ya vienen codificados en
Latin-1. Para solucionar esto, pienso añadir luego un menú, en la
ventana de importación, para que el catalogador indique de dónde
proviene el registro, y así aplicar la conversión sólo cuando sea
necesaria. Mientras tanto, avisen en qué casos se van presentando
problemas.

Si algo no ha quedado claro o tienen sugerencias, por favor escriban.
Saludos.

--Fernando

Reply all
Reply to author
Forward
0 new messages