
Las bases de datos académicas de acceso abierto permiten un uso sin barreras. Ni siquiera necesitan de alguna forma de membresía (aunque esta siempre aporta ventajas cuando está disponible).
Vamos a presentar un grupo seleccionado de bases de datos académicas que se han ido abriendo paso en los últimos años en lo que comienza a ser un mercado bastante concurrido. Esto al menos comparado con el panorama tradicional, en el que durante décadas reinó en exclusiva Web of Science (bajo el nombre ISI), a la que después se unió Scopus para pasar a formar un duopolio de facto durante varios años.
La cuestión es que, en un contexto de ciencia abierta, estas dos bases de datos académicas, que son las más importantes del mundo, son recursos que están situados detrás de un muro de pago. Nótese que en esta entrada no estamos abogando para que estos sistemas pasen (o no) a ser abiertos. Ponemos una constatación sobre la mesa.
Por suerte, el ecosistema académico no deja de enriquecerse (y complicarse). En esta ocasión vamos a presentar un pequeño conjunto de bases de datos académicas que, además de ser de acceso abierto, pueden actuar como alternativas por un lado, de los sistemas ya mencionados y, por otro, del buscador académico por excelencia, Google Scholar.
Organización de la guía de bases de datos académicas abiertasPara presentar esta guía, usaremos: (1 ) una captura significativa de la interfaz centrada en la página de resultados; (2) los datos de identificación de cada sistema; (3) los datos estadísticos básicos disponibles en cada sistema y (4) los resultados de un test simple de resultados consistente en presentar el número de resultados para una misma consulta. El test consistió en usar como palabra clave «immersive journalism» en todas las bases de datos usando la búsqueda simple sin aplicar ningún parámetro (en algunas de las bases de datos, otras opciones no son posibles).
Utilidad teórica para revisiones de la literaturaAdemás, (5) añadiremos una apreciación de su utilidad teórica para soportar revisiones de la literatura de tipo sistematizado. Para ello, es necesario que el sistema disponga de (1) búsqueda avanzada y (2) de un sistema de filtros y ordenaciones en la página de resultados. Usaremos la escala simple habitual en análisis heurísticos, que va de 0 a 3 puntos (indicados mediante estrellas), donde:
Para apreciar otras funciones, (6) añadiremos otra apreciación sobre sus otras funcionalidades o sobre aportaciones innovadoras en otros aspectos, p.e, en el diseño de la página de resultados, los análisis presentados o la forma de presentar los documentos individuales u otras funciones específicas propias que sean destacables. Usaremos en este caso una escala Baja/Media/Alta/Muy Alta, así como añadiremos siempre un comentario al respecto. Por último, en una zona de notas añadiremos notas o comentarios específicos para cada caso.
Nota: el orden en el que se presentan las bases de datos no es significativo.
GUÍA BASES DE DATOS ACADÉMICAS DE ACCESO ABIERTO




6 · DOAJ


Había pensado en dejar a Google Scholar fuera de esta revisión porque es un recurso sumamente conocido por muy buenas razones. Por cierto, el lector interesado tiene un análisis en profundidad en una entrada dedicada a la creación de alertas con Google Scholar.
Pero creo que no está de más llevar a cabo al menos el test de la búsqueda con la palabra clave «immersive journalism». El resultado lo tenemos en la captura siguiente y lo indica con claridad: 1.870 resultados.

Cabe señalar que Google Scholar incluye una mayor variedad de fuentes que todos los sistemas considerados, ya que no se limita a publicaciones académicas en sentido estricto (artículos, capítulos de libro, patentes, etc.), sino que puede incluir informes o literatura gris, ya que no se limita a editoriales científicas, sino también repositorios, entre otros. Esto puede explicar la enorme cantidad de resultados, que habría que ver hasta qué punto son todos relevantes. Una exploración superficial hasta la página 22 (=220 resultados) mostraba que se mantenía la relevancia aparente.
Estimaciones sobre el volumen de documentos de Google Scholar y expertos en el temaTampoco está bien delimitada la cantidad de documentos que indexa en total, un dato que según tengo entendido Google nunca ha facilitado. Un estudio del 2018 (Gusenbauer, 2018) daba el resultado de 389 millones de documentos. Han pasado casi seis años desde entonces, por lo que el número solo puede ser mayor (y seguramente, muy mayor).
Lo más interesante es que el estudio del 2018 que hemos mencionado de Gusenbauer cita hasta cinco trabajos previos sobre el tema que tienen como primer autor al profesor de la Universidad Politécnica de Valencia, Orduña Malea. De este mismo autor, se hace eco también un artículo del 2014 publicado en Science sobre cómo de grande es Google Scholar.
Como el artículo cita también extensamente a Emilio Delgado Lopéz-Cózar, y ambos son colegas de universidades españolas y muy buenos amigos, me ha alegrado mucho esta circunstancia de la que me encanta dejar constancia aquí.
Alberto Martín-Martín, es otro de los grandes autores que han trabajado sobre el tema, y también aparece ampliamente citado en el trabajo de Gusenbauer.
Al final, he puesto la lista de referencias de estos tres grandes autores sobre el tema que aparecen en el trabajo porque resulta ser una compilación significativa de trabajos previos, aún recientes la mayoría, que sin duda serán útiles para los estudiosos del tema. Por último, he añadido las referencias a tres trabajos recientes de los que soy coautor.
ConclusionesPor fortuna, el panorama de las bases de datos u otros recursos de información documental similares en el ecosistema académico se está enriqueciendo desde hace años, aunque no sin pasar por períodos en los que hemos tenido pérdidas dolorosas.
Los sistemas de que hemos presentado aquí tienen la característica de ser de acceso abierto, en crudo contraste con las dos grandes bases de datos académicas dominantes, Scopus y Web of Science.
Hemos examinado estas bases de datos con algunas preguntas en mente, tales como cuál es su cobertura en numero de documentos y cuál sería su facilidad funcional para llevar a cabo una revisión de la literatura en lugar de utilizar Scopus o Web of Science. La tabla de resumen y las fichas individuales permiten responder a esas preguntas. Vemos que hay al menos dos, The Lens y Base que combinan una enorme cobertura con funcionalidades completas de búsqueda avanzada. En un hipotético caso podrían servir a los efectos que nos hemos planteado, el de una revisión de la literatura.
¿Sustituyen a Scopus y Web of Science?Un sistema puede sustituir a otro si subsume todas sus funciones y añade alguna nueva. Entonces, para poder decir alguna cosa sobre la eventualidad de que estos sistemas puedan sustituir a otros, habría que extender los análisis y comparar de manera sistemática las funciones en cada caso. Además, habría que hacer prospecciones sistemáticas sobre los documentos de cada sistema.
Personalmente, no estoy convencido de la viabilidad de esta teórica sustitución, porque tanto Scopus como Web of Science, además de una solidez funcional comparativa mayor, llevan a cabo una serie de funciones y proporcionan un conjunto de análisis que no hemos visto en los sistemas tratados aquí. Aunque es cierto que alguns de ellos, notablemente Dimensions y The Lens ofrecen otras que las bases de datos mencionadas no poseen. Esto, entonces, y al menos por el momento, nos habla más de un panorama de necesaria agregación de nuevos actores al ecosistema que de sustituciones viables.
Pero, al menos lo que si podemos decir es que en el caso de ciudadanos, investigadores o centros que por alguna razón no tengan acceso a costosos sistemas comerciales, aquí tienen recursos abiertos y alternativos de enorme calidad que pueden suplir perfectamente sus necesidades de información, más aún si consideramos a Google Scholar en este ecosistema.
Anexos: els test y las escalas no son científicasEl test que hemos aplicado a las bases de datos con la palabra clave «immersive journalism» nos aporta un dato de primera aproximación, pero carece de validez científica. Para tener validez científica tendría que haber utilizado un conjunto de palabras clave diversas (y no una sola palabra clave).
La escalas y apreciaciones utilizadas no están exentas de riesgo de sesgos por mi parte. Primero son de grano muy grueso, y segundo las he aplicado siguiendo un criterio más fenomenológico que sistemático. No obstante, he intentado aplicar lo mejor de lo que sé sobre estos sistemas, pero no se puede considerar un sistema de valoración científico.
Hay un punto, no obstante, en la escala sobre búsqueda avanzada que deja poco margen a la interpretación: si un sistema no proporciona tal tipo de búsqueda, aquí hay poco espacio para la subjetividad, literalmente, no tiene y punto. Es lo que hay.
A día de hoy sigo sorprendiéndome de que los responsables que participan en el diseño de algunas de estas bases de datos sigan creyendo que basta un cajita para meter palabras clave para tener un sistema de recuperación realmente útil para sus usuarios. Absurdo. Pero, de nuevo, es lo que hay.
Enlaces a las bases de datosEl trabajo que hemos usado para discutir sobre el tamaño de Google Scholar:
A continuación, las referencias de Orduña Malea, Martín-Martín y López-Cózar, junto con otros, obtenidas del trabajo de Gusenbauer:
Nota de progreso: Scilit ha presentado un rediseño de su base de datos, que será incorporada a estos análisis próximamente.