¿Qué tanto se está publicando en formato XML?
- On octubre 1, 2020
- calidad editorial, Edición de revistas, editor científico, Editores, HTML, revistas científicas
Un reciente estudio realizado por Scholastica para conocer el estado de la producción (prácticas y prioridades de formato, presentación y etiquetado de metadatos de los artículos) y acceso de las revistas científicas, muestra unas cifras que llaman la atención sobre el uso de XML para la publicación de artículos[1].
Scholastica, una compañía que ofrece servicios a revistas científicas, realizó una encuesta en la que participaron 63 personas que trabajan con organizaciones académicas (sociedades académicas 41% y editoriales universitarias 30%) que publican una o más revistas y que, en su mayoría, se encuentran en Norteamérica (34.9%) y Europa (27%). En su resumen ejecutivo señala que, en relación con la producción de revistas, menos de la mitad, es decir solo un 35% de los editores encuestados informaron que producen archivos XML de texto completo adhiriéndose a la norma JATS.
Recordemos que JATS (Journal Article Tag Suite) es un estándar técnico que, bajo el formato XML, permite describir la estructura y el contenido gráfico y de texto de los artículos de una revista. Con XML se puede separar el contenido de cualquier noción de presentación. Los artículos pueden visualizarse en cualquier plataforma de manera simple y eficaz, facilitando así la visibilidad y la consulta.
Sin embargo, no son para nada alentadoras estas cifras teniendo en cuenta las ventajas que tiene el XML frente a otros formatos como PDF y HTML que, como vemos en la gráfica, parecen ser más usados (98% y 48% respectivamente) por los pocos editores que participaron. Llama también la atención que el formato e-Pub tampoco es una prioridad para los editores pese a sus ventajas en portabilidad y adaptabilidad a cualquier dispositivo de lectura.
Entre las posibles razones que se exponen en el informe para explicar esas cifras de uso de XML están, en primer lugar, la falta de recursos técnicos para la conversión de los artículos que tradicionalmente se diseñan para publicar en PDF. En segundo lugar, a pesar de no incluir preguntas sobre las disciplinas de las revistas, según Scholastica, es posible que el bajo uso se deba a, como lo indica un Informe STM de 2018, el XML es más común en disciplinas STEM[2]. Sin embargo, creo que no hay que perder de vista que, formatos como PDF y HTML, tienen también sus ventajas que los convierten en una prioridad para los editores, algo que ya se ha tratado en otro artículo de este blog.
Otra pregunta realizada a los editores tenía como objetivo determinar la forma en que los editores asignan el trabajo de producción y el número de partes involucradas.
Según Scholástica, las respuestas sugieren que la producción de artículos es un proceso disperso para muchos editores y que estos están creando diferentes tipos de archivos por separado, en lugar de generar múltiples archivos a partir de un único formato digital (por ejemplo, XML) (p. 11). Creo que esto último es una realidad en muchas revistas latinoamericanas. La producción de formatos PDF sigue siendo prioridad para muchos editores incluyendo aquellos que utilizan sistemas como Marcalyc. Implementar procesos de publicación que partan de formatos XML para obtener el resto (PDF, HTML y ePub) ha sido verdaderamente lento, tal vez por las limitaciones técnicas, la poca capacitación, falta de interés, desconocimiento de sus ventajas o imposibilidad de que los editores se encarguen también de esta labor.
Es interesante que en el mismo estudio de Scholastica también se les pregunte a los editores por la importancia que tendrían los distintos formatos de publicación para los lectores. En la gráfica se puede ver la gran diferencia entre los que consideran que es “muy importante” el PDF (73%) y los que consideran “muy importante” (22%) el uso de XML. También dicen mucho las respuestas “sin importancia”, “algo sin importancia” y “neutral” que suman el 64% de los editores participantes. Según Scholastica, no estaría claro por qué los editores encuestados tenían opiniones encontradas sobre la importancia del XML para los lectores. Sin embargo, señala que podrían estar mostrando que la mayoría de los lectores no interactúan directamente con el XML (el cual solo es usado por los estudiosos de la minería de datos), o que los lectores no se dan cuenta de los beneficios indirectos de XML (p. 14).
Cuando se les preguntó a los editores “En una escala del 1 al 5, en los próximos 3 años, ¿qué importancia cree que tendrán los siguientes formatos para alcanzar los objetivos de su plan de publicación?”, las respuestas no variaron mucho. El PDF y el HTML son los formatos preferidos para alcanzar los objetivos de publicación de la revista. También surgieron respuestas relacionadas con el uso de versiones impresas para envío a lectores que lo soliciten y a suscriptores para cumplir con los objetivos de la publicación (p. 15).
Aunque los resultados de este estudio no pueden dar cuenta de la realidad del uso del XML en las revistas científicas ni se puede usar para exponer diagnósticos pesimistas, es importante tenerlo en cuenta para insistir a los editores sobre la necesidad de implementar no solo el uso del XML sino todo un proceso editorial que permita, a través de éste, obtener los formatos restantes como PDF, HTML y ePub tal como lo ejemplifica Redalyc en su manual de modelo de publicación.
Al publicar versiones XML-JATS de los artículos de su revista, obtendrá ventajas como:
-
Mayor visibilidad de cada artículo publicado en la web.
-
Fácil indización y recuperación del texto completo de un documento.
-
Generación automática de diversos formatos de salida (HTML, PDF, ePUB).
-
Archivos listos para la impresión con el formato de la revista.
-
Garantía en la preservación digital.
-
Posibilidad del aprovechamiento de visores y lectores multiplataforma.
-
Retomar el control del proceso y de los productos editoriales.
Si no puede ser realizada esta labor por miembros del equipo editorial capacitado, bien puede contratarse con un tercero que asegure la calidad de las publicaciones. Journals & Authors puede ayudarle con la asesoría necesaria para que implemente un ágil proceso de producción desde XML-JATS o continúe publicando sus artículos en varios formatos en su Open Journal Systems y enviarlos a bases como Redalyc, SciELO y PubMed.
Nuestro servicio de construcción de versiones XML-JATS de los artículos de su revista consta de:
-
Adaptación de los archivos HTML/DOC a la metodología JATS.
-
Conversión de los archivos PDF a HTML/DOC según especificaciones Redalyc/SciELO/PubMed.
-
Tratamiento adecuado de las imágenes, gráficas, mapas y ecuaciones de cada artículo.
-
Marcación de artículos bajo la metodología XML-JATS.
-
Control de calidad de cada uno de los artículos de acuerdo a los programas de generación de XML.
-
Envío de los artículos marcados compatibles para las bases de datos: SciELO, Redalyc y PubMed.
-
Entrega de observaciones a los editores sobre errores en los artículos identificados en el proceso de marcación.
Notas al pie
[1] Scholastica (2020). The State of Journal Production and Access 2020. Report on survey of society and
university publishers. https://doi.org/10.5061/dryad.cz8w9gj1r
[2] STM (2018). The STM Report An overview of scientific and scholarly publishing. https://www.stm-assoc.org/2018_10_04_STM_Report_2018.pdf
Referencias
Redalyc (2016). Modelo de publicación ALyC. XML JATS. Redalyc. p. 5. https://blogredalyc.files.wordpress.com/2016/08/redalycnuevomodelopublicacion2016-1.pdf
Juan Felipe Vargas. Socio fundador de Journals & Authors. Ingeniero de Sistemas, Especialista en Alta Gerencia. Correo electrónico: juanvargas@jasolutions.com.co
Otros artículos de interés en este blog
¿Qué tareas de la gestión editorial se deben o no tercerizar?
Errores frecuentes que dificultan la creación de versiones XML JATS de los artículos científicos