Aproximadamente 1,000 de las 15,000 revistas de ciencias de acceso abierto parecen existir principalmente para retirar tarifas de académicos ingenuos.
Un trío de informáticos de la Universidad de Colorado en Boulder, la Universidad de Syracuse y el Instituto de Tecnología del Este de China (EIT) han llegado después de haber identificado revistas “sospechosas” y construidas clacias de aprendizaje automático para realizar revisiones humanas de los resultados.
Existe una revista sospechosa para publicar trabajos en publicaciones que violen las mejores prácticas y tengan bajos estándares de edición, principalmente para compartir académicos y no proporcionan revisiones editoriales anticipadas.
Como se detalla en un trabajo de investigación publicado en Science Advances, “Estimando la previsibilidad de las revistas sospechosas de acceso abierto”, las revistas científicas antes de la década de 1990 tienden a estar cerradas y solo están disponibles a través de suscripciones de pago institucionales.
El movimiento de acceso abierto ha cambiado ese cambio dinámico. Se remonta a la década de 1990 a medida que el movimiento del software libre ganó impulso a medida que los investigadores intentaron expandir la disponibilidad de la investigación académica. Sin embargo, un resultado de esa transición fue que los costos asociados con la revisión y publicación de pares han cambiado de organizaciones de suscripción a autores.
“El movimiento de acceso abierto se estableció para corregir esta falta de accesibilidad cambiando el modelo de pago”, explica el documento. “En lugares de acceso abierto, los autores les pedirán que se suscriban a universidades y bibliotecas, y les pedirán que paguen directamente, en lugar de permitir a los científicos retener los derechos de autor”.
La publicación científica de acceso abierto ahora es ampliamente aceptada. Por ejemplo, un memorándum de 2022 de la Política de la Oficina de Ciencia y Tecnología de la Casa Blanca ordenó a las agencias estadounidenses que planearan publicar investigaciones de apoyo a los contribuyentes a fines de 2025.
Sin embargo, el cambio hacia el acceso abierto ha llevado a un aumento en las cuestionables publicaciones científicas. Durante más de una década, los investigadores han expresado preocupaciones sobre las revistas depredadoras y secuestradas (PDF).
El autor elogia a la bibliotecaria de la Universidad de Colorado Jeffrey Bielle en 2009 por dudar de una revista que le da el término “población” de los autores sin servicios de revisión editorial. Todavía se pueden encontrar versiones archivadas de la lista de revistas potencialmente depredadoras y editores de Bealls. El problema con un enfoque basado en listas es que las revistas de fraude pueden cambiar fácilmente los nombres y sitios web.
A la luz de estos problemas, Daniel Acknya (UC Boulder), Han Zuan (EIT) y Lizheng Liang (Syracuse) están tratando de ver si los modelos de IA pueden ayudar a separar publicaciones legales de publicaciones sospechosas, como los autores que con frecuencia citan su trabajo.
“La ciencia avanza en el trabajo de los demás”, dijo Aknya a The Registro por correo electrónico. “La mala ciencia está contaminada con hallazgos que no pueden usar paisajes científicos. Como las revistas sospechosas publican casi cualquier cosa, la ciencia que tienen no es confiable.
“Lo que quiero lograr es ayudar a deshacerse de esta mala ciencia ayudando activamente a marcar revistas sospechosas.
Acuña también es el fundador de Reviewerzero AI, un servicio que emplea a la IA para detectar problemas de integridad de la investigación.
Después de derrotar conjuntos de datos de casi 200,000 revistas de acceso abierto, tres informáticos se decidieron por un conjunto de 15,191.
Entrenaron al modelo clasificador para identificar revistas sospechosas y cuando lo ejecutaron en un conjunto de 15,191, el modelo marcó 1,437 títulos. Sin embargo, el modelo se perdió aproximadamente una cuarta parte del tiempo, basado en revisiones humanas posteriores.
“Se espera que alrededor de 1.092 personas sean realmente sospechosas, ~ 345 son falsos positivos (24% de los conjuntos marcados) y ~ 1.782 revistas problemáticas permanecen sin ser detectadas (negación falsa)”, dice el documento.
“En un nivel más amplio, podemos adaptar nuestras técnicas”, dijo Acuña. “Si a menudo le preocupa los falsos positivos, puede marcarlos más estrictos”. Señaló un pasaje en el papel que, bajo un entorno más estricto, solo se esperaban cinco falsas alarmas de 240.
Acuña agregó, mientras que muchas aplicaciones de IA hoy apuntan a la automatización completa: “La IA aún no está allí para los problemas delicados que estamos considerando aquí, pero será muy útil”.
El autor no está preparado para nombrar y avergonzar revistas sospechosas. Hacerlo podría conducir a desafíos legales.
“Queremos trabajar con los servicios de índices para apoyar a los editores acreditados que están preocupados por la degradación de las revistas”, dijo Acuña. “Pudimos ponerlo a disposición de los científicos en el futuro cercano antes de que lo presentaran a la revista”. ®