Un estudio de la Universidad de Cornell revela que el uso de IA ha aumentado hasta un 50% la producción de artículos académicos, especialmente entre científicos no anglófonos. Sin embargo, estos trabajos tienen menos éxito en la revisión lo que sugiere que muchos carecen de valor científico real.
A medida que los científicos dependen cada vez más de la inteligencia artificial para redactar, programar e incluso generar ideas, un nuevo estudio analiza cómo la IA está transformando la investigación académica. Lo que antes sonaba a rumor académico refleja ahora un cambio real y medible en la publicación científica.
Investigadores de la Universidad de Cornell, en Estados Unidos, han constatado que los grandes modelos de lenguaje (LLM) como ChatGPT están impulsando la producción de artículos, especialmente entre los científicos que no son hablantes nativos de inglés. Sin embargo, el estudio advierte de que el volumen creciente de artículos asistidos por IA dificulta a revisores, financiadores y responsables políticos distinguir las contribuciones científicas significativas de los trabajos de baja calidad.
"Es un patrón muy extendido en distintos ámbitos de la ciencia, desde las ciencias físicas y la informática hasta la biología y las ciencias sociales", dijo Yian Yin, un autor del estudio y profesor asistente de ciencias de la información en el Cornell Ann S. Bowers College of Computing and Information Science. "Se está produciendo un cambio importante en nuestro ecosistema que merece una mirada muy seria, sobre todo por parte de quienes deciden qué ciencia debemos apoyar y financiar", añadió Yin.
¿Cómo estudiaron los investigadores la aparición de los artículos asistidos por IA?
El estudio, publicado en la revista 'Science', analizó más de dos millones de artículos de investigación publicados entre 2018 y 2024 en tres grandes repositorios en línea. Estas plataformas alojan versiones preliminares de artículos científicos antes de la revisión por pares formal, lo que ofrece una ventana a cómo trabajan los investigadores en tiempo real.
Para evaluar el impacto de la IA en la redacción científica, los investigadores entrenaron un sistema para detectar texto probablemente generado por LLM. Compararon artículos redactados antes de 2023, cuando herramientas como ChatGPT se generalizaron, con trabajos posteriores que mostraban señales claras de asistencia de IA. Con este enfoque, el equipo identificó a los investigadores que probablemente usaban herramientas de IA, midió cómo cambiaba su producción y siguió si esos artículos eran aceptados después por revistas científicas.
La asistencia de la IA dispara la productividad
Su análisis mostró un fuerte repunte de la actividad. Los científicos que parecían utilizar herramientas de IA publicaron muchos más artículos que quienes no lo hacían. En uno de los principales repositorios centrados en física e informática, los usuarios de IA produjeron aproximadamente un tercio más de artículos. En biología y ciencias sociales, el aumento fue aún mayor, con más del 50%.
Los mayores avances se observaron entre investigadores cuya primera lengua no es el inglés. En algunas instituciones asiáticas, los científicos publicaron entre un 40% y casi un 90% más de artículos tras adoptar herramientas de redacción con IA, según la disciplina.
Las herramientas de IA también parecen ayudar a los investigadores a encontrar mejores referencias. El estudio constató que las herramientas de búsqueda con IA tienden más a destacar trabajos de investigación más recientes y libros pertinentes, en lugar de los estudios antiguos y muy citados que favorecen los métodos tradicionales.
"Quienes usan LLM conectan con un conocimiento más diverso, lo que podría estar impulsando ideas más creativas", dijo Keigo Kusumegi, primer autor del estudio y doctorando del Departamento de Ciencias de la Información de la Universidad de Cornell.
Preocupaciones sobre la calidad de los artículos redactados con IA
Pero el empuje de productividad tiene una contrapartida. Muchos artículos redactados con IA resultaban muy pulidos a simple vista, pero tenían menos probabilidades de superar la revisión por pares. En los tres repositorios analizados, los artículos probablemente escritos por personas y con alta puntuación en una prueba de complejidad del texto, eran los más propensos a ser aceptados en una revista científica.
En cambio, los trabajos con alta puntuación y probablemente redactados por LLM tenían menos probabilidades de ser aceptados, lo que sugiere que, pese a la redacción convincente, los revisores consideraron que muchos de esos artículos tenían escaso valor científico.
Los autores del estudio consideran que el impacto de la creciente dependencia de la IA probablemente se ampliará y que los responsables políticos deberían establecer nuevas normas para regular un panorama tecnológico que evoluciona a gran velocidad.
"A estas alturas, la pregunta no es '¿Has usado IA?'. La pregunta es 'Cómo exactamente la has usado y si resulta útil o no'", dijo Yin.