El uso de Wikipedia sigue siendo elevado, pero los investigadores advierten de que la obtención de datos a través de la inteligencia artificial plantea problemas para el futuro de la enciclopedia en línea.
Wikipedia sobrevive, al menos por ahora, a la era de la inteligencia artificial (IA), según un nuevo estudio del King's College de Londres (Reino Unido). La enciclopedia gratuita de Internet, lanzada en 2001, ha sido durante mucho tiempo objeto de predicciones catastrofistas, que sugerían la muerte inminente de Wikipedia debido al auge de herramientas como ChatGPT.
El estudio se desmarca de estos pronósticos negativos y demuestra que la gente sigue utilizando Wikipedia, aunque señala que el scraping de IA -la recopilación a gran escala de datos de sitios web- y los cambios en la forma en que los usuarios acceden a la información plantean retos para la plataforma.
Publicado en la revista 'Association for Computing Machinery (ACM) Collective Intelligence', el artículo analiza 12 ediciones lingüísticas de Wikipedia -seis con acceso ChatGPT y seis sin él- desde enero de 2021 a enero de 2024.
Los científicos no observaron ningún descenso en la actividad de Wikipedia durante esos 36 meses. De hecho, observaron un aumento de las páginas vistas y del número de visitantes en todas las ediciones, aunque el crecimiento fue menor en los idiomas en los que ChatGPT estaba disponible.
A pesar de ello, el estudio no encontró pruebas de que ChatGPT redujera el número de ediciones o editores en Wikipedia. Los investigadores también señalaron varias limitaciones, como la posibilidad de que algunos usuarios eludieran las restricciones de ChatGPT utilizando redes privadas virtuales (VPN), y que el estudio no tuviera en cuenta la popularidad de esta herramienta en los distintos países.
Estos resultados coinciden con investigaciones anteriores sobre IA y Wikipedia, que muestran un tráfico constante en la enciclopedia libre, al tiempo que ponen de relieve algunos retos importantes para el futuro de la plataforma.
Amenaza a largo plazo de la IA para Wikipedia
Aunque los datos cuestionan la idea de la muerte de Wikipedia, los investigadores también subrayan que la enciclopedia se enfrenta a serias dificultades.
Elena Simperl, profesora de informática en King's y codirectora del Instituto de Inteligencia Artificial de King's, afirma en un comunicado que "los desarrolladores de IA están dejando sueltos sus 'raspadores' en Wikipedia para entrenarlos con datos de alta calidad, lo que aumenta el tráfico a niveles que los servidores de Wikipedia tienen dificultades para mantener".
Simperl también señaló que los contenidos generados por IA a menudo se basan en Wikipedia sin citarla, lo que desvía el tráfico web de la enciclopedia en línea. En este sentido, Neal Reeves, colega de Simperl y también autor del estudio, abogó por un "nuevo contrato social" entre las empresas de IA y Wikipedia, en el que la plataforma pudiera mantener el control sobre sus contenidos y, al mismo tiempo, permitir su uso para el entrenamiento de la IA.
El artículo se publicó el mismo día en que Wikimedia Deutschland, la rama alemana de la fundación que gestiona Wikipedia, anunció el proyecto Wikidata Embedding, una nueva base de datos diseñada para facilitar a los usuarios, y especialmente a los modelos de IA, el acceso a los contenidos de Wikipedia. Con este sistema, los desarrolladores de IA podrán utilizar conocimientos verificados por los editores de Wikipedia, en lugar de basarse únicamente en páginas raspadas.