Newsletter Newsletters Events Eventos Podcasts Videos Africanews
Loader
Encuéntranos
Publicidad

DeepSeek de China lanza el nuevo modelo de IA V4 mientras se acelera la carrera por la IA

La página de la aplicación para teléfonos móviles DeepSeek se muestra en la pantalla de un smartphone en Pekín, el 28 de enero de 2025. (Foto AP/Andy Wong, archivo)
Se ve la página de la aplicación móvil DeepSeek en la pantalla de un teléfono inteligente en Pekín, el 28 de enero de 2025. (Foto AP/Andy Wong, archivo) Derechos de autor  AP Photo
Derechos de autor AP Photo
Por Roselyne Min
Publicado
Compartir Comentarios
Compartir Close Button

La startup china de IA regresa un año después de agitar el sector, con una potencia de cálculo líder mundial y un coste muy inferior al de otros modelos.

La empresa china de inteligencia artificial DeepSeek ha presentado un avance de su nuevo gran modelo lingüístico, V4, en un momento en que la carrera mundial por la IA se acelera.

PUBLICIDAD
PUBLICIDAD

DeepSeek se convirtió en una de las compañías de IA más seguidas el año pasado tras lanzar en enero de 2025 unos modelos que parecían ofrecer un rendimiento sólido a menor coste que muchos rivales estadounidenses.

La startup con sede en Hangzhou lanzó el modelo en dos versiones, DeepSeek V4-Pro y DeepSeek V4-Flash. V4-Pro es un modelo de mayor tamaño dirigido a tareas más exigentes, mientras que V4-Flash es una versión más pequeña diseñada para responder con mayor rapidez y ser más barata de operar.

"En los benchmarks de conocimiento general, DeepSeek V4-Pro supera con claridad a otros modelos de código abierto y solo queda ligeramente por detrás del modelo de código cerrado de gama alta Gemini-3.1-Pro", señaló DeepSeek.

La empresa afirmó que el nuevo modelo de IA admite un "contexto de un millón de tokens", lo que significa que puede procesar indicaciones mucho más extensas, como documentos largos o código, antes de generar una respuesta.

En IA, la longitud de contexto es la cantidad de texto, medida en tokens, que un modelo puede tener en cuenta a la vez. Una ventana de contexto mayor permite que un modelo de IA procese entradas más largas e incluya más información en cada salida, según IBM (fuente en inglés).

"Bienvenidos a la era del contexto de 1M rentable", dijo la empresa en un anuncio publicado en Hugging Face, una plataforma de IA de código abierto.

DeepSeek añadió que V4 ofrece "un contexto largo líder a escala mundial con unos costes de computación y memoria drásticamente reducidos".

DeepSeek comparó V4-Pro con modelos rivales de OpenAI, Anthropic y Google, aunque Gemini-3.1-Pro de Google obtuvo mejores resultados en algunas pruebas.

El nuevo modelo puede utilizarse con agentes de IA populares como Claude Code, OpenClaw y OpenCode, lo que permite a los desarrolladores emplearlo en tareas de software más allá del propio chatbot de DeepSeek.

Conocida por mantener un enfoque más abierto que sus rivales con modelos cerrados de IA, DeepSeek también ha puesto V4 a disposición para descargarlo, probarlo y adaptarlo libremente en Hugging Face.

La startup china cobró notoriedad a finales de 2024 con su modelo V3 de código abierto, que sorprendió al sector de la IA por ofrecer un rendimiento elevado a menor coste y utilizando chips menos potentes que muchos de sus rivales estadounidenses, entre ellos OpenAI y Google.

La carrera mundial por la IA

La empresa captó la atención mundial en enero de 2025 cuando lanzó R1, un modelo de razonamiento de IA que, según la compañía, era más barato y ofrecía un rendimiento similar al de los grandes modelos lingüísticos de ChatGPT de OpenAI.

Sin embargo, algunos países prohibieron a los organismos públicos el año pasado utilizar DeepSeek, entre ellos Italia, Estados Unidos y Corea del Sur, alegando motivos de seguridad nacional.

Alemania también vetó DeepSeek en las tiendas de aplicaciones de Apple y Google en 2025, alegando una transferencia ilegal de datos de usuarios a China.

El lanzamiento de V4 llega un día después de que el gigante estadounidense de la IA OpenAI presentara también su último modelo, GPT-5.5, al que definió como su "más inteligente e intuitivo" hasta la fecha.

El anuncio se produce asimismo un día después de que la Casa Blanca acusara a China de robar la propiedad intelectual de laboratorios estadounidenses de IA a escala industrial mediante miles de cuentas pantalla.

OpenAI, Anthropic y Google advirtieron este año de que las empresas chinas de IA, entre ellas DeepSeek, estaban llevando a cabo ataques de extracción de modelos (MEA), también conocidos como "destilación".

El método consiste en enviar al modelo más grande miles de preguntas, recopilar sus respuestas y utilizarlas para entrenar a un modelo nuevo y más pequeño para que razone de forma similar.

Ir a los atajos de accesibilidad
Compartir Comentarios

Noticias relacionadas

Qué es el impuesto a los servicios digitales del Reino Unido y por qué enfada a Trump

Dentro de la fábrica de Xiaomi en Pekín que hace un móvil cada 6 segundos

DeepSeek de China lanza el nuevo modelo de IA V4 mientras se acelera la carrera por la IA