La herramienta de IA diagnosticó correctamente hasta el 85,5% de los casos, aproximadamente cuatro veces más que el grupo de médicos del Reino Unido y Estados Unidos, que tenían entre cinco y 20 años de experiencia.
Microsoft afirma estar un paso más cerca de la superinteligencia médica, después de que una nueva herramienta de inteligencia artificial (IA) superara a los médicos en el diagnóstico de problemas médicos complejos. Los gigantes tecnológicos se apresuran a desarrollar la superinteligencia, es decir, un sistema de IA que supere en todos los aspectos las capacidades intelectuales humanas, y prometen utilizarla para trastocar los sistemas sanitarios de todo el mundo.
En su último experimento, Microsoft puso a prueba un sistema de diagnóstico por IA frente a 21 médicos experimentados, utilizando casos reales de 304 pacientes publicados en la revista médica 'New England Journal of Medicine'.
La herramienta de IA diagnosticó correctamente hasta el 85,5% de los casos, aproximadamente cuatro veces más que el grupo de médicos del Reino Unido y Estados Unidos, que tenían entre cinco y 20 años de experiencia. Según el análisis, el modelo también resultó más barato que los médicos humanos, ya que pidió menos exploraciones y pruebas para llegar al diagnóstico correcto.
La IA tiene el potencial de remodelar la asistencia sanitaria
Según Microsoft, los resultados indican que los modelos de IA pueden razonar sobre problemas de diagnóstico complejos que dejan perplejos a los médicos, que están especializados en sus campos pero no son expertos en todos los aspectos de la medicina.
Sin embargo, la IA "puede combinar tanto la amplitud como la profundidad de la experiencia, demostrando capacidades de razonamiento clínico que, en muchos aspectos del razonamiento clínico, superan las de cualquier médico individual. Este tipo de razonamiento tiene el potencial de remodelar la asistencia sanitaria", señalaron los ejecutivos de Microsoft en un comunicado de prensa.
Microsoft no cree que la IA vaya a sustituir a los médicos en un futuro próximo, sino que sus herramientas ayudarán a los médicos a automatizar algunas tareas rutinarias, personalizar el tratamiento de los pacientes y acelerar los diagnósticos.
Cómo funciona el modelo
El sistema de IA de Microsoft realiza diagnósticos imitando el proceso que sigue un médico para recopilar los datos de un paciente, solicitar pruebas y, finalmente, acotar un diagnóstico médico.
Un agente guardián disponía de la información de los estudios de casos de los pacientes. Interactuaba con un orquestador de diagnóstico que formulaba preguntas y ordenaba pruebas, recibiendo los resultados de los exámenes del mundo real.
La empresa probó el sistema con los principales modelos de IA, como GPT, Llama, Claude, Gemini, Grok y DeepSeek. El modelo o3 de OpenAI, integrado en ChatGPT, resolvió correctamente el 85,5% de los casos de pacientes, frente a una media del 20% entre el grupo de 21 médicos experimentados.
Limitaciones y próximos pasos
Los investigadores publicaron sus resultados en línea como artículo preimpreso, lo que significa que aún no ha sido revisado por pares. Microsoft también reconoció algunas limitaciones importantes, en particular que la herramienta de IA sólo se ha probado para problemas de salud complicados, no para cuestiones más comunes y cotidianas.
El grupo de médicos también trabajó sin tener acceso a sus colegas, libros de texto u otras herramientas que podrían utilizar normalmente a la hora de hacer diagnósticos. "Esto se hizo para permitir una comparación justa con el rendimiento humano en bruto", dijo Microsoft. La empresa pidió más pruebas reales del potencial de la IA en las clínicas sanitarias y afirmó que "probará y validará rigurosamente estos enfoques" antes de generalizar su uso.