Un innovador modelo de IA supera a la mayoría de los médicos en los exámenes de licencia médica de EE. UU.

Un innovador modelo de IA supera a la mayoría de los médicos en los exámenes de licencia médica de EE. UU., se utilizó tecnología basada en el razonamiento.

Investigadores de la Universidad de Buffalo han desarrollado una herramienta de inteligencia artificial que ha superado tanto a los médicos como a otros modelos en exámenes críticos para obtener una licencia médica.
Investigadores de la Universidad de Buffalo han desarrollado una herramienta de inteligencia artificial que ha superado tanto a los médicos como a otros modelos en exámenes críticos para obtener una licencia médica.
Lee Bell
Lee Bell Meteored Reino Unido 5 min

Aprobar los exámenes de licencia médica es un logro enorme para cualquier aspirante a médico en Estados Unidos. Las preguntas no solo son complejas, sino que exigen un razonamiento clínico agudo.

Por lo tanto, cuando un sistema de IA no solo supera el examen, sino que supera a la mayoría de los médicos y a cualquier otro modelo de IA hasta la fecha, es inevitable que cause controversia en el mundo médico.

Eso es exactamente lo que sucedió cuando investigadores de la Universidad de Buffalo (UB) sometieron su nueva herramienta, Inteligencia Artificial Clínica Semántica (o SCAI, que se pronuncia "Sky"), al Examen de Licencia Médica de Estados Unidos (USMLE).

Piensa como un clínico

La SCAI no solo acertó con las suposiciones. Según los investigadores de la UB, aprobó las tres partes del USMLE, con una puntuación del 95,2 % en el Paso 3, por encima del 90,5 % de GPT-4 Omni.

El modelo logró un mejor rendimiento que ChatGPT porque, en lugar de depender de los métodos habituales de IA para extraer patrones de datos de internet, el sistema fue diseñado para razonar, de forma similar a un médico.

"Hemos enseñado a los modelos de lenguaje grandes a usar el razonamiento semántico", afirmó el autor principal, Peter Elkin, catedrático de Informática Biomédica de la UB. "Al añadir semántica a los modelos de lenguaje grandes, les proporcionamos la capacidad de razonar de forma similar a como lo hacemos en la medicina basada en la evidencia".

El equipo de la UB introdujo el razonamiento semántico en la IA, lo que le permite respaldar decisiones clínicas con una lógica que refleja la formación médica basada en evidencia.
El equipo de la UB introdujo el razonamiento semántico en la IA, lo que le permite respaldar decisiones clínicas con una lógica que refleja la formación médica basada en evidencia.

A diferencia de otras herramientas de IA, que Elkin describe como "simples plagios de lo que hay en internet", SCAI se basa en más de 13 millones de datos médicos, conectándolos mediante estructuras lógicas llamadas triples semánticos (como "La penicilina trata la neumonía neumocócica") para construir vastas redes de significado. Esto significa que la herramienta puede comprender consultas clínicas complejas, extraer inferencias y "conversar con usted", afirma Elkin, y añade:

SCAI se diferencia de otros modelos de lenguaje extensos porque puede conversar con usted y, como una colaboración entre humanos y computadoras, puede contribuir a su toma de decisiones y razonamiento basándose en su propio razonamiento

No es un sustituto

Para desarrollar SCAI, los científicos de la UB evitaron datos que, según ellos, podrían introducir sesgos (como las notas clínicas) y, en su lugar, lo alimentaron con todo tipo de información, desde guías clínicas y bases de datos de medicamentos hasta información genómica y datos de seguridad.

El equipo también añadió tecnología como la generación aumentada por recuperación, de modo que el modelo pueda extraer conocimiento del mundo real antes de responder una pregunta, lo que le ayuda a evitar la típica trampa de la IA de adivinar con seguridad cuando no debería.

Aun así, Elkin insiste en que no se trata de que los robots tomen el control.“La inteligencia artificial no va a reemplazar a los médicos”, afirmó, “pero un médico que usa IA puede reemplazar a uno que no la usa”.

Referencia de la noticia:

Semantic Clinical Artificial Intelligence vs Native Large Language Model Performance on the USMLE, published in JAMA Network Open, April 2025.