Análisis del panorama actual, oportunidades, limitaciones y áreas prioritarias de acción para integrar la Inteligencia Artificial en la formación médica.
La Josiah Macy Jr. Foundation encargó este informe de dos partes para orientar las discusiones de su conferencia sobre IA en educación médica (noviembre 2024). Combina una revisión sistemática de la literatura con las perspectivas de innovadores en primera línea.
Revisión de 455 artículos indexados en PubMed hasta junio de 2024. Mapea las aplicaciones de IA en cinco dominios clave de la formación médica mediante un sistema de clasificación bidimensional (tarea de IA × actividad educativa).
Entrevistas semiestructuradas con 25 innovadores (educadores, líderes institucionales y representantes de la industria) realizadas entre junio y agosto de 2024. Análisis temático sobre impacto, retos y estrategias de mitigación.
El informe mapea las aplicaciones de la IA en cinco grandes dominios de la educación médica. Despliega cada uno para explorar los casos de uso con detalle.
La IA optimiza el proceso de revisión holística frente al creciente volumen de solicitudes, automatizando tareas repetitivas y prediciendo resultados académicos con mayor equidad.
En el ámbito preclínico, la IA gestiona la expansión exponencial del conocimiento médico y facilita entornos de práctica seguros. Los innovadores destacan su capacidad para trasladar el foco de la memorización al razonamiento clínico avanzado.
En el entorno clínico, la IA apoya los procesos diagnósticos y amplifica las capacidades interpretativas del estudiante. El currículo clínico debe incorporar la competencia en IA como requisito fundamental para los futuros médicos.
La IA tiene el potencial de transformar la evaluación médica, haciéndola más eficiente, continua y personalizada, aunque requiere validación rigurosa antes de su implementación en decisiones de alto impacto.
La IA aporta nuevas perspectivas para evaluar programas educativos a gran escala, analizar trayectorias de facultad y estudiantes, e identificar inequidades sistémicas que antes pasaban desapercibidas.
El informe clasifica explícitamente las limitaciones en tres grandes categorías. Selecciona una pestaña para explorarlas.
La IA tiene el riesgo de fabricar o inventar información incorrecta y presentarla al usuario con total seguridad. En el contexto clínico, esto es especialmente peligroso: un estudiante novato podría integrar un error de la IA en su razonamiento sin cuestionarlo, lo que resulta muy difícil de corregir posteriormente.
Los procesos de toma de decisiones detrás de los LLM son altamente opacos. Esto dificulta explicar el razonamiento de la IA, verificar la precisión de sus resultados y medir su validez clínica o educativa con métodos estandarizados. Sin transparencia, es imposible construir confianza en el sistema.
Los modelos tienden a reflejar las preferencias del usuario o a generar exactamente lo que este espera leer, socavando la precisión objetiva. En educación, esto puede hacer que la IA valide razonamientos incorrectos del estudiante en lugar de cuestionarlos, eliminando el valor del aprendizaje a través del error.
Dado que los modelos se entrenan con datos históricos y de internet, heredan representaciones sesgadas, desigualdades sociales y estereotipos. Esto amenaza con amplificar inequidades en decisiones de alto impacto —como las admisiones— y exacerbar las disparidades en la atención a poblaciones marginadas.
La tecnología actual tiene un rendimiento limitado para representar los componentes emocionales e interactivos de la atención al paciente. A diferencia de pacientes estandarizados humanos, la IA no puede replicar con precisión el lenguaje corporal, la empatía genuina ni las emociones humanas reales, fundamentales en la formación clínica.
Los modelos populares frecuentemente no proporcionan citas reales de sus fuentes, dificultando la auditoría de su fiabilidad. Además, su uso conlleva preocupaciones serias sobre privacidad y seguridad de los datos clínicos y educativos.
La dependencia excesiva en la IA erosiona las habilidades fundamentales, el pensamiento crítico y el razonamiento clínico autónomo. Los estudiantes podrían perder la motivación para sintetizar conocimientos por sí mismos y dejar de experimentar las "luchas productivas" esenciales para el aprendizaje profundo, haciéndoles vulnerables si la IA no está disponible.
La ilusión de infalibilidad de la IA puede llevar a los clínicos a una "falsa seguridad": una dependencia excesiva que genere errores médicos al aceptar sin criterio las recomendaciones del sistema. La formación debe enfocarse en mantener el escepticismo saludable y el juicio clínico independiente.
Si la IA proporciona retroalimentación inexacta o engañosa, los aprendices novatos —debido a su inexperiencia— pueden integrar esos errores profundamente en su cognición, siendo muy difíciles de corregir en el futuro. La ausencia de supervisión experta multiplica este riesgo.
Si los tutores de IA reemplazan las interacciones con compañeros o instructores, los estudiantes pueden sufrir aislamiento. Esto reduce la interacción social crucial para el trabajo en equipo, la generación de confianza, la mentoría profesional y la satisfacción laboral, aspectos irremplazables de la formación médica.
La capacidad de la IA para generar ensayos, declaraciones personales y exámenes casi indistinguibles del trabajo humano plantea serias dudas sobre la autenticidad, la equidad y el potencial fraude académico, requiriendo un rediseño profundo de los sistemas de evaluación.
La adopción tecnológica corre el riesgo de marginar a los programas con menos recursos, ampliando la brecha entre instituciones "que tienen" y "que no tienen" acceso a infraestructura computacional segura, bases de datos masivas, políticas de IA y expertos en tecnología. Esto puede reproducir y amplificar las desigualdades educativas existentes.
El paradigma de mantener al "humano en el bucle" —es decir, que educadores y clínicos supervisen continuamente los resultados de la IA— se vuelve insostenible a escala. El volumen masivo de outputs generados por la IA supera la capacidad de supervisión humana, llevando al agotamiento y a una supervisión superficial o nula.
La falta de directrices institucionales claras sobre el uso ético de la IA en educación médica genera incertidumbre en educadores y estudiantes. Sin marcos de gobernanza establecidos, la implementación es fragmentada, desigual y propensa a usos no deseados.
Existe una escasez de métodos establecidos para evaluar rigurosamente la efectividad de las aplicaciones de IA en entornos educativos reales. Sin métricas formales de precisión, sesgo y validez educativa, es difícil tomar decisiones basadas en evidencia sobre qué herramientas implementar.
Los innovadores propusieron estrategias concretas para cada riesgo identificado. Toca cada tarjeta para ver las estrategias, o usa los controles para navegar.
El informe concluye con una hoja de ruta concreta: cinco prioridades estratégicas que la comunidad de educación médica debe abordar para integrar la IA de forma segura, equitativa y efectiva.
Este recurso educativo está basado íntegramente en los artículos originales del Macy Foundation Innovation Report, publicados en Academic Medicine (septiembre 2025).
Boscardin, C. K., Abdulnour, R.-E. E., & Gin, B. C. (2025). Macy Foundation innovation report part I: Current landscape of artificial intelligence in medical education. Academic Medicine, 100(9S), S15–S21.
doi:10.1097/ACM.0000000000006107Gin, B. C., LaForge, K., Burk-Rafel, J., & Boscardin, C. K. (2025). Macy Foundation innovation report part II: From hype to reality: Innovators' visions for navigating AI integration challenges in medical education. Academic Medicine, 100(9S), S22–S29.
doi:10.1097/ACM.0000000000006117