EduMed·UVa UNIDAD DE EDUCACIÓN MÉDICA · FACULTAD DE MEDICINA
IA en EduMed
BEME Guide No. 84 · Medical Teacher 2024

IA en Educación Médica:
una revisión de alcance

Mapeo exhaustivo del panorama actual de la inteligencia artificial en todo el continuo de la formación médica, con herramientas novedosas para investigadores y educadores.

📄
Publicado en Medical Teacher, 2024
🔬
Basado en 278 publicaciones globales
🌍
Metodología Scoping Review · PRISMA-ScR
Sobre el artículo

¿Qué aporta y cómo está estructurado?

La Guía BEME N.º 84 sintetiza y mapea exhaustivamente el panorama actual de la IA en todo el continuo de la educación médica —pregrado, posgrado y desarrollo profesional continuo— reuniendo hallazgos de 278 publicaciones globales bajo los estándares PRISMA-ScR.

🗺️
Mapa completo del campo
Documenta casos de uso reales de la IA en admisiones, enseñanza, evaluación, razonamiento clínico y automatización de registros, demostrando que la IA ya opera en la formación médica actual.
🔧
El marco FACETS
Propone una herramienta novedosa para estandarizar el reporte de estudios de IA en educación médica, facilitando la comparación y síntesis de futuras investigaciones.
🌀
Análisis de madurez institucional
Aplica la teoría del "choque cultural" de Oberg para explicar en qué fase de asimilación de la IA se encuentran las instituciones médicas, desde el idealismo hasta la integración genuina.
⚖️
Hoja de ruta ética y curricular
Sintetiza el consenso de la literatura sobre cómo enseñar IA: sesgos algorítmicos, equidad, privacidad de datos y preservación del juicio clínico frente a la "falsa seguridad" de la automatización.

Metodología en 5 etapas

1
Pregunta de investigación
Definición del alcance y objetivos de la revisión
Protocolo
2
Búsqueda en bases de datos
Sin restricciones de idioma · 278 artículos incluidos
PRISMA-ScR
3
Selección por pares
Parejas de investigadores para cribado y extracción independiente
Fiabilidad
4
Extracción de datos
191 innovaciones + 87 perspectivas clasificadas
Categorización
5
Síntesis y graficación
Marco FACETS + modelo de choque cultural de Oberg
Marco FACETS
Evidencia empírica

Casos de uso reales documentados

El artículo analiza 191 publicaciones empíricas agrupadas en siete áreas temáticas. Despliega cada categoría para explorar los casos concretos documentados en la literatura.

La IA optimiza procesos de selección ante volúmenes crecientes de solicitudes, equilibrando eficiencia y equidad en decisiones de alto impacto.

💬
Chatbots de reclutamiento: IA que organiza sesiones virtuales de preguntas y respuestas durante el reclutamiento de aspirantes, mejorando la accesibilidad informativa.
📊
Modelado predictivo: Algoritmos de ML para clasificar evaluaciones de rendimiento y predecir qué candidatos tienen más probabilidades de ser aceptados o lograr el match en residencias.
🔍
Análisis de sentimientos: Revisión de cartas de recomendación mediante NLP para detectar sesgos de género históricos en procesos de selección quirúrgica.
⚖️
Filtrado equitativo: IA que evalúa y filtra grandes volúmenes de solicitudes actuando como sistema de apoyo a la revisión humana, buscando mitigar sesgos sistemáticos.

La IA enriquece los entornos de enseñanza con experiencias personalizadas, simulaciones avanzadas e instrucción adaptativa en tiempo real.

👁️
Entrenamiento visual: Herramientas para identificar patologías en imágenes: glomerulopatías, estructuras neuroanatómicas, melanomas, retinopatía diabética y fracturas de cadera en radiografías.
🫀
Guía ecográfica en tiempo real: Sistemas IA para guiar la adquisición de vistas ecocardiográficas óptimas con ultrasonido en el punto de atención (POCUS).
🤖
Chatbots interactivos: Instrucción en anatomía, capacitación en comunicación de malas noticias y generación de resúmenes de procedimientos quirúrgicos.
🧠
Tutoría inteligente adaptativa: NLP para ofrecer instrucción "justo a tiempo" al evaluar pacientes geriátricos o realizar triajes en oftalmología, adaptándose al nivel del estudiante.
🩺
Simulación enriquecida: Pacientes estandarizados robóticos, medición de la carga cognitiva mediante ECG y respuesta galvánica analizadas por IA, y generación algorítmica de imágenes dermatológicas.

La IA automatiza y enriquece la evaluación, ofreciendo métricas más objetivas, feedback oportuno y predicciones del rendimiento académico futuro.

🔪
Evaluación de habilidades quirúrgicas: ML y analíticas de video en la nube para evaluar cirugía robótica, mínimamente invasiva y neurocirugía, sustituyendo a observadores humanos.
🧩
Curvas de aprendizaje: Algoritmos con datos visuales, cinestésicos o EEG para predecir curvas de aprendizaje y distinguir entre cirujanos novatos y expertos de forma objetiva.
📝
Análisis narrativo: NLP para evaluar cualitativamente a los alumnos a partir de comentarios de profesores, escritos reflexivos y respuestas cortas orientadas a medir profesionalismo.
🎭
OSCEs virtuales: Simuladores de Pacientes Virtuales y Exámenes Clínicos Objetivos Estructurados en formato digital con sistemas de calificación automatizados.
Generación automática de MCQs: Creación de preguntas de opción múltiple mediante Deep Learning y LLMs para construir bancos de preguntas de evaluación a gran escala.
📈
Analítica predictiva: Modelos que prevén el rendimiento en exámenes de alto riesgo, permitiendo identificar estudiantes en riesgo de forma anticipada.

La IA crea entornos para practicar el pensamiento diagnóstico con feedback inmediato, y automatiza la generación de casos clínicos complejos.

🧑‍⚕️
Avatares virtuales de pacientes: Entornos dinámicos donde los alumnos practican la recopilación de información, la generación de hipótesis y la justificación diagnóstica con feedback en tiempo real.
📚
Bibliotecas de casos masivas: NLP para extraer datos de registros hospitalarios y revistas médicas y automatizar la creación de bibliotecas de casos clínicos de gran variedad.
📋
Evaluación de notas clínicas: ML para revisar las notas clínicas de estudiantes y residentes (notas de admisión, diarios post-OSCE) y evaluar estadísticamente su capacidad de razonamiento.
💡
Apoyo a la toma de decisiones: LLMs utilizados como herramientas de soporte a la toma de decisiones clínicas para médicos residentes y jóvenes en formación.

La IA reduce la carga administrativa de residentes y estudiantes, automatizando el registro de experiencias clínicas y liberando tiempo para el aprendizaje de mayor valor.

🗂️
Mapeo automático de conceptos: NLP que identifica conceptos en notas clínicas de residentes y los mapea automáticamente con problemas clínicos centrales del currículo.
🧠
Rastreo de casos en neurología: Seguimiento automático de experiencias clínicas que multiplica la cantidad de casos correctamente registrados en residencias de alta complejidad.
📊
Dashboards diagnósticos: Paneles de control que contabilizan clases de diagnósticos automáticamente a partir de impresiones de imágenes médicas dictadas por residentes.
✍️
Sugerencias proactivas de registro: Redes neuronales profundas que sugieren a los residentes los datos precisos que necesitan registrar en sus historiales y bitácoras quirúrgicas.

Una parte significativa de la literatura analiza cómo perciben la IA estudiantes, residentes y facultativos, revelando brechas de conocimiento y actitudes que el currículo debe abordar.

📋
Encuestas de percepción: Estudios sobre el nivel de conocimiento de la IA en estudiantes de medicina, residentes y médicos en activo, identificando lagunas formativas específicas.
🤔
Actitudes hacia la IA clínica: Análisis de la predisposición de los profesionales a integrar herramientas de IA en la práctica, incluyendo preocupaciones sobre responsabilidad y confianza.
🎓
Necesidades curriculares percibidas: Identificación de qué competencias en IA consideran necesarias los propios estudiantes y educadores para el ejercicio médico futuro.

Un área emergente y de enorme impacto curricular: la evaluación del rendimiento de modelos como ChatGPT en exámenes de certificación y pruebas clínicas estandarizadas.

📝
ChatGPT en el USMLE: Múltiples estudios documentan que ChatGPT supera el umbral de aprobación del examen de licenciatura médica estadounidense, planteando preguntas sobre la validez de las evaluaciones actuales.
🏥
Razonamiento clínico de LLMs: Evaluación de la capacidad de los grandes modelos de lenguaje para generar diagnósticos diferenciales y planes de tratamiento en casos clínicos complejos.
⚠️
Implicaciones para la evaluación: El rendimiento de los LLMs obliga a rediseñar las evaluaciones médicas hacia formatos que midan procesos cognitivos que la IA no puede replicar, como el juicio clínico contextualizado.
Herramienta de investigación

El marco FACETS

Propuesta novedosa de los autores para estandarizar el reporte de estudios de IA en educación médica. Selecciona cada letra para conocer su significado y utilidad.

El marco FACETS guía a los investigadores para reportar todos los elementos de una intervención de IA de forma cohesiva en una sola publicación. Facilita la comparación entre estudios y la realización de revisiones sistemáticas futuras. Solo aplica a innovaciones y casos de uso reales, no a artículos de perspectiva ni encuestas de actitudes.

F
Form of AI · Forma de la IA
¿Qué tipo de inteligencia artificial se utiliza?

Define la categoría o familia tecnológica del sistema de IA empleado en el estudio. Este elemento permite agrupar investigaciones por tecnología subyacente e identificar qué tipos de IA están siendo más explorados en cada dominio educativo.

Ejemplos documentados
Aprendizaje Automático (ML) Aprendizaje Profundo (Deep Learning) Procesamiento de Lenguaje Natural (NLP) Minería de Datos (Data Mining) Grandes Modelos de Lenguaje (LLM) Visión Artificial (Computer Vision)
A
AI Use Case · Caso de uso
¿Cuál es el producto o resultado final de la IA?

Describe la innovación concreta, la salida o el producto que genera el sistema de IA. No describe la tecnología sino lo que esa tecnología produce para el usuario final —estudiante, docente o institución—. Es el "para qué sirve" de la herramienta.

Ejemplos documentados
Simulador de Paciente Virtual Plataforma de aprendizaje personalizado Sistema de orientación clínica Tutor inteligente Generador automático de MCQs Analítica de rendimiento quirúrgico
C
Context · Contexto
¿Dónde y con quién se aplica la IA?

Especifica el entorno educativo donde se implementa la intervención: la etapa del continuo formativo (pregrado UME, posgrado GME o desarrollo profesional continuo CPD), el área o especialidad médica, y el grupo de estudiantes o profesionales evaluados.

Ejemplos documentados
Pregrado (UME) · rotaciones clínicas Posgrado (GME) · Cirugía Posgrado · Neurología Desarrollo profesional continuo (CPD) Atención primaria · Oftalmología
E
Education Focus · Enfoque educativo
¿Qué área de la educación médica aborda?

Delimita el proceso educativo específico que la IA busca apoyar o transformar. Este elemento conecta la intervención tecnológica con los objetivos pedagógicos del programa formativo, permitiendo agrupar estudios por finalidad educativa.

Ejemplos documentados
Selección y admisión Desarrollo curricular Enseñanza (Teaching) Evaluación (Assessment) Razonamiento clínico Feedback y retroalimentación
T
Technology · Tecnología específica
¿Qué herramienta o sistema concreto se emplea?

Nombra de forma exacta el modelo de lenguaje, el software, el sistema o el lenguaje de programación que implementa la IA en el estudio. La especificidad es clave: permite la reproducibilidad y la comparación directa entre estudios que usan la misma herramienta.

Ejemplos documentados
ChatGPT / GPT-4 CIRCSIM-Tutor Software de analítica de video en la nube Sistema de visión artificial personalizado Plataforma de tutoría inteligente específica
S
SAMR · Nivel de integración tecnológica
¿En qué nivel integra la IA el proceso educativo?

Utiliza el marco SAMR (Puentedura) para situar la intervención en uno de cuatro niveles crecientes de transformación pedagógica. Permite valorar si la IA simplemente reemplaza una tarea existente o redefine completamente lo que es posible enseñar o evaluar.

Los 4 niveles SAMR
🔁 Sustitución — reemplaza sin cambio funcional ⬆️ Aumento — mejora con funcionalidad nueva 🔄 Modificación — rediseña la tarea 🚀 Redefinición — crea tareas imposibles antes

Ejemplos prácticos de aplicación

Sistema interactivo de entrevista a avatar digital para practicar diagnósticos
F
Form of AI
Procesamiento de Lenguaje Natural (NLP) — permite que la máquina comprenda las preguntas del estudiante y formule las respuestas del avatar.
A
AI Use Case
Simulador de Paciente Virtual — un entorno dinámico con avatar que reacciona en tiempo real a las preguntas del estudiante.
C
Context
Pregrado (UME) — estudiantes de medicina durante sus rotaciones clínicas.
E
Education Focus
Enseñanza y Evaluación — desarrollar y medir la recopilación de información, la generación de hipótesis y la justificación diagnóstica.
T
Technology
ChatGPT / CIRCSIM-Tutor — el sistema de NLP específico que impulsa la conversación con el avatar.
S
SAMR
Redefinición — crea bibliotecas masivas de casos y práctica interactiva ilimitada con feedback en tiempo real: imposible logística y económicamente solo con actores humanos.
Evaluación automatizada de habilidades quirúrgicas en cirugía mínimamente invasiva
F
Form of AI
Aprendizaje Profundo (Deep Learning) — modelos que procesan vídeo quirúrgico para analizar los movimientos del residente en tiempo real.
A
AI Use Case
Analítica de rendimiento — panel que dictamina el nivel de pericia (novato o experto) basándose en los movimientos registrados durante la intervención.
C
Context
Posgrado (GME) · Cirugía — residentes de cirugía en entorno de cirugía robótica o mínimamente invasiva.
E
Education Focus
Evaluación — medir y cuantificar objetivamente el dominio de habilidades psicomotoras quirúrgicas.
T
Technology
Software de analítica de vídeo en la nube — el sistema algorítmico específico que procesa y clasifica los movimientos del residente.
S
SAMR
Sustitución — la IA sustituye directamente al cirujano instructor que tradicionalmente debía estar presente observando y calificando cada movimiento.
Teoría de Oberg aplicada a la IA

El choque cultural en la integración de la IA

Los autores aplican la teoría del choque cultural de Oberg para explicar la respuesta emocional y conductual de los educadores médicos ante la IA. El proceso es individual y no siempre lineal. Toca cada tarjeta para explorar cada fase.

Fase 1 de 4 Toca la tarjeta para ver la descripción
Hoja de ruta ética y curricular

Desafíos éticos para el futuro

La literatura sintetizada en la BEME 84 señala cuatro pilares éticos y curriculares urgentes que el currículo médico debe integrar para preparar a los futuros médicos ante una práctica clínica mediada por IA.

01
Sesgos algorítmicos y equidad en salud
Los futuros clínicos deben comprender los sesgos inherentes en la IA aplicada a la salud, especialmente los causados por el entrenamiento con conjuntos de datos no representativos. Sin atención, la IA puede exacerbar disparidades y desigualdades en la atención médica. El currículo debe enseñar a reflexionar críticamente sobre los sesgos ocultos en las herramientas tecnológicas y la práctica clínica, y a diseñar sistemas que promuevan activamente la justicia y la equidad.
⚖️ Equidad · Sesgos · Justicia
02
Privacidad de datos y consentimiento informado
El uso de la IA en medicina exige una comprensión sólida de la privacidad de los datos, el manejo ético de la información del paciente y las dimensiones legales de la tecnología. Dado el gran número de bases de datos disponibles, la "desanonimización" (reidentificación) de datos de pacientes es altamente posible al cruzar información. Los estudiantes deben aprender a obtener consentimiento informado de forma transparente y discutir con los pacientes las implicaciones de la participación de la IA en sus decisiones de cuidado.
🔒 Privacidad · Consentimiento · Legal
03
Preservación del juicio humano y la "falsa seguridad"
Frente a la ilusión de infalibilidad de las máquinas, los clínicos deben ser cautelosos con el sesgo de automatización: la dependencia excesiva de la IA puede llevar a cometer errores médicos al aceptar sin criterio sus recomendaciones. La formación debe centrarse en preservar el razonamiento clínico, las habilidades de evaluación y las interacciones humanas que la IA no puede replicar, promoviendo un sistema de "inteligencia híbrida" donde el médico mantiene siempre la responsabilidad final.
🧠 Juicio clínico · Deskilling · Autonomía
04
Atención compasiva y prevención de la deshumanización
La educación ética debe garantizar que la IA complemente, y nunca reemplace, el papel del médico en la prestación de una atención compasiva. El elemento humano en la sanidad es irremplazable: los educadores médicos tienen la responsabilidad de asegurar que la tecnología mejore la relación médico-paciente, respete la autonomía del enfermo y prevenga la deshumanización del cuidado clínico. Los currículos deben demostrar mediante casos y modelos a seguir que la compasión y el juicio ético seguirán siendo el núcleo de la profesión.
❤️ Compasión · Relación médico-paciente · Humanismo
Fuente original

Referencia bibliográfica

Este recurso educativo está basado íntegramente en la Guía BEME N.º 84, publicada en Medical Teacher en 2024.

84

Gordon, M., Daniel, M., Ajiboye, A., Uraiby, H., Xu, N. Y., Bartlett, R., Hanson, J., Haas, M., Spadafore, M., Grafton-Clarke, C., Gasiea, R. Y., Michie, C., Corral, J., Kwan, B., Dolmans, D., & Thammasitboon, S. (2024). A scoping review of artificial intelligence in medical education: BEME Guide No. 84. Medical Teacher, 46(4), 446–470.

doi:10.1080/0142159X.2024.2314198