EduMed · UVa
Unidad de Educación Médica · Universidad de Valladolid
Conceptos Básicos · 2026
Modelo de Kirkpatrick:
¿qué estamos evaluando realmente?
Kirkpatrick no evalúa lo que el alumno sabe, sino qué impacto tiene la formación. Va de lo inmediato a lo clínicamente relevante.
📊 Evaluación del impacto 4 niveles Kirkpatrick × Bloom Conceptos básicos · 2026
Innovando en educación médica
La pregunta no es si los alumnos aprendieron algo. La pregunta es si la formación cambió algo que importa.
🧭 ¿Qué es el modelo de Kirkpatrick?

Donald Kirkpatrick propuso en 1959 un modelo para evaluar la eficacia de los programas formativos. La idea central es sencilla pero poderosa: la evaluación no debería limitarse a medir la satisfacción del alumno o lo que sabe al acabar el curso. Lo que realmente importa es si esa formación cambia algo en la práctica real y, en último término, si mejora los resultados.

El modelo organiza la evaluación en cuatro niveles progresivos, desde lo más inmediato y fácil de medir hasta lo más relevante y difícil de demostrar.

🪜 La escalera de Kirkpatrick · Lectura rápida
⬆ más difícil de demostrar
⬇ más fácil de medir
4
Resultados
Mejoría de resultados en el paciente
3
Conducta
Lo hago en la práctica
2
Aprendizaje
He aprendido algo
1
Reacción
Me gusta
⚠️ El error más común

Mucha educación médica se queda en los niveles 1 y 2: medimos si la sesión gustó y si el alumno aprobó el test. Pero eso no nos dice si algo cambió en la práctica clínica ni si mejoró la atención al paciente.

🎯 El verdadero reto

Diseñar experiencias formativas que lleguen al nivel 3 (cambio de conducta) y al nivel 4 (impacto clínico) requiere alinear objetivos, metodología y evaluación desde el principio — no añadirlos al final.

Cada nivel responde a una pregunta diferente. Y cada pregunta exige un instrumento de evaluación distinto.
Nivel 1
😊 Reacción — ¿Les ha gustado?
Mide la satisfacción del alumno con la experiencia formativa
¿Qué evalúa?
Si la sesión resultó útil, interesante y bien organizada. Es la percepción subjetiva del alumno sobre la calidad de la formación recibida.
📋 Encuesta de satisfacción ⭐ Valoración numérica 💬 Comentarios abiertos
Ejemplo en medicina
Tras un taller de exploración cardiaca, los estudiantes valoran si les ha resultado claro, útil o motivador mediante una encuesta anónima al finalizar.
💡 El nivel más fácil… y el más engañoso. Una clase puede gustar mucho y enseñar poco. La satisfacción no es sinónimo de aprendizaje.
Nivel 2
🧠 Aprendizaje — ¿Han aprendido?
Mide conocimientos, habilidades o actitudes adquiridas
¿Qué evalúa?
Lo que el alumno sabe, sabe hacer o valora de forma diferente tras la formación, en un entorno controlado.
📝 Test de conocimientos 🏥 OSCE / ECOE 🤖 Simulación clínica 📊 Pre-post
Ejemplo en medicina
El estudiante identifica correctamente un soplo sistólico o realiza una anamnesis estructurada en un paciente simulado durante la evaluación.
💡 Aquí es donde solemos quedarnos… pero no es suficiente. Saber en el examen no garantiza hacer en la práctica.
Nivel 3
🔄 Conducta — ¿Lo aplican?
Mide si el aprendizaje cambia la práctica real
¿Qué evalúa?
Si el alumno transfiere lo aprendido a su entorno clínico real y si cambia su forma de actuar con los pacientes.
👁️ Observación directa 📁 Portafolio clínico 🩺 Mini-CEX 👥 Feedback de supervisores
Ejemplo en medicina
Tras la formación, el estudiante o residente explora sistemáticamente el pulso venoso yugular en planta, cuando antes no lo hacía. El cambio es observable y consistente.
💡 Este es el gran salto: del aula al paciente. Requiere tiempo, entorno favorable y supervisión real.
Nivel 4
🏥 Resultados — ¿Mejora algo importante?
Mide el impacto en resultados clínicos o del sistema
¿Qué evalúa?
El impacto final de la formación en indicadores de calidad asistencial, seguridad del paciente o resultados en salud medibles.
📉 Indicadores clínicos 📊 Auditoría 🔬 Investigación educativa 💊 Outcomes de pacientes
Ejemplo en medicina
Después de un programa de formación en sepsis: ↓ tiempo a antibiótico, ↓ mortalidad, ↓ ingresos en UCI. El impacto es medible en el sistema sanitario.
💡 Este es el nivel que realmente importa… pero el más difícil de demostrar. Requiere diseño riguroso y seguimiento a largo plazo.
Kirkpatrick te dice qué impacto tiene la formación. Bloom te dice qué tipo de pensamiento estás activando. Cuando los cruzas, aparece algo muy útil para diseñar docencia clínica.
🔀 ¿Por qué cruzar los dos modelos?

Ambos modelos se complementan: Bloom describe el nivel cognitivo que activamos en el alumno (desde recordar hasta crear), mientras que Kirkpatrick describe el impacto que eso tiene en la práctica y en los resultados clínicos. Cruzarlos permite preguntarse no solo qué enseñamos, sino qué tipo de pensamiento estamos activando y si ese pensamiento llega a traducirse en acción.

📊 Tabla cruzada Kirkpatrick × Bloom
Kirkpatrick Pregunta clave Bloom dominante Ejemplo clínico Interpretación
😊 Nivel 1
Reacción
¿Me gusta?
Recordar · Comprender
Clase dinámica sobre insuficiencia cardiaca muy bien valorada porque «se entiende bien». Puedes tener buena reacción con niveles cognitivos bajos. Riesgo: confundir claridad con aprendizaje profundo.
🧠 Nivel 2
Aprendizaje
¿Aprendo?
Comprender · Aplicar
(a veces Analizar)
El alumno explica la fisiopatología de la sepsis y aplica criterios diagnósticos en un caso clínico. Aquí empieza el aprendizaje real, pero todavía en entorno controlado.
🔄 Nivel 3
Conducta
¿Lo hago?
Aplicar · Analizar · Evaluar
En planta, el estudiante prioriza diagnósticos diferenciales, ajusta la anamnesis según el contexto y decide qué explorar y qué no. Aquí aparece el razonamiento clínico auténtico.
🏥 Nivel 4
Resultados
¿Impacta?
Evaluar · Crear
Un equipo rediseña un protocolo de manejo de sepsis, detecta fallos del sistema e implementa mejoras que reducen mortalidad. Este nivel implica no solo pensar bien, sino cambiar sistemas y generar soluciones nuevas.
💡 Lo que revela el cruce
😊➡️🧠
Reacción ≠ Aprendizaje
Una clase muy satisfactoria puede moverse solo en Bloom 1–2. La claridad no garantiza profundidad cognitiva.
🧠➡️🔄
Aprender ≠ Cambiar
Superar un examen (Kirkpatrick 2) no garantiza transferencia a la práctica real (Kirkpatrick 3).
🔄➡️🏥
Cambiar ≠ Mejorar
Un cambio de conducta no mejora resultados automáticamente si no está bien diseñado e implementado.
La enseñanza potente en medicina es la que alinea Bloom alto + Kirkpatrick 3–4.
🎯 El mensaje clave para el docente
❌ No todo lo que gusta enseña El aprendizaje profundo a veces genera incomodidad. La dificultad deseable (Bjork) es parte del proceso. Una sesión muy valorada puede moverse solo en Bloom 1–2.
❌ No todo lo que se evalúa cambia Aprobar un examen de conocimientos (Kirkpatrick 2) no garantiza que el alumno actúe diferente en planta (Kirkpatrick 3). El salto requiere diseño explícito.
❌ No todo cambio mejora resultados Un cambio de conducta sin coherencia sistémica ni seguimiento no necesariamente mejora la atención al paciente (Kirkpatrick 4).
✅ La enseñanza potente alinea Bloom alto + Kirkpatrick 3–4. Activa Analizar, Evaluar y Crear (Bloom 4–6) y diseña experiencias que transfieren al entorno clínico real y generan impacto medible.
🪞 Preguntas para la autoevaluación docente
📋
¿En qué nivel evalúo?
¿Mi evaluación se limita a la satisfacción y al conocimiento, o mide cambios reales de conducta?
🔄
¿Diseño para la transferencia?
¿Hay algo en mi programa que favorezca que lo aprendido llegue al paciente real?
📊
¿Mido el impacto?
¿Tengo indicadores de resultado clínico ligados a mi formación, o solo datos de satisfacción?
🎯
¿Alineo objetivos y evaluación?
¿El nivel de Kirkpatrick que me importa está alineado con el nivel de Bloom que trabajo en el aula?
¿Evalúo en el momento adecuado?
El Kirkpatrick 3–4 no puede medirse al acabar la sesión. ¿Tengo mecanismos de seguimiento a largo plazo?
🏥
¿El entorno facilita el cambio?
¿El contexto clínico donde el alumno practica refuerza lo aprendido o lo contradice?
🔗 Conexión con otros recursos EduMed.UVa
🧠 Taxonomía de Bloom Bloom describe el nivel cognitivo que activas. Cruzarlo con Kirkpatrick te ayuda a saber si ese nivel cognitivo tiene impacto real. Ver recurso →
📓 Cuaderno 2 · Clase magistral La clase magistral cubre bien Kirkpatrick 1–2. Las 5 Aes ayudan a llegar al nivel 3 desde el propio formato expositivo. Ver cuaderno →
📋 Rúbricas Una rúbrica bien diseñada, alineada con Bloom y Kirkpatrick, puede llegar a evaluar Kirkpatrick 3 de forma sistemática. Ver recurso →
🤔 ¿Lo has entendido de verdad?

Al final de la página encontrarás la sección «¿Lo entendí?» con preguntas diseñadas para comprobar si realmente has integrado el modelo — no si lo has memorizado. No tienen respuesta fácil: están pensadas para discutirlas con compañeros o explorarlas con un LLM en modo socrático.

Saber que Kirkpatrick tiene 4 niveles es nivel 1 de Bloom. Saber por qué tu programa formativo nunca llega al nivel 3 — y qué harías para cambiarlo — es nivel 5.
🤔 ¿Cómo usar esta sección?

Las preguntas que siguen no tienen una respuesta única ni están pensadas para responderse en solitario en dos minutos. Están diseñadas para revelar si has integrado el modelo — o solo lo has leído.

👥 Con compañeros
Discútelas en grupo. Las mejores respuestas surgirán del desacuerdo. Si todos estáis de acuerdo de inmediato, no las habéis pensado suficientemente bien.
🤖 Con un LLM en modo socrático
Dile: «Actúa como un tutor socrático. No me des la respuesta, ayúdame a pensar.»
📊 Sobre los 4 niveles
Pregunta 1
Un taller de comunicación médico-paciente recibe puntuaciones de satisfacción altísimas (Kirkpatrick 1) y los estudiantes demuestran mejoras claras en la evaluación post-taller (Kirkpatrick 2). Sin embargo, en las prácticas clínicas nadie observa cambios en cómo se comunican con los pacientes reales. ¿Qué puede estar fallando? ¿Qué cambiarías en el diseño del taller?
Pregunta 2
El nivel 4 de Kirkpatrick (impacto clínico) es el más relevante pero el más difícil de demostrar. ¿Qué obstáculos concretos —metodológicos, institucionales, temporales— dificultan medirlo en educación médica de grado? ¿Es razonable exigirlo siempre?
🔀 Sobre Kirkpatrick × Bloom
Pregunta 3
¿Es posible alcanzar el nivel 3 de Kirkpatrick (cambio de conducta) si la formación se mueve solo en los niveles 1 y 2 de Bloom (recordar y comprender)? Argumenta tu respuesta con un ejemplo clínico concreto.
Pregunta 4
Una clase magistral muy bien valorada (Kirkpatrick 1) y que genera aprendizaje demostrable (Kirkpatrick 2) puede operar solo en Bloom 1–2. ¿Cómo rediseñarías esa misma clase para que active Bloom 4–5 sin perder la satisfacción del estudiante?
🔗 Preguntas integradoras

Estas preguntas exigen conectar Kirkpatrick con otros marcos y con decisiones docentes reales.

Pregunta 5
Diseña un sistema de evaluación para un bloque de prácticas clínicas de 3º de medicina que llegue al menos al nivel 3 de Kirkpatrick. ¿Qué instrumentos usarías? ¿Cuándo evaluarías? ¿Qué recursos necesitas que probablemente no tienes ahora?
Pregunta 6
Kirkpatrick mide el impacto de la formación, pero no dice nada sobre cómo producirlo. ¿Qué marcos de los que has estudiado en EduMed.UVa (Bloom, Miller, práctica deliberada, Kolb…) completarían el modelo de Kirkpatrick para tener una visión completa del diseño formativo?
💬 Prompt sugerido para trabajar estas preguntas con un LLM
«Actúa como un tutor socrático experto en educación médica. Voy a compartirte mi respuesta a una pregunta sobre el modelo de Kirkpatrick. No me des la respuesta correcta. Hazme preguntas que me ayuden a identificar los puntos débiles de mi razonamiento y a profundizar en mi comprensión. Empieza cuando yo te comparta mi respuesta.»