La utilidad de un LLM en diagnóstico no depende solo del modelo, sino de cómo se le pregunta. Este material ordena los principales tipos de prompts desde los más simples hasta los más complejos, y explica cuándo conviene consultar primero al clínico o al modelo, qué papel tiene la supervisión humana y por qué el RAG importa en preguntas de alto impacto clínico.
Un prompt no es solo una pregunta. Es la instrucción que organiza la tarea cognitiva que va a realizar el modelo. En clínica, cambiar el prompt puede alterar la calidad, la amplitud, la claridad y la seguridad de la respuesta.
Un mismo caso puede generar una salida superficial, una lista organizada, una explicación paso a paso o una revisión crítica según cómo se formule la instrucción. Aprender a escribir prompts es también aprender a dirigir el razonamiento del LLM.
Un prompt breve puede bastar para una consulta factual, pero será pobre para un caso incierto o complejo. Las estrategias más estructuradas mejoran la utilidad clínica, aunque a costa de mayor tiempo y mayor exigencia para quien las usa.
Los principales tipos de prompts pueden ordenarse desde los más intuitivos y rápidos hasta los que exigen más estructura, más vigilancia y más autonomía cognitiva por parte del estudiante.
Rápido e intuitivo, pero también el más vulnerable a respuestas genéricas y confirmatorias. Adecuado para consultas simples y factuales donde el riesgo de error es bajo y el tiempo disponible es escaso.
Obligan al modelo a organizar y explicar antes de concluir. Mejoran el rendimiento en viñetas largas y casos complejos, porque reducen el riesgo de que el modelo pase por alto datos enterrados en el texto.
Sirven menos para obtener una respuesta rápida y más para tensionar, revisar o poner a prueba el razonamiento del estudiante. Requieren que el estudiante haya pensado primero y tenga base suficiente para evaluar críticamente la respuesta del modelo.
Un buen prompt para resolver escenarios clínicos con un LLM tiene varias partes fundamentales. No siempre hacen falta todas, pero cuanto más clara sea la arquitectura de la instrucción, más útil y más controlable será la respuesta.
Cuanto más específico, mejor. No es lo mismo "eres un médico" que "eres un médico internista con experiencia en urgencias, habituado a razonar de forma sistemática y a comunicarte con estudiantes de medicina de segundo año". El rol no garantiza exactitud, pero orienta el tipo de respuesta que el modelo intentará producir.
Incluyes motivo de consulta, datos relevantes de la anamnesis, exploración y pruebas disponibles. Es el equivalente a la presentación del caso. Aquí defines qué sabe el modelo antes de responder y condicionas en gran medida la calidad de la salida.
Puedes pedirle que elabore un diagnóstico diferencial, redacte un plan de actuación, explique un concepto o genere preguntas de autoevaluación. Conviene ser concreto: "lista los tres diagnósticos más probables ordenados por urgencia" es mucho mejor que "dime qué puede tener".
No es igual responder para un estudiante de primer curso que para un residente o un especialista. Indicar la audiencia ayuda a modular la profundidad, el tipo de terminología y el tono didáctico. "Explícalo para un estudiante de primer año" y "usa terminología clínica estándar" producen salidas muy diferentes.
Puedes pedir prosa, listas, tablas, encabezados, una cadena de pensamiento, una longitud máxima o una estructura concreta. Si no lo indicas, el modelo elegirá por su cuenta. En clínica, dar forma a la salida mejora mucho la legibilidad y facilita la revisión crítica.
Puedes pedir que no incluya opciones diagnósticas raras sin justificación, que no use siglas sin explicarlas o que no asuma datos que no se le han dado. Esta parte es muy útil para limitar errores frecuentes del modelo y para reducir respuestas excesivamente especulativas.
Pulsa sobre cada tipo para ver su descripción, ventajas, límites, contexto ideal de uso y un ejemplo orientativo.
El estudiante proporciona el caso clínico en texto libre y solicita directamente un diagnóstico o diferencial sin ofrecer ninguna estructura previa, ejemplos ni instrucciones de formato.
Se fuerza a la IA a organizar y estructurar primero la información clínica antes de intentar diagnosticar. Esto imita el proceso de síntesis que realizan los médicos humanos y reduce el riesgo de que el modelo pase por alto datos enterrados en el texto.
Se instruye al modelo para que razone paso a paso y haga explícita su lógica antes de ofrecer una conclusión final. Es la estrategia más útil cuando el estudiante necesita ver cómo el modelo conecta los datos del caso.
Se pide al LLM que primero recupere teoría o guías sobre un síndrome o un síntoma y solo después aplique ese conocimiento al caso concreto.
Se solicita a la IA que se revise a sí misma, que actúe como revisor crítico de su propia salida o que vuelva a analizar el caso buscando contradicciones, diagnósticos omitidos o banderas rojas.
El estudiante formula primero su hipótesis y luego pide al LLM que adopte un papel pedagógico o adversarial para ponerla a prueba. Es una de las estrategias más recomendables para evitar aquiescencia y automatización.
Se pide al LLM que actúe como tutor de mecanismos biológicos. Su función no es dar el diagnóstico final, sino obligar al estudiante a demostrar que su hipótesis explica de forma causal y coherente el conjunto del caso.
No solo importa el tipo de prompt. También importa en qué momento se consulta al LLM y quién formula la primera hipótesis. Esta decisión cambia el riesgo de anclaje, aquiescencia y automatización.
El clínico piensa primero, formula su representación del problema y construye un diferencial inicial antes de consultar al LLM. Después usa la IA para ampliar, tensionar o revisar su razonamiento. Protege el esfuerzo cognitivo propio y reduce el anclaje sobre la primera salida del modelo.
El modelo formula primero las hipótesis y el clínico las revisa después. Puede ser útil para abrir posibilidades en casos muy atípicos o cuando se busca una segunda perspectiva inicial, pero aumenta el riesgo de sesgo de automatización, sobre todo en estudiantes o usuarios poco entrenados.
El clínico y el LLM generan de forma independiente un diferencial inicial y luego se comparan ambas salidas. Este modelo reduce la contaminación mutua de hipótesis y puede ser especialmente útil en casos complejos, aunque exige más tiempo y más disciplina cognitiva.
El LLM no se usa al inicio, sino al final de un primer ciclo diagnóstico, como herramienta de contraste. Sirve para revisar diagnósticos omitidos, pedir datos discordantes o actuar como revisor crítico antes de cerrar el caso.
Estas expresiones ayudan a pensar cuánto control mantiene el clínico sobre la salida del sistema.
El clínico permanece dentro del proceso: introduce el caso, revisa la salida, contrasta los errores y toma la decisión final. Es el modelo más seguro y el más apropiado para formación, porque la IA no sustituye el juicio humano sino que se integra en él.
El sistema actúa con bastante autonomía y el humano supervisa más a distancia que de forma activa. Puede tener sentido en tareas más protocolizadas o de bajo riesgo, pero es menos apropiado para razonamiento clínico abierto y diagnóstico diferencial complejo.
El humano queda fuera del circuito decisional o interviene demasiado tarde. En razonamiento clínico y diagnóstico diferencial este modelo no es aceptable como enfoque docente ni como práctica clínica segura, porque rompe el principio de validación crítica y desplaza indebidamente la responsabilidad.
No todos los sistemas de IA clínica funcionan igual. Un LLM generalista responde usando sobre todo lo que aprendió durante su entrenamiento previo. En cambio, un sistema con RAG añade un paso intermedio: antes de responder, busca información en fuentes externas y luego genera la respuesta a partir de esos documentos recuperados.
No se trata de usar siempre el prompt más complejo, sino el más adecuado para la incertidumbre del caso y para el objetivo docente del momento.
Lee el prompt del anverso e intenta identificar de qué tipo es y para qué es más útil antes de girar la tarjeta.
Tarjeta 1 de 6 Pulsa para girar · usa las flechas para navegarNo cambia al paciente, pero sí cambia cómo el LLM organiza, interpreta y devuelve la información. En ese sentido, escribir un buen prompt se parece a formular una buena pregunta clínica.
En estudiantes de medicina, el mejor prompt no es el que da la respuesta más rápida, sino el que obliga a pensar mejor. La finalidad docente no es solo obtener un diferencial, sino aprender a construirlo, revisarlo y justificarlo.
Estas referencias son útiles para entender qué comparó cada estudio y por qué resulta relevante para diseñar el uso docente y clínico de los prompts.