Prompt engineering para equipos de HEOR: casos de uso reales y límites éticos en 2026

La IA generativa ya entró a HEOR. ISPOR publicó su taxonomía, sus reporting guidelines y NICE su position statement. Esta es la guía práctica de qué puedes hacer hoy, qué no, y dónde están las líneas rojas.

Autores

La IA generativa ya entró a HEOR. ISPOR publicó su taxonomía, sus reporting guidelines y NICE su position statement. Esta es la guía práctica de qué puedes hacer hoy, qué no, y dónde están las líneas rojas.


A inicios de 2024, la mayoría de los equipos de HEOR todavía discutía si usar ChatGPT para una revisión sistemática era buena idea. A mediados de 2026, la conversación es otra: cuáles técnicas de prompt engineering producen resultados defendibles, cómo documentar el proceso para que un evaluador lo acepte, y dónde están los límites éticos que ningún equipo profesional debería cruzar.

Este artículo es la guía operativa para equipos de HEOR que ya están usando IA generativa o están por empezar. Está basada en los reportes oficiales del ISPOR Working Group on Generative AI y en el position statement de NICE, no en opinión.

1. El estado del campo en 2026

El ISPOR Working Group on Generative AI ha publicado tres documentos centrales que definen el campo:

  • Taxonomía de IA generativa en HEOR (Fleurence et al., Value in Health, 2025): el marco de referencia conceptual.
  • GenAI para HTA: oportunidades, retos y consideraciones de política (Fleurence et al., Value in Health, 2025): el position document para agencias evaluadoras.
  • ELEVATE-GenAI: reporting guidelines para uso de LLMs en HEOR (ISPOR Working Group, Value in Health, 2025): el estándar para reportar uso de IA en publicaciones y dossiers.

NICE publicó en agosto de 2024 el Position Statement ECD11 sobre uso de IA en generación de evidencia, la primera agencia HTA de referencia global con una postura pública.

Tres conclusiones convergentes:

  1. La IA generativa puede transformar HEOR aumentando eficiencia y precisión.
  2. No es aún confiable para uso autónomo. Debe aumentar, no reemplazar, la experiencia humana.
  3. El prompt engineering, la retrieval-augmented generation y la validación humana son las técnicas centrales para mejorar precisión y dependencia.

2. Casos de uso reales y validados en HEOR

Según la taxonomía del ISPOR Working Group, las aplicaciones de IA generativa con mayor evidencia de utilidad en HEOR son:

Revisiones sistemáticas de literatura. Screening de abstracts, clasificación de estudios, extracción de datos asistida. Hay estudios publicados con tasas de precisión razonables cuando se combinan con validación humana. NICE acepta explícitamente este uso.

Procesamiento de evidencia de mundo real. Transformación de datos no estructurados (notas clínicas, registros heterogéneos) en variables analizables. Integración de fuentes diversas.

Modelado económico. Generación de código, replicación de modelos existentes, análisis de sensibilidad asistido. Hay literatura emergente sobre generación de modelos conceptuales con LLMs (Chhatwal et al., presentado en ISPOR 2024).

Desarrollo de dossiers y value stories. Estructuración de argumentos, adaptación de narrativas a audiencias específicas, traducción técnica.

Análisis de redes de comparaciones indirectas. Cuatro estudios de caso publicados en PharmacoEconomics Open (2024) sobre automatización parcial de network meta-analyses.

Para cada uno de estos casos, el principio central es el mismo: la IA reduce el tiempo y aumenta la cobertura, pero la validación humana experta es no negociable.

3. Las técnicas de prompt engineering que producen resultados defendibles

El taxonomy paper de ISPOR (Fleurence et al., 2025) identifica las técnicas con mayor evidencia de impacto en precisión y confiabilidad:

Zero-shot prompting. Pedirle al modelo que ejecute una tarea sin ejemplos previos. Útil para tareas simples y bien definidas. Limitado para tareas complejas donde la variabilidad de output es alta.

Few-shot prompting. Incluir 2 a 5 ejemplos de input-output esperado en el prompt. Aumenta significativamente la precisión en tareas estructuradas (extracción de datos, clasificación de estudios, formateo de tablas).

Chain-of-thought prompting. Pedirle al modelo que muestre su razonamiento paso a paso antes de dar la respuesta final. Especialmente útil para razonamiento metodológico, decisiones de inclusión/exclusión en revisiones, y verificación de cálculos.

Persona pattern prompting. Asignar al modelo un rol específico (“actúa como un evaluador HTA con experiencia en oncología latinoamericana”). Mejora consistencia y tono en outputs orientados a audiencias específicas.

Retrieval-augmented generation (RAG). Conectar el modelo a una base de conocimiento específica (literatura, guías metodológicas, registros internos) para que sus respuestas estén ancladas en fuentes verificables. Es la técnica más recomendada para uso en HEOR profesional porque reduce alucinaciones y permite trazabilidad.

Fine-tuning de modelos. Entrenar un modelo base con datos específicos del dominio. Útil para tareas repetitivas a escala, pero requiere recursos técnicos y datos de calidad.

Para un equipo de HEOR, la combinación recomendada es: persona pattern + few-shot + chain-of-thought + RAG con base de literatura validada. Esto produce outputs trazables, reproducibles y defendibles.

4. Los límites éticos no negociables

El position statement de NICE y los reportes del ISPOR Working Group convergen en cuatro principios éticos no negociables:

Supervisión humana experta. El principio del “humano competente e informado en el proceso” es central. La IA no toma decisiones, asiste el juicio experto. Un modelo económico generado por IA sin supervisión metodológica de un experto en HEOR no es evidencia defendible.

Transparencia y documentación. El usuario debe documentar qué herramienta usó, con qué prompt, sobre qué datos, con qué validación. Las reporting guidelines ELEVATE-GenAI especifican los elementos mínimos para un reporte profesional.

Validación y replicabilidad. Los outputs de IA deben ser verificables. Si una afirmación clínica viene de un LLM, debe poder rastrearse a las fuentes originales. Si un cálculo viene de un modelo, debe poder reproducirse.

No autonomía en decisiones clínicas o de cobertura. La IA no puede ser el agente final de una decisión sobre tratamiento de un paciente o cobertura de un medicamento. Esa decisión es humana, informada por IA, no automatizada por IA.

NICE específicamente no acepta evidencia generada con IA como dato principal cuando existen alternativas metodológicas establecidas, ni estimaciones de efectos comparativos basadas solo en IA sin triangulación con evidencia clínica.

5. Los riesgos que tu equipo debe conocer y mitigar

Los reportes del ISPOR Working Group identifican explícitamente los riesgos a manejar:

Validez científica y confiabilidad. Los LLMs pueden generar texto convincente pero metodológicamente incorrecto. Una afirmación sobre eficacia comparativa puede sonar bien y ser falsa.

Sesgo y equidad. Los modelos entrenados con literatura predominantemente angloparlante pueden subrepresentar contextos latinoamericanos, africanos o asiáticos. Esto sesga revisiones, value stories y modelos.

Alucinaciones. Generación de citas, datos o referencias inexistentes. Es el riesgo más conocido y el más fácil de detectar si hay validación.

Despliegue operativo. Integración en flujos de trabajo, gestión de versiones del modelo, manejo de información confidencial de pacientes o de la compañía.

Deriva del modelo. Los modelos cambian con cada versión. Un prompt que funcionaba en una versión puede dar resultados distintos en la siguiente. La documentación de versión es esencial.

6. Cómo se ve un flujo de trabajo profesional con IA en HEOR

Un equipo de HEOR usando IA generativa en 2026 debería operar así:

  1. Tarea definida con claridad metodológica. Antes del prompt, el experto define qué pregunta se está respondiendo, con qué criterios, sobre qué evidencia.
  2. Selección de técnica de prompt apropiada. Few-shot para extracción estructurada, chain-of-thought para razonamiento, RAG para anclar en fuentes específicas.
  3. Ejecución y captura de output. Con documentación de herramienta, versión, prompt y fecha.
  4. Validación humana experta. Revisión metodológica del output, verificación de fuentes, triangulación con evidencia conocida.
  5. Reporte conforme a ELEVATE-GenAI. Si el resultado va a una publicación, dossier o submission, el reporte sigue el estándar ISPOR.

Este flujo no es teórico. Es lo que está empezando a aplicarse en submissions reales ante NICE y lo que empezará a aplicarse en CONITEC e IETS en los próximos años.

Cómo lo resolvemos en Quantus

En Quantus, los flujos de trabajo de IA generativa en HEOR están integrados desde el diseño: prompt engineering con persona pattern y few-shot, retrieval-augmented generation anclada en literatura validada, validación humana experta por nuestro equipo HEOR, y reporte conforme a ELEVATE-GenAI cuando aplica. La IA no reemplaza al experto, lo acelera con trazabilidad.

Si tu equipo está integrando IA en HEOR y quiere hacerlo bien desde el inicio, escríbenos aquí –> www.getquantus.ai


Referencias

[1] Fleurence RL, Wang X, Bian J, et al. A Taxonomy of Generative Artificial Intelligence in Health Economics and Outcomes Research: An ISPOR Working Group Report. Value in Health. 2025;28(11):1601-1610. doi:10.1016/j.jval.2025.04.2167

[2] Fleurence RL, Bian J, Wang X, et al. Generative Artificial Intelligence for Health Technology Assessment: Opportunities, Challenges, and Policy Considerations: An ISPOR Working Group Report. Value in Health. 2025;28(2):175-183. doi:10.1016/j.jval.2024.10.3846

[3] ELEVATE-GenAI: Reporting Guidelines for the Use of Large Language Models in Health Economics and Outcomes Research: An ISPOR Working Group Report. Value in Health. 2025. Disponible en: valueinhealthjournal.com

[4] NICE. Use of AI in evidence generation: NICE position statement (ECD11). Agosto 2024. Disponible en: nice.org.uk/corporate/ecd11

[5] Macia G, Ray J. Artificial intelligence in HEOR. Value & Outcomes Spotlight. 2024;10(2):33-35.

[6] ISPOR. 2024-2025 Top 10 HEOR Trends Report. Disponible en: ispor.org/heor-resources/top-10-heor-trends

Otras publicaciones

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *