La escala Hamilton: por qué medimos mal la depresión (y por qué importa)
⏱️ Tiempo de lectura: 8 minutos | 🧠 Para: Terapeutas que acompañan personas medicadas
La paradoja de la medición
"Revisando los resultados de tu escala Hamilton, parece que el antidepresivo está funcionando bien. Has pasado de una puntuación de 26 a 18 en ocho semanas."
"Pero doctor, sigo sintiéndome igual de deprimida. Solo duermo mejor y he recuperado algo de apetito."
Este intercambio, que presencié durante una supervisión clínica, ilustra una paradoja frecuente en el tratamiento farmacológico de la depresión: una mejora en las puntuaciones de escalas estandarizadas que no corresponde con la experiencia subjetiva del paciente.
Esta discrepancia no es casualidad. Refleja un problema fundamental en cómo evaluamos la eficacia de los antidepresivos: las herramientas que utilizamos para medir la depresión podrían estar sesgadas hacia detectar precisamente los efectos que los medicamentos producen, no necesariamente los aspectos más significativos de la experiencia depresiva.
La escala Hamilton: origen y estructura
La Escala Hamilton para la Depresión (HAMD o HDRS) fue desarrollada por Max Hamilton en 1960. A pesar de su antigüedad y limitaciones reconocidas, sigue siendo la medida de resultado primaria en la gran mayoría de ensayos clínicos de antidepresivos, formando la base de evidencia para aprobaciones regulatorias y decisiones clínicas.
Estructura de la versión más común (HAMD-17):
La escala consta de 17 ítems, cada uno evaluado en una escala de gravedad, sumando una puntuación máxima posible de 52 puntos. Veamos su distribución:
Ítems relacionados con sueño: 3 ítems (6 puntos posibles).
Ítems somáticos/físicos: 6 ítems (16 puntos posibles).
Ítems de ansiedad: 2 ítems (8 puntos posibles).
Humor deprimido: 1 ítem (4 puntos posibles).
Ideas/intentos suicidas: 1 ítem (4 puntos posibles).
Otros síntomas psicológicos: 4 ítems (14 puntos posibles).
Este desglose revela una realidad sorprendente: más del 40% de la puntuación total se basa en síntomas somáticos y problemas de sueño, mientras que el estado de ánimo deprimido (supuestamente el síntoma central de la depresión) representa menos del 8% de la puntuación total.
El problema de medir lo que cambia, no lo que importa
👎 Creencia común: La Escala Hamilton es una medida válida y completa de la severidad de la depresión y su mejora con tratamiento.
👍 Evidencia actual: La escala presenta problemas fundamentales que comprometen su validez como medida primaria:
Sobrerrepresentación de síntomas somáticos:
Aproximadamente el 40% de la puntuación está basada en síntomas físicos y sueño.
Estos síntomas son precisamente los más sensibles a los efectos farmacológicos directos de los antidepresivos (independientemente de su impacto en el estado de ánimo).
Infrarrepresentación de síntomas centrales:
El estado de ánimo deprimido representa solo 4 de 52 puntos posibles (8%).
Anhedonia y pérdida de interés (síntomas cardinales según DSM-5) están subrepresentados.
Ideación suicida recibe solo un ítem (4 puntos), a pesar de ser el síntoma más grave.
Sensibilidad a efectos secundarios de medicamentos:
Los efectos sedantes mejoran puntuaciones de sueño (6 puntos).
Efectos en apetito puntúan positivamente independientemente de su relación con mejora anímica.
La activación psicomotora (efecto secundario común) puede interpretarse como mejoría.
Inconsistencia con experiencia subjetiva:
Estudios como el de Zimmerman et al. (2012) muestran discrepancias significativas entre mejoras en HAMD y evaluaciones subjetivas de pacientes.
No captura adecuadamente aspectos como autoestima, sentido de propósito o conexión social.
El tamaño de efecto reinterpretado
Las implicaciones de estos problemas metodológicos son profundas:
👎 Creencia común: Una reducción de 3-4 puntos en la escala Hamilton representa una mejora clínicamente significativa en depresión.
👍 Evidencia actual: El significado clínico de estas reducciones es cuestionable:
El umbral de significación clínica:
NICE (Reino Unido) establece que una reducción de al menos 3 puntos constituye el umbral mínimo de significación clínica.
Estudios de pacientes como Zimmerman et al. establecen que se requieren cambios de al menos 7-8 puntos para que los pacientes perciban mejoría significativa.
El contexto del efecto placebo:
El placebo típicamente produce reducciones de 8-9 puntos en la HAMD.
Los antidepresivos producen reducciones de 10-11 puntos en promedio.
La diferencia real fármaco-placebo es aproximadamente 1.8-2.5 puntos.
Componentes del cambio:
Análisis de componentes por Moncrieff y Cohen (2006) muestran que aproximadamente el 80% de la mejora en puntuaciones HAMD con antidepresivos proviene de ítems de sueño, ansiedad y síntomas somáticos.
Los ítems específicamente relacionados con estado de ánimo y anhedonia muestran cambios mínimos en comparación con placebo.
Mediciones alternativas: lo que perdemos de vista
La dependencia excesiva de la HAMD ha llevado a ignorar aspectos cruciales de la recuperación:
Funcionamiento y calidad de vida:
Las medidas de funcionamiento social, ocupacional y familiar rara vez son resultados primarios en ensayos.
Cuando se incluyen, generalmente muestran diferencias menores entre medicación y placebo.
Recuperación sostenida:
La HAMD captura cambios a corto plazo (6-8 semanas) pero no predice mantenimiento de beneficios.
Estudios naturalísticos (STAR*D) muestran discrepancias entre respuesta inicial y recuperación a largo plazo.
Experiencia subjetiva:
La escala no captura adecuadamente cambios en sentido de propósito, conexión o disfrute.
No distingue entre mejora genuina del estado de ánimo y simple reducción de síntomas físicos o ansiedad.
Efectos adversos no considerados:
La HAMD no resta puntos por efectos adversos que pueden deteriorar calidad de vida.
Efectos como disfunción sexual, embotamiento emocional o aumento de peso no se contabilizan.
Aplicación práctica: evaluación holística en nuestra práctica
Como terapeutas, podemos complementar las evaluaciones estándar con aproximaciones más holísticas:
1. En lugar de preguntar: "¿Ha mejorado tu sueño e apetito con la medicación?"
Prueba esto: "Además de cambios en sueño y apetito, ¿has notado cambios en tu capacidad para sentir interés o placer en actividades? ¿Ha cambiado tu sentido de esperanza o tu conexión con otros?"
2. En lugar de decir: "La reducción en tu puntuación Hamilton sugiere que el medicamento está funcionando."
Prueba esto: "Las puntuaciones en escalas pueden mejorar por diversos motivos. ¿Tú sientes que hay una mejora significativa en aspectos importantes para ti, o solo en ciertos síntomas específicos?"
3. En lugar de enfocarte en: "Reducción de síntomas según escalas."
Considera también: "Recuperación de funcionamiento, propósito y conexión en áreas significativas para la persona."
Herramientas complementarias para evaluación integral
Para enriquecer nuestra evaluación clínica, podemos incorporar:
Evaluación funcional estructurada:
Áreas específicas de funcionamiento (trabajo, relaciones, autocuidado).
Capacidad para experimentar placer y significado (no solo ausencia de dolor).
Restauración de propósito y agencia.
Monitorización de efectos adversos:
Embotamiento emocional (usando escalas como Oxford Questionnaire on the Emotional Side-Effects of Antidepressants).
Disfunción sexual (frecuentemente no reportada espontáneamente).
Síntomas de activación o agitación enmascarados como "mejoría".
Escala de impresión global de cambio:
Evaluación del paciente sobre cambio significativo (no solo estadístico).
Juicio holístico sobre si los beneficios superan los costos.
Valoración de si el cambio cumple sus expectativas personales.
IMPLICACIONES PARA DECISIONES DE TRATAMIENTO
Comprender las limitaciones de nuestras herramientas de medición tiene importantes implicaciones prácticas:
Interpretar con cautela afirmaciones de eficacia:
La "significación estadística" en ensayos clínicos puede no traducirse en mejora clínicamente relevante.
Las diferencias pequeñas en escalas somáticamente cargadas pueden sobreestimar el beneficio real.
Valorar la perspectiva subjetiva:
La experiencia reportada por el paciente sobre su mejora es fundamental.
Discrepancias entre medidas "objetivas" y experiencia subjetiva merecen seria consideración.
Decisiones de continuación/discontinuación:
Basar decisiones en mejora funcional y subjetiva, no solo en puntuaciones.
Considerar cuidadosamente el mantenimiento a largo plazo si solo han mejorado síntomas físicos.
Comunicación con prescriptores:
Compartir observaciones sobre funcionamiento y calidad de vida que complementen evaluaciones estandarizadas.
Documentar aspectos de la experiencia del paciente no capturados en escalas.
Preguntas para reflexionar
¿Cómo podrías integrar evaluaciones más holísticas en tu práctica clínica para complementar las medidas estandarizadas que utilizan los prescriptores?
¿De qué manera el conocimiento sobre las limitaciones de las escalas influye en cómo interpretas los reportes de ensayos clínicos y las decisiones de tratamiento?
¿Cómo explicarías a un paciente la discrepancia entre una "mejora" en puntuaciones y su experiencia subjetiva sin socavar la confianza en el tratamiento?
Para profundizar
Lectura accesible: "The Emperor's New Drugs: Exploding the Antidepressant Myth" - Irving Kirsch
Artículo científico: "What does the HAMD mean?" - Leuch et al. (2004), Journal of Affective Disorders
💡 En la próxima edición
Exploraremos el fenómeno de la supersensibilización de receptores: el mecanismo neurobiológico que explica por qué muchos síntomas que aparecen tras discontinuar antipsicóticos no representan "recaídas" sino efectos directos de los cambios cerebrales inducidos por el medicamento.
Furor Medicandi existe para apoyar a terapeutas que acompañan a pacientes en tratamiento farmacológico. Si encontraste útil esta información, considera compartirla con colegas que podrían beneficiarse.