El ensayo SUMMIT obtuvo resultados positivos y se anunció con titulares entusiastas, pero su diseño fue curiosamente débil.
En la reunión de la Asociación Americana de Cardiología (AHA) de noviembre de 2024, el Dr. Milton Packer presentó resultados positivos del ensayo SUMMIT, en el que se comparó el tratamiento con tirzepatide (Zepbound) con placebo en pacientes obesos con insuficiencia cardíaca y fracción de eyección preservada (ICFEp) [1].
Sus resultados positivos fueron noticia. Al menos 57 organizaciones de noticias cubrieron el estudio. Los expertos lo tildaron de “cambio en la práctica clínica”. Si esto fuera cierto, sería una gran cosa, porque la obesidad y la ICFEp son muy frecuentes.
Sin embargo, el ensayo está muy lejos de cambiar la práctica. Y es bastante sorprendente que los expertos digan estas cosas sobre él.
Breves antecedentes
En los viejos tiempos, la mayoría de las insuficiencias cardíacas se debían a que la capacidad de bombeo del corazón era débil. Lo llamamos insuficiencia cardíaca con fracción de eyección reducida (ICFEr). Ahora, la mayoría de las insuficiencias cardíacas se deben a un corazón rígido que bombea bien pero no se relaja por completo. Esto es ICFEp. Los pacientes con ICFEp suelen tener otros problemas de salud, como envejecimiento, diabetes, hipertensión y obesidad.
Tratar la ICFEp es mucho más difícil que tratar la ICFEr. Estos últimos suelen tener un problema (el corazón débil) y tenemos medicamentos que ayudan. El paciente con un corazón rígido suele tener múltiples problemas no cardíacos que complican el tratamiento. Además, no hay medicamentos que “relajen” el músculo cardíaco.
El ensayo
Se asignó aleatoriamente a un total de 731 pacientes para recibir tirzepatida o placebo.
Los investigadores eligieron dos criterios de valoración coprimarios. El primero fue una combinación de muerte cardiovascular (CV) y empeoramiento de eventos de insuficiencia cardíaca, que podría consistir en una hospitalización por insuficiencia cardíaca, una visita para recibir diuréticos intravenosos o intensificación de los diuréticos orales. El segundo criterio de valoración coprimario fue un cambio en un cuestionario de calidad de vida, autoinformado por el paciente al cabo de un año.
Los pacientes tenían una edad promedio de 65 años, el 55% eran mujeres, el índice de masa corporal promedio fue de 38.
Resultados
El resultado primario de muerte CV y primer evento de insuficiencia cardíaca ocurrió en 36 pacientes (9,9%) en el grupo tirzepatida y 56 pacientes (15,3%) en el grupo control, con un cociente de riesgo de 0,62 (IC del 95%, 0,41-0,95; P = 0,026).
La reducción del riesgo absoluto del 5,4% en el criterio de valoración primario fue completamente impulsado por tasas más bajas de eventos de insuficiencia cardíaca (8% frente a 14,2%). La muerte CV fue en realidad más alta en el grupo tirzepatida, pero el número de muertes fue bajo en ambos grupos (8 frente a 5).
La tasa de hospitalizaciones debido a insuficiencia cardíaca fue menor con tirzepatida (3,3% frente a 7,1%), al igual que la intensificación de diuréticos orales (4,7% frente a 5,7%).
El segundo criterio de valoración coprimario, el cambio con respecto a la calidad de vida inicial favoreció a la tirzepatida.
Otros criterios de valoración secundarios también favorecieron a la tirzepatida: mayor distancia recorrida en caminatas de 6 minutos, mayor cambio en el peso corporal (-11,6 %) y niveles más bajos de proteína C reactiva de alta sensibilidad y presión arterial sistólica (-4,7 mm Hg).
Comentarios:
Parece positivo, ¿no? Los valores P muestran significancia estadística. Hay menos eventos de insuficiencia cardiaca. La calidad de vida es mejor.
El investigador principal, el Dr. Packer, dijo que la tirzepatida “cambió la trayectoria clínica de la enfermedad”. Otra experta, Jennifer Ho, profesora adjunta de medicina en la Facultad de Medicina de Harvard, Boston, Massachusetts, dijo: “Este es realmente un ensayo que cambia la práctica y consolida este tipo de terapia como una de las piedras angulares del tratamiento de la obesidad y la ICFEp”.
Tengo muchas preocupaciones:
Problema uno: cuando se dice que algo modifica la enfermedad, eso significa una reducción en los resultados robustos libres de sesgo, como muerte, muerte CV, infarto de miocardio o accidente cerebrovascular. El año pasado argumenté que el fármaco GLP1a semaglutida modificaba la enfermedad en pacientes con enfermedad cardíaca establecida y obesidad [2] porque el ensayo SELECT [3] mostró reducciones en criterios clínicos de valoración robustos.
SUMMIT no demostró eso. Para uno los dos componentes de su criterio primario de valoración, la muerte CV no hubo diferencias entre los dos grupos. El otro componente, los eventos de insuficiencia cardiaca, es un criterio de valoración problemático. Como escribí la semana pasada [4], la hospitalización por insuficiencia cardíaca a menudo no es un buen sustituto de la hospitalización total.
Sin embargo, ese no es el único problema de utilizar los eventos de insuficiencia cardiaca como criterio de valoración. SUMMIT tenía un grupo de placebo, pero seguramente los pacientes acabaron conociendo el grupo de tratamiento al que habían sido asignados. Los medicamentos GLP1a causan síntomas gastrointestinales, como disminución del apetito, flatulencia y pérdida de peso. El placebo no. Dado que la decisión de solicitar atención médica por hinchazón o aumento de líquido es parcialmente subjetiva, el desenmascaramiento del tratamiento puede sesgar el criterio de valoración. En otras palabras, un evento de insuficiencia cardiaca requiere que un paciente y un médico tomen una decisión.
Problema dos: incertidumbre. En 2018, el Dr. Packer escribió una editorial titulada Building Castles in the Sky [5]. Fue una fuerte crítica a un ensayo de ablación en la fibrilación auricular llamado CASTLE-AF [6]. Una de sus principales críticas fue el pequeño número de eventos que se presentaron de los que se habían establecido como criterios de valoración. Escribió que tales ensayos son “notoriamente no reproducibles“. Esta es una crítica importante porque un número pequeño de eventos puede no separar la señal del ruido.
El estudio SUMMIT del Dr. Packer tuvo un número extremadamente pequeño de eventos. Las muertes por causa cardiovascular fueron 8 frente a 5 en los grupos tirzepatida y placebo y, el número de hospitalizaciones por insuficiencia cardíaca (el criterio de valoración más estándar) fue bajo, de solo 12 y 26, respectivamente. Compárese esto con otros dos ensayos de ICFEp: el ensayo DELIVER del inhibidor del cotransportador de sodio-glucosa 2 dapagliflozina [7], donde hubo casi 750 hospitalizaciones por insuficiencia cardíaca, y el PARAGON-HF de sacubitrilo-valsartán frente a valsartán, donde hubo casi 1.500 [8].
Problema tres: los autores de SUMMIT no nos dicen el número de hospitalizaciones por todas las causas. Sin ese número, es difícil evaluar la importancia del criterio de valoración “eventos de insuficiencia cardiaca”. Por ejemplo ¿qué pasaría si la tirzepatida provocara un aumento de las hospitalizaciones por causas no relacionadas con la insuficiencia cardiaca?
Resumen:
Me resulta curioso que Eli Lily y los autores académicos hayan diseñado un ensayo tan pequeño y con tan poco poder. La ICFEp y la obesidad son dos de las enfermedades más frecuentes. En ensayos previos sobre ICFEp se inscribieron miles de pacientes. El patrocinador claramente tiene el financiamiento.
En cambio, tenemos un ensayo con un total de 13 muertes por causas cardiovasculares, menos de 50 hospitalizaciones por insuficiencia cardíaca y criterios de valoración de calidad de vida sesgados (debido a que el estudio no fue ciego).
Los fármacos GLP1 pueden modificar la enfermedad en presencia de ICFEp, pero se necesitaría un ensayo mucho más sólido para demostrarlo. ¿Por qué no se hizo? esto es un misterio.
Referencias