Una organización internacional sin ánimo de lucro para fomentar el acceso y el uso adecuado de medicamentos entre la población hispano-parlante

Gestión de los Ensayos Clínicos, Metodología, Costos y Conflictos de Interés

¿Se perdió el Equipoise? Desafíos en la realización de ensayos clínicos en una era de terapias innovadoras

(Equipoise Lost? Trial Conduct Challenges in an Era of Breakthrough Therapies)
Fallah J, Mulkey F, Fiero M et al
Journal of Clinical Oncology 2024 ;42 (32), 3783-3787. doi: 10.1200/JCO-24-01200
https://ascopubs.org/doi/10.1200/JCO-24-01200
Traducido por Salud y Fármacos, publicado en Boletín Fármacos: Ensayos Clínicos y Ética 2025; 28 (1)

Tags: equiponderación en los ensayos clínicos, sesgos en los ensayos clínicos abiertos, perspectivas de los investigadores que distorsionan los datos de los ensayos clínicos, perspectivas de pacientes que distorsionan los resultados de los ensayos clínicos

Los nuevos fármacos oncológicos pueden tener mayor actividad antitumoral y más duradera que las terapias disponibles, pudiendo aumentar las expectativas de éxito en los ensayos de fase avanzada. La rápida diseminación de información preliminar persuasiva a través de la literatura, reuniones profesionales, redes sociales y prensa no especializada puede influir en la percepción de superioridad de un agente en investigación sobre el mejor estándar de atención (SOC). Las medidas regulatorias, como la designación de terapia innovadora o aprobación acelerada, pueden respaldar aún más esta percepción, a pesar de que los beneficios no se hayan verificado en los ensayos clínicos aleatorios (ECA). En conjunto, esto puede afectar la percepción de equiponderación clínica (clinical equipoise) que tienen los pacientes y los investigadores [1].

Cuando los ECA están enmascarados, el que se pierda la percepción de equiponderación puede tener un efecto mínimo, aparte de sumarse a otros desafíos; sin embargo, su impacto en los ECA de etiqueta abierta puede ser sustancial. Los pacientes con enfermedades graves y potencialmente mortales como el cáncer se inscriben en ensayos con la esperanza de beneficiarse de un nuevo agente en investigación. La insatisfacción de los pacientes cuando se les asigna al brazo control puede conllevar mayores tasas de abandono en el momento de la aleatorización, generando un sesgo que puede desafiar la interpretación de los resultados [2,3]. Todavía peor, los que abandonan pueden ser pacientes con un mejor estado funcional o aquellos con un nivel socioeconómico más alto que pueden obtener el fármaco en investigación fuera del ensayo, en un país donde haya sido aprobado.

En oncología, los ensayos de fase tardía suelen evaluar la eficacia en función del tiempo que transcurre hasta que surja un evento (TTE), como la supervivencia general (SG) o la supervivencia libre de progresión (SLP). Al finalizar un ensayo, los pacientes que no experimentan un evento (p. ej., progresión de la enfermedad [PD] o muerte) son censurados [1] y ya no se los considera en riesgo de tener el evento [4]. La censura puede producirse en múltiples momentos a lo largo de un ensayo y por diversas razones. Cuando se censura a los pacientes, se supone que sus resultados son similares a los de los que permanecen en el ensayo y están en el mismo brazo de tratamiento. Esta premisa es básica para obtener estimaciones confiables de los criterios finales de valoración. Sin embargo, si el motivo de la censura no es independiente del resultado, puede haber una censura informativa [5–7]. Por ejemplo, se produce censura informativa cuando, en comparación con los que se quedaron en el ensayo, los pacientes con un mejor pronóstico o un nivel socioeconómico más alto abandonan el estudio y son censurados en el grupo de control, o cuando los pacientes con peor pronóstico abandonan el estudio y son censurados en el grupo de investigación. Cada uno de estos escenarios puede inflar artificialmente el efecto del tratamiento observado y puede llevar a conclusiones falsas positivas sobre el beneficio del agente en investigación.

Cuanto más subjetivo sea un criterio de valoración, más vulnerable es a un posible sesgo. Por ejemplo, la pérdida percibida de equiponderación en un ensayo abierto puede influir en como un investigador evalúa la respuesta al tratamiento o la PD. En particular, cuando se permite el cruce de los pacientes (crossover), los investigadores pueden declarar la PD antes para los pacientes del grupo de control cuando perciben que el brazo del producto en investigación ofrece un tratamiento superior para su paciente. Esto puede resultar en un alto nivel de discordancia entre el investigador y la revisión central independiente ciega (BICR) y en una posible censura informativa de las evaluaciones de la BICR.

En este artículo, analizamos dos solicitudes recientes de comercialización de nuevos fármacos que se presentaron a la FDA en las que se cuestionó la interpretación del efecto del tratamiento en un ECA de etiqueta abierta por las altas tasas de abandono y censura asimétrica, posiblemente ampliadas por una pérdida de la percepción de equiponderación (equipoise).

Caso 1: El Ensayo Vision
VISION (identificador ClinicalTrials.gov: NCT03511664) fue un ensayo clínico aleatorizado abierto en pacientes con cáncer de próstata metastásico resistente a la castración con antígeno prostático específico (PSMA) positivo, que asignó aleatoriamente (2:1) a los pacientes para recibir 177 Lu-PSMA-617 más tratamiento estándar o tratamiento estándar solo [8]. VISION informó mejoras estadísticamente significativas en sus dos criterios de valoración primarios: el cociente de riesgos instantáneos (HR) para la SLP radiográfica determinada por BICR (rSLP) fue de 0,40 (IC del 95 %, 0,31 a 0,52; P < 0,001) y el HR de la SG fue de 0,62 (IC del 95 %, 0,52 a 0,74; P < 0,001). Antes de iniciar el ensayo, los resultados de eficacia emergentes de los primeros ensayos con 177 Lu-PSMA-617 y su novedad como radiofármaco terapéutico dirigido para el cáncer de próstata lo convirtieron en una opción atractiva sin quimioterapia, pudiendo contribuir a generar la percepción de preferencia por 177 Lu-PSMA-617 entre los pacientes y los investigadores [9,10]. El grupo control incluyó un tratamiento hormonal de segunda línea bien tolerado, pero solo moderadamente efectivo. No había una opción de tratamiento con quimioterapia, y los pacientes que inicialmente rechazaron la quimioterapia para cumplir con los criterios de elegibilidad podrían haberse retirado del grupo control para obtener esa opción. En consonancia con esta hipótesis, el 16 % de los pacientes del grupo control en VISION recibieron posteriormente cabazitaxel [11].

Caso 2: El Ensayo Codebreak 200
CodeBreaK 200 (identificador ClinicalTrials.gov: NCT04303780) fue un ensayo clínico aleatorizado abierto que se hizo para confirmar el beneficio clínico de sotorasib, que había recibido la aprobación acelerada en función de los resultados de CodeBreaK 100. El ensayo asignó aleatoriamente (1:1) a pacientes con cáncer de pulmón de células no pequeñas avanzado con una mutación KRAS G12C para recibir sotorasib o docetaxel. El criterio de valoración principal fue la SLP determinada por BICR. La SG fue un criterio de valoración secundario. CodeBreaK 200 informó una mejora modesta, estadísticamente significativa en la SLP (HR, 0,66 [IC del 95 %, 0,51 a 0,86]; P unilateral = 0,002). En el análisis final, no se observó ninguna diferencia en la SG (HR, 1,01 [IC del 95 %, 0,77 a 1,33]) [12]. El conocimiento del público fue elevado, dada la novedad de sotorasib como posible tratamiento para tumores con una mutación de KRAS, un objetivo oncogénico importante que anteriormente se consideraba intratable. La designación de terapia innovadora y la aprobación acelerada otorgada a sotorasib como primer inhibidor de KRAS aprobado podría haber contribuido a la superioridad percibida de sotorasib sobre la quimioterapia estándar [13,14].

Abandono temprano del brazo de control
Muchos pacientes se inscribieron en VISION con la esperanza de recibir 177 Lu-PSMA-617, evidenciado por la gran proporción de retiros del brazo control antes de recibir cualquier tratamiento o antes de la primera evaluación radiológica posterior al inicio (dentro de las 8 semanas posteriores a la asignación aleatoria) [12]. La retirada diferencial del consentimiento fue sorprendente. De los primeros 250 pacientes inscritos entre el 4 de junio de 2018 y el 5 de marzo de 2019, el 56 % del grupo control, en comparación con solo el 1,2 % del grupo que recibió el producto en investigación, abandonó el estudio, lo que resultó en un nivel de censura severamente desproporcionado en el grupo control [8,11]. Se implementaron rápidamente estrategias de mitigación, que incluyeron mejorar la educación de los investigadores, la comunicación interdisciplinaria y los límites a la inscripción en los sitios con un alto índice de abandono. Entre las otras estrategias que se utilizaron para garantizar la interpretabilidad de los resultados se incluyó el análisis de la rSLP solo entre los pacientes asignados aleatoriamente después de la implementación de las estrategias de mitigación y el aumento del tamaño de la muestra objetivo para mantener el poder estadístico para este análisis. Estas estrategias redujeron la tasa de abandono en el grupo control del 56 % (47/84 pacientes) al 16 % (32/196 pacientes) después de su implementación. Una cosa importante es que el estado de supervivencia del paciente se obtuvo parcialmente a través de los registros públicos, lo que redujo el nivel de censura asimétrica para el análisis de la SG.

En CodeBreaK 200 también se observó un abandono temprano desproporcionado entre los grupos, donde una mayor proporción de pacientes en el grupo de control (13 %) nunca recibió la terapia del estudio, en comparación con el grupo de sotorasib (1,2 %). La mayoría de estos pacientes del grupo control que no recibieron tratamiento retiraron el consentimiento dentro de las 5 semanas posteriores a la asignación aleatoria y fueron censurados para la SLP el día 1 por falta de imágenes posteriores al inicio.

Señales de un posible sesgo en la evaluación del investigador
Los investigadores clínicos son responsables tanto de la adherencia al protocolo del ensayo como de la prestación de atención médica a su paciente. Esta doble función puede aumentar el riesgo de sesgo. El sesgo del investigador puede manifestarse de varias maneras, desde la evaluación de los criterios de elegibilidad (p. ej., el estado funcional del paciente) hasta la determinación de la progresión de la enfermedad (PD). Ya sea intencional o no, este sesgo puede afectar los resultados del ensayo.

En CodeBreaK 200, hubo una mayor proporción de discordancia temprana (determinación de PD por parte del investigador antes de BICR determinada la PD) en el grupo de control que recibió tratamiento con docetaxel. Además, la proporción de discordancia tardía (determinación de PD por parte del investigador más tarde que la PD determinada por BICR) fue mayor en el grupo de sotorasib. Esta distribución diferencial de las discordancias tempranas y tardías aumentó la preocupación por el sesgo de evaluación del investigador a favor de sotorasib. Un total del 41 % de los pacientes que pasaron al grupo sotorasib lo hicieron después de un evento de PD discordante. Un análisis exploratorio de la FDA indicó que estos pacientes podrían haber sido más saludables que aquellos que cambiaron de tratamiento (crossover) después de la PD evaluada por BICR, lo que sugiere un sesgo de censura informativa a favor de sotorasib [15].

Estrategias de mitigación
En el Cuadro 1 se resumen varias estrategias para mitigar el riesgo de sesgo del investigador y el abandono del paciente en ensayos abiertos. Al interpretar los resultados hay que considerar los posibles impactos de cada estrategia. Por ejemplo, en un diseño abierto, el cambio de grupo de tratamiento (crossover) puede prevenir el abandono, pero puede aumentar la vulnerabilidad al sesgo de la evaluación por imágenes cuando el investigador considera tempranamente que ha habido PD, y un alto porcentaje de cruce de tratamiento afectará la interpretabilidad de la supervivencia general.

Dada la posible pérdida de equiponderación (equipoise) que puede ocurrir cuando un fármaco recibe una aprobación acelerada, las estrategias de desarrollo de fármacos que apuntan a una aprobación acelerada podrían considerar un modelo de ensayo único. En este modelo, la aprobación acelerada se otorga en función de un criterio primario de valoración evaluado anteriormente (por ejemplo, tasa de respuesta objetiva o SLP), una vez que el ensayo ha recopilado todos los datos. La aprobación tradicional puede otorgarse en función de la obtención de resultados superiores durante el seguimiento a largo plazo, en un criterio de valoración que se obtenga posteriormente como parte de ese mismo ensayo, como la SG, reduciendo así el potencial de abandono temprano del paciente debido a cualquier pérdida percibida de equiponderación. Además, el uso de elementos de ensayos pragmáticos y/o descentralizados, cuando sea apropiado, puede reducir los inconvenientes de participar en el ensayo y potencialmente atenuar la deserción.

Análisis de sensibilidad
Incluso cuando se implementan estrategias de mitigación, puede haber censura asimétrica y será necesario tenerla en cuenta para evaluar su impacto en los resultados del ensayo. Se deben realizar análisis de sensibilidad para explorar la solidez de los resultados, incluyendo el uso de diferentes métodos de análisis para el mismo criterio de valoración y/o la redefinición del resultado [16].

En VISION, se realizaron varios análisis de sensibilidad: (1) considerando a todos los abandonos en el grupo tratado con el producto en investigación como eventos, (2) imputando los datos de abandono en el grupo control en función del 20% de los pacientes que lograron atrasar más el evento (TTE más largo) ya sea en general o en el grupo control, (3) midiendo el aumento o la disminución del riesgo de eventos en los pacientes que abandonan el grupo tratado con el producto en investigación o el grupo control que harían que el análisis primario pierda significancia estadística (análisis de punto de inflexión) y (4) excluyendo a los pacientes que retiraron el consentimiento.

Estos análisis sugirieron que era probable que el efecto del tratamiento en el análisis primario en la rSLP observado estuviera sobreestimado. Con respecto al resultado en la SG, además de ser un criterio de valoración menos subjetivo, se capturó el estado vital de algunos de los pacientes que abandonaron. Los análisis de la SG parecieron menos afectados por el abandono asimétrico y los resultados de los análisis de sensibilidad de la SG fueron consistentes con el análisis primario. Por lo tanto, la FDA otorgó la aprobación tradicional para 177 Lu-PSMA-617 en este entorno en función de la supervivencia global, pero no incluyó los resultados de la supervivencia libre de progresión en el etiquetado del fármaco debido a la magnitud incierta de la mejora [11].

En CodeBreaK 200, un número sustancialmente mayor de pacientes en el brazo control en comparación con el grupo que recibió el tratamiento experimental retiró el consentimiento inmediatamente después de la asignación aleatoria, ocasionando una censura asimétrica significativa para el criterio primario de valoración: la supervivencia libre de progresión. A diferencia de VISION, donde la supervivencia global fue el criterio primario de valoración y la ausencia de información sobre el estado vital por abandono se capturó parcialmente a través de registros, los eventos de supervivencia libre de progresión después del abandono no se pueden capturar retrospectivamente. Un análisis de sensibilidad del punto de inflexión que evaluó el impacto de la censura asimétrica teniendo en cuenta el sesgo potencial introducido por los abandonos tempranos sugirió que los resultados primarios de la supervivencia libre de progresión no fueron sólidos. Estos análisis se discutieron en la reunión del comité asesor de medicamentos oncológicos del 5 de octubre de 2023 [15].

Observar un abandono/censura asimétricos, a primera vista, no implica sesgo, del mismo modo que la distribución uniforme de la censura no excluye el sesgo. Sin embargo, estas señales indican que hay que hacer un mayor escrutinio de los resultados. Los primeros pasos para comprender la gravedad y los posibles impactos de la censura asimétrica incluyen lo siguiente:

  • Evaluar las diferencias en las características de los pacientes para determinar si el riesgo de fracaso del tratamiento fue diferente al de los que permanecieron en el ensayo.
  • Evaluar los patrones de abandono con respecto al momento, las razones y el equilibrio entre los brazos, con el objetivo de identificar si hay censura informativa.

Estas evaluaciones pueden informar tanto la interpretación de los resultados como los análisis de sensibilidad que son apropiados. En el Cuadro 1 [17–20] se presentan análisis de sensibilidad y de apoyo adicionales. La mayoría de estos análisis dependen de premisas no verificables, por lo que hay que considerar cuidadosamente su uso. La elección del criterio primario de valoración es importante para los ensayos en los que la equiponderación (equipoise) puede estar en riesgo. La SG tiene ventajas importantes: (1) la determinación del evento es muy objetiva, (2) se pueden obtener eventos para los pacientes que abandonan, y (3) la significancia clínica elevada y la captura de eventos adversos fatales reducen parcialmente la dependencia de la magnitud del efecto para concluir que aportan un beneficio clínico favorable.

En cambio, la SLP es más vulnerable a posibles sesgos y abandonos: (1) la determinación de un evento de PD por parte del investigador es más subjetiva; (2) no es posible hacer una evaluación de las imágenes de los pacientes que abandonaron, ya que no se pueden obtener retrospectivamente, lo que aumenta la probabilidad de censura asimétrica; y (3) la magnitud de la SLP es de mayor importancia para evaluar si apoya un balance beneficio-riesgo favorable. Si bien los grandes efectos en la SLP pueden superar estas limitaciones, los tamaños de efecto más pequeños con una censura asimétrica sustancial generan incertidumbre no solo sobre si existe un efecto estadísticamente significativo sino también en la precisión en torno a la magnitud de ese efecto y si se considera significativo.

En conclusión, el Centro de Excelencia en Oncología de la FDA ha visto casos notables de abandono temprano del grupo control y señales de sesgo de los investigadores en la evaluación de la PD radiográfica para los ECA de etiqueta abierta. Esto sugiere que mantener la equiponderación en los ECA de etiqueta abierta puede ser más difícil en la era de la información digital donde abunda un alto conocimiento de los hallazgos de los estudios de fase temprana de tratamientos novedosos.

No destacamos esto para sugerir que los pacientes o los investigadores son culpables, sino para alertar a quienes desarrollan medicamentos de que altos niveles de datos faltantes y la censura asimétrica pueden hacer que los resultados sean ininterpretables. Los patrocinadores de los ensayos y los investigadores deben estar atentos, identificando las posibles causas de abandono temprano (por ejemplo, un grupo de control subóptimo), implementando estrategias de mitigación adecuadas en el momento del diseño del ensayo (por ejemplo, enmascaramiento de los tratamientos y evaluaciones) o durante el ensayo, si es necesario (por ejemplo, educando a los pacientes y a los investigadores), e incluyendo análisis de sensibilidad preespecificados en su plan de análisis estadístico. Cuando se produce una censura asimétrica en los ECA, se deben evaluar los resultados para detectar censura informativa y explorar más a fondo el impacto en los resultados. Por último, la participación en ensayos clínicos puede ser una carga para los pacientes. Los esfuerzos por descentralizar la realización de los ensayos y reducir la complejidad mediante la inclusión de elementos pragmáticos ofrecen otra forma importante de alentar a los pacientes a inscribirse y completar su tratamiento asignado en los ensayos clínicos.

Descargo de Responsabilidad
Este es un trabajo del gobierno de los EE UU. No existen restricciones para su uso.

Referencias

  1. Freedman B: Equipoise and the ethics of clinical research. N Engl J Med 317:141-145, 1987
  2. Lindström D, Sundberg-Petersson I, Adami J, et al.: Disappointment and drop-out rate after being allocated to control group in a smoking cessation trial. Contemp Clin Trials 31:22-26, 2010
  3. Windle E, Tee H, Sabitova A, et al.: Association of patient treatment preference with dropout and clinical outcomes in adult psychosocial mental health interventions: A systematic review and meta-analysis. JAMA Psychiatry 77:294-302, 2020
  4. Fleming TR, Rothmann MD, Lu HL: Issues in using progression-free survival when evaluating oncology products. J Clin Oncol 27:2874-2880, 2009
  5. Sridhara R, Mandrekar SJ, Dodd LE: Missing data and measurement variability in assessing progression-free survival endpoint in randomized clinical trials. Clin Cancer Res 19:2613-2620, 2013
  6. Campigotto F, Weller E: Impact of informative censoring on the Kaplan-Meier estimate of progression-free survival in phase II clinical trials. J Clin Oncol 32:3068-3074, 2014
  7. Templeton AJ, Amir E, Tannock IF: Informative censoring—A neglected cause of bias in oncology trials. Nat Rev Clin Oncol 17:327-328, 2020
  8. Sartor O, de Bono J, Chi KN, et al.: Lutetium-177-PSMA-617 for metastatic castration-resistant prostate cancer. N Engl J Med 385:1091-1103, 2021
  9. Baum RP, Kulkarni HR, Schuchardt C, et al.: 177Lu-Labeled prostate-specific membrane antigen radioligand therapy of metastatic castration-resistant prostate cancer: Safety and efficacy. J Nucl Med 57:1006-1013, 2016
  10. Rahbar K, Ahmadzadehfar H, Kratochwil C, et al.: German multicenter study investigating 177Lu-PSMA-617 radioligand therapy in advanced prostate cancer patients. J Nucl Med 58:85-90, 2017
  11. Fallah J, Agrawal S, Gittleman H, et al.: FDA approval summary: Lutetium Lu 177 vipivotide tetraxetan for patients with metastatic castration-resistant prostate cancer. Clin Cancer Res 29:1651-1657, 2023
  12. de Langen AJ, Johnson ML, Mazieres J, et al.: Sotorasib versus docetaxel for previously treated non-small-cell lung cancer with KRASG12C mutation: A randomised, open-label, phase 3 trial. Lancet 401:733-746, 2023
  13. Canon J, Rex K, Saiki AY, et al.: The clinical KRAS(G12C) inhibitor AMG 510 drives anti-tumour immunity. Nature 575:217-223, 2019
  14. Huang L, Guo Z, Wang F, et al.: KRAS mutation: From undruggable to druggable in cancer. Signal Transduct Target Ther 6:386, 2021
  15. U.S. Food and Drug Administration: October 5, 2023: Meeting of the Oncologic Drugs Advisory Committee Meeting Announcement. https://www.fda.gov/advisory-committees/advisory-committee-calendar/october-5-2023-meeting-oncologic-drugs-advisory-committee-meeting-announcement-10052023#event-materials
  16. Thabane L, Mbuagbaw L, Zhang S, et al.: A tutorial on sensitivity analyses in clinical trials: The what, why, when and how. BMC Med Res Methodol 13:92, 2013
  17. Shih W: Problems in dealing with missing data and informative censoring in clinical trials. Curr Control Trials Cardiovasc Med 3:4, 2002
  18. Atkinson A, Kenward MG, Clayton T, et al.: Reference-based sensitivity analysis for time-to-event data. Pharm Stat 18:645-658, 2019
  19. Fine JP, Gray RJ: A proportional hazards model for the subdistribution of a competing risk. J Am Stat Assoc 94:496-509, 1999
  20. Amit O, Mannino F, Stone AM, et al.: Blinded independent central review of progression in cancer clinical trials: Results from a meta-analysis. Eur J Cancer 47:1772-1778, 2011

[1] LA censura consiste en retirar o dejar de dar seguimiento a un paciente antes de que se observe el resultado de interés.

creado el 6 de Abril de 2025