Puntos clave
Pregunta: La selección de umbrales de corte óptimos utilizando los datos de los estudios de precisión de la detección del Cuestionario de salud del paciente-9 (PHQ-9) ¿genera puntuaciones de corte que divergen de la puntuación de corte a nivel poblacional y exagera la precisión?
Pregunta: ¿La selección del punto de corte óptimo basado en datos en los estudios de precisión del tamizaje con el Patient Health Questionnaire-9 (PHQ-9), genera puntos de corte que difieren del punto de corte a nivel poblacional y sobrestiman la precisión?
Hallazgos: En este estudio transversal de 100 estudios primarios que incluyeron a 44.503 participantes, se identificaron puntuaciones óptimas del PHQ-9 que eran diferentes a la puntuación de corte óptima a nivel poblacional, y se sobreestimó la precisión de detección del PHQ-9. A medida que aumentó el tamaño de la muestra, la sobrestimación de la sensibilidad disminuyó, mientras que la especificidad se mantuvo dentro de 1 punto porcentual.
Significado: Los hallazgos de este estudio sugieren que los usuarios de evidencia para la precisión diagnóstica deben evaluar los estudios de precisión con cautela y asegurarse de que las recomendaciones de punto de corte estén basadas en investigaciones adecuadas con suficiente poder estadístico o en metaanálisis bien realizados.
Resumen
Importancia: Los estudios de precisión de pruebas a menudo utilizan bases de datos pequeñas para seleccionar simultáneamente una puntuación de corte óptima que maximice la precisión de la prueba y genere estimaciones de precisión.
Objetivo: Evaluar hasta qué punto el uso de métodos basados en datos para seleccionar simultáneamente un puntaje de corte óptimo para el PHQ-9 y estimar la precisión produce (1) puntajes de corte óptimos que difieren del puntaje de corte óptimo a nivel poblacional y (2) estimaciones de precisión sesgadas.
Diseño, entorno y participantes: Este estudio utilizó datos transversales de un metaanálisis que utilizó datos de participantes individuales (IPDMA) sobre la precisión de detección del PHQ-9 para representar una población hipotética. Los estudios en la base de datos IPDMA compararon los puntajes del PHQ-9 de los participantes con una clasificación de depresión mayor. De la población IPDMA, se volvieron a muestrear 1.000 estudios de 100, 200, 500 y 1.000 participantes cada uno.
Principales resultados y medidas: Para la población completa del IPDMA y cada estudio simulado, se seleccionó un puntaje de corte óptimo maximizando el índice de Youden. Las estimaciones de precisión para los puntajes de corte óptimos en los estudios simulados se compararon con la precisión en la población completa.
Resultados: La base de datos IPDMA incluyó 100 estudios primarios con 44.503 participantes (4.541 [10 %] casos de depresión mayor). El punto de corte óptimo a nivel poblacional fue de 8 o más. Las puntuaciones de corte óptimas en estudios simulados variaron de 2 o más a 21 o más en muestras de 100 participantes y de 5 o más a 11 o más en muestras de 1.000 participantes. El porcentaje de estudios simulados que identificaron la verdadera puntuación de corte óptima de 8 o más fue del 17 % para muestras de 100 participantes y del 33 % para muestras de 1.000 participantes.
En comparación con las estimaciones para una puntuación de corte de 8 o más en la población, la sensibilidad se sobreestimó en 6,4 (IC del 95 %, 5,7-7,1) puntos porcentuales en muestras de 100 participantes, 4,9 (IC del 95 %, 4,3-5,5) puntos porcentuales en muestras de 200 participantes, 2,2 (IC del 95 %, 1,8-2,6) puntos porcentuales en muestras de 500 participantes y 1,8 (IC del 95 %, 1,5-2,1) puntos porcentuales en muestras de 1.000 participantes. La especificidad estuvo dentro de 1 punto porcentual en todos los tamaños de muestra.
Conclusiones y relevancia: Este estudio de datos transversales encontró que las puntuaciones de corte óptimas y las estimaciones de precisión diferían sustancialmente de los valores en la población cuando se utilizaron métodos basados en datos para identificar simultáneamente una puntuación de corte óptima y estimar la precisión. Los usuarios de evidencia de precisión diagnóstica deben evaluar los estudios de precisión con cautela y asegurarse de que las recomendaciones de puntajes de corte se basen en investigaciones con poder estadístico adecuado o en metaanálisis bien realizados.