http://remi.uninet.edu/2005/08/REMIED53.htm
Valoración crítica de los
estudios sobre diagnóstico
Artículo REMI relacionado: Molina E. TAC helicoidal en el diagnóstico de las fracturas vertebrales. [REMI 2005; 5 (8): 884]
Es sabido que las evaluaciones diagnósticas que se publican adolecen frecuentemente de una baja calidad metodológica [1]. Ello obliga al lector a ser precavido a la hora de aplicar a la práctica clínica los resultados de dichos estudios. Afortunadamente, la valoración crítica de la validez y relevancia de un estudio de diagnóstico está al alcance de cualquier clínico, si se siguen las guías disponibles [2, 3]. El reciente estudio de Brown y col. [4], comentado en REMI [5], en el que se estudia la utilidad del TAC helicoidal para el diagnóstico de fracturas de columna, ofrece la oportunidad de discutir algunos de los puntos críticos de las evaluaciones diagnósticas.
Para saber si una prueba (el TAC helicoidal en este caso) identifica correctamente a la condición en estudio (fracturas vertebrales) es necesario disponer de una prueba de referencia (el “gold standard”) que separe a los individuos que tienen realmente la condición en estudio (los “enfermos”) de los que no la tienen (los “no enfermos”). Por ello, el primer criterio para valorar la validez de una evaluación diagnóstica es comprobar si la prueba se compara con una prueba de referencia aceptable. En el estudio de Brown y col. los pacientes con fracturas vertebrales se identificaron a partir del código CIE-9 de alta. Por lo tanto, la prueba de referencia utilizada fue el diagnóstico realizado por los clínicos. De acuerdo con el protocolo asistencial descrito en la sección de Material y Métodos, dicho diagnóstico se basaba primariamente en el resultado del TAC, mientras que las demás técnicas diagnósticas (la radiografía convencional, la resonancia nuclear magnética) se usaban únicamente para valorar lesiones ligamentosas o imágenes dudosas. El TAC helicoidal constituye, por tanto, una parte esencial de la prueba de referencia. O, dicho de otra forma, la prueba se compara consigo misma. La consecuencia obvia de este sesgo (el llamado “sesgo de incorporación”) es una sobreestimación de la exactitud de la prueba.
Como consecuencia de esta falta de una prueba de referencia independiente todo paciente con resultado positivo del TAC se considera como “enfermo” (verdadero positivo), con lo que desaparecen los falsos positivos, y se asume, implícitamente, una especificidad del 100%. El lector podría objetar que esta asunción es compartida por la mayoría de los estudios que comparan la radiografía convencional con el TAC [6]. Sin embargo, se han comunicado casos de falsos positivos del TAC helicoidal en el diagnóstico de fracturas cervicales [7]. Y, por otro lado, el interés primario del clínico no consiste en conocer si hay o no fractura, sino que necesita asimismo conocer la existencia de lesiones ligamentosas; y es bien conocido, que la sensibilidad y especificidad del TAC helicoidal para diagnosticar este tipo de lesiones es aún menor [7, 8]. Los autores tampoco facilitan información sobre el número de verdaderos negativos (pacientes sin fractura con resultado negativo del TAC). En estas condiciones, no se puede estimar la especificidad de la prueba (ni los cocientes de probabilidad) y, por tanto, no es posible aplicar el teorema de Bayes para estimar la probabilidad post-prueba.
Respecto a los pacientes con resultado negativo del TAC, el estudio los considera inicialmente como “no enfermos”, y sólo una parte de ellos (no especificada en el artículo) son sometidos a un escrutinio adicional mediante otras pruebas diagnósticas. En algunos pacientes (los residentes en el condado de San Diego) se hizo un seguimiento a partir de un registro comunitario, con el fin de detectar casos de fractura que hubieran pasado inicialmente desapercibidos. Este seguimiento ambulatorio constituiría, por tanto, un “segundo gold standard” imperfecto, con una baja “sensibilidad” para detectar fracturas vertebrales. En principio, este sesgo (conocido como “work-up detection bias” o sesgo de verificación diferencial) conduciría a considerar algunos “falsos negativos” como “verdaderos negativos” [9], con la consiguiente sobreestimación tanto de la sensibilidad (subestimación de los falsos negativos) como de la especificidad (sobreestimación de los verdaderos negativos). Al objeto de evidenciar este sesgo, las recientes guías de publicación de evaluaciones diagnósticas [10] aconsejan incluir en los estudios de evaluación diagnóstica un diagrama de flujo en el que se especifique el número de pacientes inicialmente incluidos en el estudio, el número de pacientes en los que se realiza la prueba diagnóstica, el número de pacientes en los que se realiza la prueba de referencia y el número de pacientes con resultados equívocos.
Con los comentarios anteriores no pretendemos cuestionar la utilidad del TAC helicoidal para el diagnóstico de las lesiones vertebrales (corroborada por otros estudios), sino resaltar la necesidad de una lectura crítica de las evaluaciones diagnósticas. Si una nueva técnica diagnóstica es claramente superior a la prueba de referencia previa, entonces debemos considerar la posibilidad de adoptarla como nueva prueba de referencia. En este caso, hablar de la sensibilidad y especificidad carece de sentido. La incorporación de la propia prueba en estudio como parte del gold standard no es la solución.
Bibliografía:
Reid MC, Lachs MS, Feinstein AR. Use of methodological standards in diagnostic test research. Getting better but still not good. JAMA 1995; 274: 645-651. [Resumen] [Artículos relacionados]
Strauss SE, Richardson WS, Glasziou P, Haynes RB. Evidence-based medicine. How to practice and teach EBM. 3th ed. Edinburgh: Elsevier 2005.
www.redcaspe.org (acceso comprobado el 8 de agosto de 2005)
Brown CVR, Antevil JL, Sise MJ, Sack DI. Spiral Computed Tomography for the Diagnosis of Cervical, Thoracic, and Lumbar Spine Fractures: Its Time has Come. J Trauma 2005; 58: 890-896. [Resumen] [Artículos relacionados]
Molina E. TAC helicoidal en el diagnótico de las fracturas vertebrales. [REMI 2005; 5 (8): 884]
Holmes JF, Akkinepall R. Computed Tomography Versus Plain Radiography to Screen for Cervical Spine Injury: A Meta-Analysis. J Trauma 2005; 58: 902-905. [Resumen] [Artículos relacionados]
Hanson JA, Blackmore CC, Mann FA, Wilson AJ. Cervical spine injury: accuracy of helical CT used as a screening technique. Emerg Radiology 2000; 7: 31-35.
Brohi K, Healy M, Fotheringham T, Chan O, Aylwin C, Whitley S, Walsh M. Helical computed tomographic scanning for the evaluation of the cervical spine in the unconscious, intubated trauma patient. J Trauma 2005; 58: 897-901. [Resumen] [Artículos relacionados]
Knottnerus JA. The evidence base of clinical diagnosis. Londres: BMJ Books, 2002.
Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou P, Irwig LM, Lijmer JG, Moher D, Rennie D, de Vet CW, for the STARD group. Towards complete and accurate reporting of studies of diagnostic accuracy: the STARD initiative. BMJ 2003; 326: 41-44. [Resumen] [Artículos relacionados] [Texto completo]
Jaime
Latour Pérez
Hospital Universitario de Elche, Alicante
©REMI, http://remi.uninet.edu.
Agosto 2005.