Valoración crítica de los estudios sobre
diagnóstico
[Versión para imprimir]
Artículo REMI relacionado: Molina E.
TAC helicoidal en el diagnóstico de las fracturas vertebrales. [REMI 2005; 5 (8): 884].
Comentarios: [Ricardo Abizanda
Campos] [Federico Gordo Vidal].
Réplica: [Jaime
Latour Pérez]
Es sabido que las evaluaciones diagnósticas que se
publican adolecen frecuentemente de una baja calidad metodológica
[1]. Ello obliga al lector a ser precavido a la hora de aplicar a la
práctica clínica los resultados de dichos estudios. Afortunadamente, la
valoración crítica de la validez y relevancia de un estudio de diagnóstico
está al alcance de cualquier clínico, si se siguen las guías disponibles
[2, 3]. El reciente estudio de Brown y col. [4], comentado en REMI [5],
en el que se estudia la utilidad del TAC helicoidal para el diagnóstico de
fracturas de columna, ofrece la oportunidad de discutir algunos de los
puntos críticos de las evaluaciones diagnósticas.
Para saber si una prueba (el TAC helicoidal en este
caso) identifica correctamente a la condición en estudio (fracturas
vertebrales) es necesario disponer de una prueba de referencia (el “gold
standard”) que separe a los individuos que tienen realmente la
condición en estudio (los “enfermos”) de los que no la tienen (los “no
enfermos”). Por ello, el primer criterio para valorar la validez de una
evaluación diagnóstica es comprobar si la prueba se compara con una prueba
de referencia aceptable. En el estudio de Brown y col. los pacientes con
fracturas vertebrales se identificaron a partir del código CIE-9 de alta.
Por lo tanto, la prueba de referencia utilizada fue el diagnóstico
realizado por los clínicos. De acuerdo con el protocolo asistencial
descrito en la sección de Material y Métodos, dicho diagnóstico se basaba
primariamente en el resultado del TAC, mientras que las demás técnicas
diagnósticas (la radiografía convencional, la resonancia nuclear
magnética) se usaban únicamente para valorar lesiones ligamentosas o
imágenes dudosas. El TAC helicoidal constituye, por tanto, una parte
esencial de la prueba de referencia. O, dicho de otra forma, la prueba se
compara consigo misma. La consecuencia obvia de este sesgo (el llamado
“sesgo de incorporación”) es una sobreestimación de la exactitud de la
prueba.
Como consecuencia de esta falta de una prueba de
referencia independiente todo paciente con resultado positivo del TAC se
considera como “enfermo” (verdadero positivo), con lo que desaparecen los
falsos positivos, y se asume, implícitamente, una especificidad del 100%.
El lector podría objetar que esta asunción es compartida por la mayoría
de los estudios que comparan la radiografía convencional con el TAC [6].
Sin embargo, se han comunicado casos de falsos positivos del TAC
helicoidal en el diagnóstico de fracturas cervicales [7]. Y, por otro
lado, el interés primario del clínico no consiste en conocer si hay o no
fractura, sino que necesita asimismo conocer la existencia de lesiones
ligamentosas; y es bien conocido, que la sensibilidad y especificidad del
TAC helicoidal para diagnosticar este tipo de lesiones es aún menor [7,
8]. Los autores tampoco facilitan información sobre el número de
verdaderos negativos (pacientes sin fractura con resultado negativo del
TAC). En estas condiciones, no se puede estimar la especificidad de la
prueba
(ni los cocientes de probabilidad) y, por tanto, no es posible aplicar el
teorema de Bayes para estimar la probabilidad post-prueba.
Respecto a los pacientes con resultado negativo del TAC,
el estudio los considera inicialmente como “no enfermos”, y sólo una parte
de ellos (no especificada en el artículo) son sometidos a un escrutinio
adicional mediante otras pruebas diagnósticas. En algunos pacientes (los
residentes en el condado de San Diego) se hizo un seguimiento a partir de
un registro comunitario, con el fin de detectar casos de fractura que
hubieran pasado inicialmente desapercibidos. Este seguimiento ambulatorio
constituiría, por tanto, un “segundo gold standard” imperfecto, con
una baja “sensibilidad” para detectar fracturas vertebrales. En principio,
este sesgo (conocido como “work-up detection bias” o sesgo de
verificación diferencial) conduciría a considerar algunos “falsos
negativos” como “verdaderos negativos” [9], con la consiguiente
sobreestimación tanto de la sensibilidad (subestimación de los falsos
negativos) como de la especificidad (sobreestimación de los verdaderos
negativos). Al objeto de evidenciar este sesgo, las recientes guías de
publicación de evaluaciones diagnósticas [10] aconsejan incluir en los
estudios de evaluación diagnóstica un diagrama de flujo en el que se
especifique el número de pacientes inicialmente incluidos en el estudio,
el número de pacientes en los que se realiza la prueba diagnóstica, el
número de pacientes en los que se realiza la prueba de referencia y el
número de pacientes con resultados equívocos.
Con los comentarios anteriores no pretendemos
cuestionar la utilidad del TAC helicoidal para el diagnóstico de las
lesiones vertebrales (corroborada por otros estudios), sino resaltar la
necesidad de una lectura crítica de las evaluaciones diagnósticas. Si una
nueva técnica diagnóstica es claramente superior a la prueba de referencia
previa, entonces debemos considerar la posibilidad de adoptarla como nueva
prueba de referencia. En este caso, hablar de la sensibilidad y
especificidad carece de sentido. La incorporación de la propia prueba en
estudio como parte del gold standard no es la solución.
Bibliografía:
-
Reid MC,
Lachs MS,
Feinstein AR.
Use of methodological standards in diagnostic test research.
Getting better but still not good. JAMA 1995; 274:
645-651. [Resumen]
[Artículos
relacionados]
-
Strauss SE, Richardson WS, Glasziou P, Haynes RB.
Evidence-based medicine. How to practice and teach EBM. 3th ed.
Edinburgh: Elsevier 2005.
-
www.redcaspe.org (acceso comprobado el 8 de agosto de 2005)
-
Brown CVR,
Antevil JL, Sise MJ, Sack DI. Spiral Computed
Tomography for the Diagnosis of Cervical, Thoracic, and Lumbar Spine
Fractures: Its Time has Come. J Trauma 2005; 58: 890-896.
[Resumen]
[Artículos
relacionados]
-
Molina E. TAC
helicoidal en el diagnótico de las fracturas vertebrales. [REMI
2005; 5 (8): 884]
-
Holmes JF,
Akkinepall R. Computed Tomography Versus Plain Radiography to Screen for
Cervical Spine Injury: A Meta-Analysis. J Trauma
2005; 58: 902-905. [Resumen]
[Artículos
relacionados]
-
Hanson JA, Blackmore CC, Mann FA, Wilson AJ. Cervical
spine injury: accuracy of helical CT used as a screening technique.
Emerg Radiology 2000; 7: 31-35.
-
Brohi K, Healy M, Fotheringham T, Chan O, Aylwin C,
Whitley S, Walsh M. Helical computed tomographic scanning for the
evaluation of the cervical spine in the unconscious, intubated trauma
patient. J Trauma 2005; 58: 897-901. [Resumen]
[Artículos
relacionados]
-
Knottnerus JA. The evidence base of clinical
diagnosis. Londres: BMJ Books, 2002.
-
Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA,
Glasziou P, Irwig LM, Lijmer JG, Moher D, Rennie D, de Vet CW, for the
STARD group. Towards complete and accurate reporting of studies of
diagnostic accuracy: the STARD initiative. BMJ 2003; 326: 41-44. [Resumen]
[Artículos
relacionados] [Texto
completo]
Jaime Latour Pérez
Hospital Universitario de Elche, Alicante
©REMI, http://remi.uninet.edu.
Agosto
2005.
Comentario Ricardo Abizanda Campos
Hola a todos:
Debo, una vez mas, felicitar a Jaime (LATOUR) por sus esfuerzos para que
todos aprendamos lo que no sabemos y deberíamos saber.
Sus comentarios, sobre el artículo referenciado del TAC helicoidal,
aportan una perspectiva sobre la metodología de interpretación de las
"pruebas de diagnóstico" que debería ser lección obligatoria para todos
los clínicos, incluidos los que nos sentimos abrumados por la aparente
evidencia en favor de aquello que no conocemos de primera mano. Los que
nos enfrentamos a politraumatismos, podemos tener la tentación de
considerar como la "biblia" un artículo sobre un tema complejo como ese.
Después (siguiendo con lo de la biblia) vendrá "el crujir de dientes"
cuando nuestras expectativas no queden realmente satisfechas con la
metodología predicada. El comentario de Jaime tiene otra
virtud. Llamar la atención sobre el hecho de que una publicación, aunque
sea en una revista de prestigio, no siempre responde a una verdadera criba
de calidad. En todas partes cuecen habas, que se dice en mi pueblo, y los
mecanismos de acceso a las revistas profesionales siguen siendo un "algo
variable". Gracias una vez más, Jaime. Por favor, sigue
así, Todos lo necesitamos. Ricardo Abinzanda
Campos
Hospital General de Castelló
©REMI, http://remi.uninet.edu.
Agosto
2005.
Comentario Federico Gordo Vidal
Acabo de leer el excelente editorial de Jaime y me surge una duda:
Estoy totalmente de acuerdo en las deficiencias que cita sobre el artículo
en lo referente fundamentalmente al sesgo de incorporación y a la falta de
datos para establecer los cocientes de probabilidad (que permitan calcular
la probabilidad postprueba), pero en este tipo de
estudio, me da la impresión de que más que la precisión diagnóstica, lo
verdaderamente útil es diagnosticar las lesiones existentes (verdaderos
positivos), y que se excluya las que no existen (verdaderos negativos) y
en ambos casos sí me parece útil la comparación del empleo del TAC con el algoritmo diagnóstico habitual (incluyendo o no TAC), junto a
la evolución posterior de los pacientes. Gracias de
antemano por vuestra respuesta y que paséis un espléndido verano.
Federico Gordo Vidal
Fundación Hospital Alcorcón, Madrid
©REMI, http://remi.uninet.edu.
Agosto
2005.
Réplica Jaime Latour Pérez
Comparto la opinión de Federico respecto a que lo importante es que el
test funcione en la práctica. De hecho, es posible (por razones ajenas al
estudio de Brown y cols. [1]) que el TAC helicoidal se acerque mucho al
test ideal (con pocos falsos positivos y falsos negativos). O incluso,
ignorando el problema de la especificidad al que me refería en el
editorial, ya sería suficiente con que el TAC fuera un test muy sensible (SnNout)
[2], con gran capacidad de excluir fracturas vertebrales (sin necesidad de
recurrir formalmente al teorema de Bayes). Si los autores del artículo
hubieran dicho: "Señores, el TAC ha identificado de forma convincente
fracturas vertebrales que habrían pasado desapercibidas en la radiografía
convencional de columna; por tanto, estamos ante un nuevo gold standard",
entonces yo tendría poco que objetar. El problema es que traten de
convencernos comparando el TAC consigo mismo y que acaben vendiéndonos que
la sensibilidad del test es de casi el 100%. Esto último puede ser verdad,
pero el estudio no lo demuestra.
Jaime Latour Pérez
Hospital General Universitario de Elche
©REMI, http://remi.uninet.edu.
Agosto
2005.
-
Brown CVR,
Antevil JL, Sise MJ, Sack DI. Spiral Computed
Tomography for the Diagnosis of Cervical, Thoracic, and Lumbar Spine
Fractures: Its Time has Come. J Trauma 2005; 58: 890-896.
[Resumen]
[Artículos
relacionados]
-
Strauss SE, Richardson WS, Glasziou P, Haynes RB.
Evidence-based medicine. How to practice and teach EBM. 3th ed.
Edinburgh: Elsevier 2005. p 77-78.
Palabras clave:
Diagnóstico, Prueba de referencia, Fracturas vertebrales, TAC helicoidal.
Busque en REMI con Google:
Envía tu comentario para su
publicación |