Editorial nº 53


ISSN: 1578-7710	Editorial nº 53
	Editorial nº 53
	REMI está dirigida exclusivamente a profesionales de la salud

Primera página
Organigrama
Política de privacidad
Derechos de copia

Secciones:
Enlaces
Club de lectura
Pautas de actuación
Debates
Casos clínicos
Arte y Medicina

Revista:
REMI 2001, Vol 1
REMI 2002, Vol 2
REMI 2003; Vol 3
REMI 2004; Vol 4
REMI 2005; Vol 5
REMI 2006; Vol 6
REMI 2007; Vol 7
Buscar

Auspiciada por la

REMI suscribe los principios del código HON
Compruébelo aquí

Revista Electrónica de Medicina Intensiva
Editorial nº 53. Vol 5 nº 8, agosto 2005.
Autor: Jaime Latour Pérez

[ Arriba ]

[ Anterior ] [ Siguiente ]

Valoración crítica de los estudios sobre diagnóstico
[Versión para imprimir]

Artículo REMI relacionado: Molina E. TAC helicoidal en el diagnóstico de las fracturas vertebrales. [REMI 2005; 5 (8): 884].

Comentarios: [Ricardo Abizanda Campos] [Federico Gordo Vidal]. Réplica: [Jaime Latour Pérez]

Es sabido que las evaluaciones diagnósticas que se publican adolecen frecuentemente de una baja calidad metodológica [1]. Ello obliga al lector a ser precavido a la hora de aplicar a la práctica clínica los resultados de dichos estudios. Afortunadamente, la valoración crítica de la validez y relevancia de un estudio de diagnóstico está al alcance de cualquier clínico, si se siguen las guías disponibles [2, 3]. El reciente estudio de Brown y col. [4], comentado en REMI [5], en el que se estudia la utilidad del TAC helicoidal para el diagnóstico de fracturas de columna, ofrece la oportunidad de discutir algunos de los puntos críticos de las evaluaciones diagnósticas.

Para saber si una prueba (el TAC helicoidal en este caso) identifica correctamente a la condición en estudio (fracturas vertebrales) es necesario disponer de una prueba de referencia (el “gold standard”) que separe a los individuos que tienen realmente la condición en estudio (los “enfermos”) de los que no la tienen (los “no enfermos”). Por ello, el primer criterio para valorar la validez de una evaluación diagnóstica es comprobar si la prueba se compara con una prueba de referencia aceptable. En el estudio de Brown y col. los pacientes con fracturas vertebrales se identificaron a partir del código CIE-9 de alta. Por lo tanto, la prueba de referencia utilizada fue el diagnóstico realizado por los clínicos. De acuerdo con el protocolo asistencial descrito en la sección de Material y Métodos, dicho diagnóstico se basaba primariamente en el resultado del TAC, mientras que las demás técnicas diagnósticas (la radiografía convencional, la resonancia nuclear magnética) se usaban únicamente para valorar lesiones ligamentosas o imágenes dudosas. El TAC helicoidal constituye, por tanto, una parte esencial de la prueba de referencia. O, dicho de otra forma, la prueba se compara consigo misma. La consecuencia obvia de este sesgo (el llamado “sesgo de incorporación”) es una sobreestimación de la exactitud de la prueba.

Como consecuencia de esta falta de una prueba de referencia independiente todo paciente con resultado positivo del TAC se considera como “enfermo” (verdadero positivo), con lo que desaparecen los falsos positivos, y se asume, implícitamente, una especificidad del 100%. El lector podría objetar que esta asunción es compartida por la mayoría de los estudios que comparan la radiografía convencional con el TAC [6]. Sin embargo, se han comunicado casos de falsos positivos del TAC helicoidal en el diagnóstico de fracturas cervicales [7]. Y, por otro lado, el interés primario del clínico no consiste en conocer si hay o no fractura, sino que necesita asimismo conocer la existencia de lesiones ligamentosas; y es bien conocido, que la sensibilidad y especificidad del TAC helicoidal para diagnosticar este tipo de lesiones es aún menor [7, 8]. Los autores tampoco facilitan información sobre el número de verdaderos negativos (pacientes sin fractura con resultado negativo del TAC). En estas condiciones, no se puede estimar la especificidad de la prueba (ni los cocientes de probabilidad) y, por tanto, no es posible aplicar el teorema de Bayes para estimar la probabilidad post-prueba.

Respecto a los pacientes con resultado negativo del TAC, el estudio los considera inicialmente como “no enfermos”, y sólo una parte de ellos (no especificada en el artículo) son sometidos a un escrutinio adicional mediante otras pruebas diagnósticas. En algunos pacientes (los residentes en el condado de San Diego) se hizo un seguimiento a partir de un registro comunitario, con el fin de detectar casos de fractura que hubieran pasado inicialmente desapercibidos. Este seguimiento ambulatorio constituiría, por tanto, un “segundo gold standard” imperfecto, con una baja “sensibilidad” para detectar fracturas vertebrales. En principio, este sesgo (conocido como “work-up detection bias” o sesgo de verificación diferencial) conduciría a considerar algunos “falsos negativos” como “verdaderos negativos” [9], con la consiguiente sobreestimación tanto de la sensibilidad (subestimación de los falsos negativos) como de la especificidad (sobreestimación de los verdaderos negativos). Al objeto de evidenciar este sesgo, las recientes guías de publicación de evaluaciones diagnósticas [10] aconsejan incluir en los estudios de evaluación diagnóstica un diagrama de flujo en el que se especifique el número de pacientes inicialmente incluidos en el estudio, el número de pacientes en los que se realiza la prueba diagnóstica, el número de pacientes en los que se realiza la prueba de referencia y el número de pacientes con resultados equívocos.

Con los comentarios anteriores no pretendemos cuestionar la utilidad del TAC helicoidal para el diagnóstico de las lesiones vertebrales (corroborada por otros estudios), sino resaltar la necesidad de una lectura crítica de las evaluaciones diagnósticas. Si una nueva técnica diagnóstica es claramente superior a la prueba de referencia previa, entonces debemos considerar la posibilidad de adoptarla como nueva prueba de referencia. En este caso, hablar de la sensibilidad y especificidad carece de sentido. La incorporación de la propia prueba en estudio como parte del gold standard no es la solución.

Bibliografía:

Reid MC, Lachs MS, Feinstein AR. Use of methodological standards in diagnostic test research. Getting better but still not good. JAMA 1995; 274: 645-651. [Resumen] [Artículos relacionados]
Strauss SE, Richardson WS, Glasziou P, Haynes RB. Evidence-based medicine. How to practice and teach EBM. 3th ed. Edinburgh: Elsevier 2005.
www.redcaspe.org (acceso comprobado el 8 de agosto de 2005)
Brown CVR, Antevil JL, Sise MJ, Sack DI. Spiral Computed Tomography for the Diagnosis of Cervical, Thoracic, and Lumbar Spine Fractures: Its Time has Come. J Trauma 2005; 58: 890-896. [Resumen] [Artículos relacionados]
Molina E. TAC helicoidal en el diagnótico de las fracturas vertebrales. [REMI 2005; 5 (8): 884]
Holmes JF, Akkinepall R. Computed Tomography Versus Plain Radiography to Screen for Cervical Spine Injury: A Meta-Analysis. J Trauma 2005; 58: 902-905. [Resumen] [Artículos relacionados]
Hanson JA, Blackmore CC, Mann FA, Wilson AJ. Cervical spine injury: accuracy of helical CT used as a screening technique. Emerg Radiology 2000; 7: 31-35.
Brohi K, Healy M, Fotheringham T, Chan O, Aylwin C, Whitley S, Walsh M. Helical computed tomographic scanning for the evaluation of the cervical spine in the unconscious, intubated trauma patient. J Trauma 2005; 58: 897-901. [Resumen] [Artículos relacionados]
Knottnerus JA. The evidence base of clinical diagnosis. Londres: BMJ Books, 2002.
Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou P, Irwig LM, Lijmer JG, Moher D, Rennie D, de Vet CW, for the STARD group. Towards complete and accurate reporting of studies of diagnostic accuracy: the STARD initiative. BMJ 2003; 326: 41-44. [Resumen] [Artículos relacionados] [Texto completo]

Jaime Latour Pérez
Hospital Universitario de Elche, Alicante
©REMI, http://remi.uninet.edu. Agosto 2005.

Comentario Ricardo Abizanda Campos

Hola a todos:

Debo, una vez mas, felicitar a Jaime (LATOUR) por sus esfuerzos para que todos aprendamos lo que no sabemos y deberíamos saber.

Sus comentarios, sobre el artículo referenciado del TAC helicoidal, aportan una perspectiva sobre la metodología de interpretación de las "pruebas de diagnóstico" que debería ser lección obligatoria para todos los clínicos, incluidos los que nos sentimos abrumados por la aparente evidencia en favor de aquello que no conocemos de primera mano. Los que nos enfrentamos a politraumatismos, podemos tener la tentación de considerar como la "biblia" un artículo sobre un tema complejo como ese. Después (siguiendo con lo de la biblia) vendrá "el crujir de dientes" cuando nuestras expectativas no queden realmente satisfechas con la metodología predicada.

El comentario de Jaime tiene otra virtud. Llamar la atención sobre el hecho de que una publicación, aunque sea en una revista de prestigio, no siempre responde a una verdadera criba de calidad. En todas partes cuecen habas, que se dice en mi pueblo, y los mecanismos de acceso a las revistas profesionales siguen siendo un "algo variable".

Gracias una vez más, Jaime. Por favor, sigue así, Todos lo necesitamos.

Ricardo Abinzanda Campos
Hospital General de Castelló
©REMI, http://remi.uninet.edu. Agosto 2005.

Comentario Federico Gordo Vidal

Acabo de leer el excelente editorial de Jaime y me surge una duda:

Estoy totalmente de acuerdo en las deficiencias que cita sobre el artículo en lo referente fundamentalmente al sesgo de incorporación y a la falta de datos para establecer los cocientes de probabilidad (que permitan calcular la probabilidad postprueba), pero en este tipo de estudio, me da la impresión de que más que la precisión diagnóstica, lo verdaderamente útil es diagnosticar las lesiones existentes (verdaderos positivos), y que se excluya las que no existen (verdaderos negativos) y en ambos casos sí me parece útil la comparación del empleo del TAC con el algoritmo diagnóstico habitual (incluyendo o no TAC), junto a la evolución posterior de los pacientes.

Gracias de antemano por vuestra respuesta y que paséis un espléndido verano.

Réplica Jaime Latour Pérez

Comparto la opinión de Federico respecto a que lo importante es que el test funcione en la práctica. De hecho, es posible (por razones ajenas al estudio de Brown y cols. [1]) que el TAC helicoidal se acerque mucho al test ideal (con pocos falsos positivos y falsos negativos). O incluso, ignorando el problema de la especificidad al que me refería en el editorial, ya sería suficiente con que el TAC fuera un test muy sensible (SnNout) [2], con gran capacidad de excluir fracturas vertebrales (sin necesidad de recurrir formalmente al teorema de Bayes). Si los autores del artículo hubieran dicho: "Señores, el TAC ha identificado de forma convincente fracturas vertebrales que habrían pasado desapercibidas en la radiografía convencional de columna; por tanto, estamos ante un nuevo gold standard", entonces yo tendría poco que objetar. El problema es que traten de convencernos comparando el TAC consigo mismo y que acaben vendiéndonos que la sensibilidad del test es de casi el 100%. Esto último puede ser verdad, pero el estudio no lo demuestra.

Brown CVR, Antevil JL, Sise MJ, Sack DI. Spiral Computed Tomography for the Diagnosis of Cervical, Thoracic, and Lumbar Spine Fractures: Its Time has Come. J Trauma 2005; 58: 890-896. [Resumen] [Artículos relacionados]
Strauss SE, Richardson WS, Glasziou P, Haynes RB. Evidence-based medicine. How to practice and teach EBM. 3th ed. Edinburgh: Elsevier 2005. p 77-78.

Palabras clave: Diagnóstico, Prueba de referencia, Fracturas vertebrales, TAC helicoidal.

Busque en REMI con Google:

Envía tu comentario para su publicación


© REMI, http:// remi.uninet.edu © REMI-L		webmaster: remi@uninet.edu última modificación: 01/07/2007

© REMI, http:// remi.uninet.edu © REMI-L

webmaster: remi@uninet.edu última modificación: 01/07/2007

© REMI, http:// remi.uninet.edu
© REMI-L

webmaster: remi@uninet.edu
última modificación: 01/07/2007