II.D. DESARROLLO DE LAS REVISIONES SISTEMÁTICAS

Los revisores llevaron a cabo las revisiones sistemáticas de las preguntas consensuadas con los expertos siguiendo la metodología habitual.

Una documentalista (MPR) y un coordinador (EL) revisaron todas las estrategias de búsqueda para que los términos utilizados para la selección de la población, intervención y los desenlaces fueran homogéneos entre las distintas revisiones a realizar, y facilitaron los documentos seleccionados para la revisión. La búsqueda de la literatura se realizó en noviembre de 2011 en las siguientes bases de datos: MEDLINE, Embase, y Cochrane Central.

En la tabla 1 se muestra el tipo y pregunta de las revisiones realizadas:

Tabla 1. Revisiones sistemáticas realizadas.

Tipo Pregunta
Diagnóstico Valor de la ecografía musculoesquelética y la resonancia magnética para el diagnóstico de gota
Pronóstico Valor de ecografía musculoesquelética y resonancia magnética para monitorizar la respuesta al tratamiento de la gota
Diagnóstico Valor diagnóstico de las pruebas de función renal en la insuficiencia renal crónica
Eficacia Eficacia del tratamiento no farmacológico
Eficacia Eficacia y seguridad del tratamiento combinado
Seguridad Seguridad del alopurinol (hipersensibilidad, Síndrome de Stevens-Johnson)
Eficacia Eficacia y seguridad de los corticoides frente a AINE

Abreviaturas: AINE= antiinflamatorio no esteroideo.

Todas las revisiones se adaptaron a un formato de edición consensuado para facilitar la interpretación posterior. Una vez realizadas, las revisiones se remitieron al panel de expertos para su valoración y evaluación del grado de evidencia.
Paralelamente al desarrollo de las revisiones sistemáticas, se solicitó a los expertos que redactaran recomendaciones para su capítulo correspondiente. Estas recomendaciones se compilaron en un documento de trabajo para que todos los integrantes del panel emitieran una opinión o clarificaran aspectos concretos.
Por último, se convocó a expertos y revisores a poner en común los resultados de las revisiones y las recomendaciones asociadas.
Para la gradación del nivel de evidencia se utilizaron los niveles del Oxford Center of Evidence-Based Medicine (5). Esta clasificación permite calcular la fuerza de las recomendaciones y evaluar la calidad de la evidencia en base al mejor diseño para contestar la pregunta (tabla 2).

Tabla 2. Niveles de evidencia del Oxford Center of Evidence-Based Medicine (2001).

GR NE Eficacia y seguridad Eficacia y seguridad
de fármacos (misma clase)
Pronóstico Diagnóstico Diagnóstico diferencial,
prevalencia
A 1a RS EC (homogeneidad*) RS EC “head-to-head” (homogeneidad*) RS cohortes inicio (homogeneidad*); CDR † validadas en diferentes poblaciones RS estudios de diagnóstico nivel 1 (homogeneidad*); CDR de estudios 1b multicéntricos RS cohortes prospectivos (homogeneidad*)
1b EC individual (con IC estrecho) EC “head-to-head” con desenlaces clínicos importantes Cohortes inicio individual con > 80% seguimiento; CDR † validada en 1 población Estudio cohortes validatorio** con buenos estándares de referencia †††; CDR † validada en un centro Estudio cohortes prospectivo con buen seguimiento****
1c EC “todos o ninguno” § Serie casos “todos o ninguno” SpPins y SnNouts absolutos †† Serie casos “todos o ninguno”
B 2a RS(homogeneidad*) estudios de cohortes EC “head-to-head” con desenlaces surrogados validados RS (homogeneidad*) cohortes retrospectivos o grupos control en EC RS ( homogeneidad*) estudios de diagnóstico de nivel>2 RS(homogeneidad*) 2b y estudios mejores
2b Estudio individual cohortes (o EC de baja calidad; p.e., <80% seguimiento) EC diferentes drogas v. placebo en pacientes similares o diferentes con desenlaces importantes clínicamente o surrogados validados Estudio cohortes retrospectivo o seguimiento de placebos en EC; Derivación de CRD † o validada en media muestra solo §§§ Estudio cohortes exploratorio** con buenos estándares de referencia †††; Derivación de CRD† o validada en media muestra solo §§§ o bases de datos Estudio cohortes retrospectivo o con bajo seguimiento
2c “Outcomes” Research; estudios ecológicos “Outcomes” Research Estudios ecológicos
3a RS estudios caso-control (homogeneidad*) Análisis subgrupo EC de diferentes drogas v. placebo en pacientes similares o diferentes con outcomes clínicos importantes o surrogados validados RS estudios > = 3b (homogeneidad*) RS estudios > = 3b (homogeneidad*)
3b Estudio individual caso – control EC diferentes drogas v. placebo en pacientes similares o diferentes con outcomes surrogados no validados Estudio no consecutivo o que no aplica de forma consistente estándares de referencia Estudio no consecutivo de cohortes o población muy limitada
C 4 Series casos (y estudios de cohortes o casos-control de baja calidad) §§ Estudios observacionales y bases de datos administrativas con outcomes clínicamente importantes Series casos y estudios de pronóstico de baja calidad*** Estudio casos y controles o con estándar de referencia malo o no independiente Series casos o que no se ajusta a estándares de referencia
D 5 Opinión expertos sin evaluación crítica explícita o basada en fisiología, ciencia básica o principios Opinión expertos sin evaluación crítica explícita o basada en fisiología, ciencia básica o principios o en estudios no aleatorizados con outcomes surrogados no validados Opinión expertos sin evaluación crítica explícita o basada en fisiología, ciencia básica o principios Opinión expertos sin evaluación crítica explícita o basada en fisiología, ciencia básica o principios Opinión expertos sin evaluación crítica explícita o basada en fisiología, ciencia básica o principios

Abreviaturas: GR= grado/fuerza de la recomendación; NE= nivel de evidencia; RS= revisión sistemática; EC= ensayo clínico; CDR=clinical decisión rule (regla de decisión clínica).

Notas: Se debe añadir un signo negativo “-” para advertir del nivel que falla en la intención de dar una respuesta concluyente como resultado de: 1) un estudio aislado con un intervalo de confianza ancho; o 2) una revisión sistemática con heterogeneidad controvertida. En estos casos la evidencia no es concluyente, por lo que solo puede dar lugar a recomendaciones de grado D.
* Por homogeneidad entendemos la ausencia de controversia o heterogeneidad estadística o de diseño. Pueden existir revisiones con heterogeneidad estadística pero no relevante desde el punto de vista clínico.
† Regla de Decisión Clínica: Se trata de algoritmos o sistemas de puntuación para estimar un pronóstico o crear una clasificación diagnóstica.
‡ Ver primera indicación arriba con respecto a cómo comprender, evaluar y utilizar ensayos u otros estudios con amplios intervalos de confianza.
§ Se cumplen cuando todos los pacientes murieron antes de disponer del tratamiento, pero ahora algunos sobreviven con él; o cuando algunos pacientes murieron antes del tratamiento, pero ninguno murió con él.
§§ Por cohorte de mala calidad entendemos las que no tienen una buena definición de los grupos de comparación o las medidas no se realizan de forma ciega u objetiva o tienen un seguimiento incompleto o demasiado corto o no tienen en cuenta variables confusoras importantes. Por estudio de casos y controles de mala calidad entendemos aquellos que o bien no definen bien los grupos de comparación o las medidas no son del todo ciegas o realizadas de la misma y objetiva manera, o no se tienen en cuenta variables confusoras importantes.
§§§ Una Split-sample validation (validación en muestra dividida) consiste en dividir la muestra de forma aleatoria en dos partes, una en la que se realiza la derivación y otra en la que se valida.
†† Un “Absolute SpPin” es un hallazgo diagnóstico cuya especificidad es tan alta que un resultado Positivo “rules-in” (esto es que confirma el diagnóstico). Un “Absolute SnNout” es un hallazgo diagnóstico cuya Sensibilidad es tan alta que un resultado Negativo “rules-out” (esto es que descarta el diagnóstico).
‡‡ Bueno, mejor, malo y peor se refieren a las comparaciones entre tratamientos en cuanto a sus riesgos y beneficios clínicos.
††† Los estándares de referencia “buenos” son independientes de la prueba y se aplican de forma ciega u objetivamente a todos los pacientes. Los estándares de referencia “malos o pobres” no se aplican de forma ciega u objetiva, pero también son independientes de la prueba. La utilización de un estándar de referencia no independiente (el test está incluido o afecta a la referencia) implica que se trata de un estudio de nivel 4.
†††† Tratamientos de mejor valor son igualmente buenos pero más baratos, o incluso mejores pero de un coste económico similar o inferior. Tratamientos de peor valor son igualmente buenos pero de mayor coste, o peores pero de coste económico similar o superior.
** Los estudios de validación, evalúan la validez de una prueba diagnóstica específica, en base a la evidencia previa. Los estudios exploratorios recogen información y la analizan para buscar factores con asociación “significativa”.
*** Por estudio de cohortes pronóstico de pobre calidad entendemos aquél en el que el muestreo está sesgado a favor de pacientes que ya han tenido el desenlace, o en el que éste se observa en menos del 80% de los pacientes, o se mide de una forma no objetiva o sin corregir por variables de confusión.
**** Se puede considerar que el seguimiento es adecuado si es superior al 80%, con un tiempo suficiente para que aparezcan diagnósticos alternativos (es decir, de 1-6 meses en agudos ó de 1-5 años en crónicos).
Otro objetivo de esta reunión fue cuantificar el nivel de acuerdo y de consenso existente entre los expertos. Para esta evaluación se utilizó el método Delphi, (dos rondas) mediante encuestas anónimas online así como de una reunión presencial.
La GPC fue evaluada por dos revisores externos, un reumatólogo experto en esta área clínica (FPR) y un metodólogo experto en la realización de guías de práctica clínica (MJGY).