Evaluación crítica de un
ensayo controlado aleatorio (ECA)
Spanish Version
Otro día, otro ECA relacionado con el hombro, o eso
parece. El hombro parece ser un tema candente en este momento por los cientos
de ECA publicados en los últimos años. A primera vista, esto debería ser algo
bueno, pero en realidad puede ser bastante confuso, especialmente cuando no se
reciben mensajes claros y consistentes.
Entonces, teniendo esto en cuenta, este es el segundo
blog de una serie (aquí) que evaluará críticamente los ECA publicados
relacionados con el hombro con el objetivo de comprender cómo estos podrían ser
relevantes para la práctica.
Antes de comenzar, para aquellos de ustedes que no
están muy familiarizados con los ECA, en un blog anterior se discutió su diseño
básico y su justificación, aquí. Este podría ser un punto de partida útil si algunos
de los términos utilizados parecen desconocidos o confusos.
El blog de este mes se refiere a: Turgut et al. (2017). Efectos del
entrenamiento con ejercicios de estabilización escapular en la cinemática
escapular, la discapacidad y el dolor en el Pinzamiento subacromial: Un ECA.
Archivos de Medicina Física y Rehabilitación, 98, 1915-23. (DOI: 10.1016/j.apmr.2017.05.023)
En pocas palabras, este ECA se diseñó para evaluar si
el estiramiento y ejercicios de fortalecimiento junto con ejercicios de
estabilización escapular adicionales eran mejores que solo estiramiento y
ejercicios de fortalecimiento en pacientes clasificados con:
• - Arco
doloroso durante la flexión o abducción del hombro,
• - Dolor
con rotación externa y abducción resistida,
• - Disquinesia
escapular basada en la evaluación observacional combinada con una reducción del
dolor en el hombro durante el movimiento durante el test de asistencia
escapular.
Los investigadores plantearon la hipótesis de que el
grupo que recibió ejercicios adicionales de estabilización escapular mejoraría
la posición y el movimiento de su escápula y reportaría menos dolor y
discapacidad que el grupo que no recibió los ejercicios adicionales de
estabilización escapular. En resumen, los autores informan que no hay
diferencias significativas en el dolor y discapacidad entre los dos grupos
después de un programa de entrenamiento de 12 semanas. Sin embargo, informan
que observaron cambios estadísticamente significativos en la cinemática
escapular en el grupo que recibió ejercicios específicos de estabilización
escapular en comparación con los que no lo hicieron. Por lo tanto, la
cinemática escapular pareció mejorar, pero esto no se asoció con mayores
reducciones en el dolor o mejoras en la función.
Dado que los
estudios previos no informaron cambios en la cinemática escapular mientras que
los pacientes informaron una reducción del dolor y una mejor función [1] y dado
que el papel de la disquinesia escapular en el hombro es incierto [2], parece
un hallazgo interesante.
Apreciación critica:
En lugar de llevar a cabo una evaluación crítica
sistemática e integral, para fines de blog, nos centraremos en algunos aspectos
clave que pueden ayudarnos a juzgar si podemos confiar en los hallazgos de un
ECA o si debemos ser cautelosos o incluso rechazar los hallazgos. Por lo tanto,
tenga esto en cuenta y siéntase libre de agregar al debate como mejor le
parezca.
Con respecto a Turgut et al, hay cuatro áreas en las
que nos centraremos:
1. Diferencias entre las características de
los grupos
2. Diferencias en la dosis de ejercicio
recibida por los dos grupos
3. Medición de la disquinesia escapular
4. Tamaño de la muestra e incertidumbre
1.
Diferencias entre las características de
los grupos:
Una característica de un ECA bien realizado es que
los dos o más grupos que son creados sean similares al inicio de la prueba en
términos de los factores que conocemos, como por ejemplo, edad, altura, peso,
etc., pero también los factores que no conocemos o son difíciles de
caracterizar, por ejemplo, el perfil genético. Esto es importante porque si
queremos concluir al final del ECA que una intervención, es decir, el ejercicio
focalizados en la escapular es mejor que otra intervención como el ejercicio
general de fortalecimiento, entonces debemos estar seguros de que las únicas
diferencias verdaderas entre los grupos son la intervención que ellos recibieron.
Si esto no es así, no podemos estar seguros de que las diferencias que
observamos se deben a la intervención y no a algún otro factor. Si esto parece
confuso, se dan ejemplos en el blog anterior (aquí) para explicar más esto.
Ahora, esto podría no parecer importante en este ECA
porque Turgut y cols. No informaron diferencias estadísticamente significativas
entre los dos grupos después del programa de entrenamiento de 12 semanas. Pero,
en una inspección más cercana, es evidente que las características de base de
los dos grupos son diferentes; el grupo que recibe los ejercicios adicionales
de estabilización escapular (el grupo de intervención) es en promedio seis años
más joven (33.4 comparado con 39.5 años) y en promedio tiene un Índice de Masa
Corporal (IMC) dos puntos más bajo (23.7 comparado a 25.8 - equivalente a 7kg
de diferencia para un hombre de 1,8 m).
¿Por qué esto podría ser importante? Se reconoce que
la edad puede estar asociada con un peor pronóstico y que la evaluación de la
disquinesia escapular es difícil, es decir, es inherentemente poco confiable.
No está claro si la diferencia de edad en este ECA es relevante, pero es
probable que el IMC promedio más alto del grupo de control (como se refleja en
los criterios de selección para el ECA) dificulte la evaluación de la
disquinesia escapular y por lo tanto sea más difícil determinar si ha sucedido un
cambio.
No está claro por qué se produjo el desequilibrio en
las características iniciales. Turgut et al utilizan un método válido para
generar su secuencia aleatoria, pero no informan cómo oculto su asignación, lo
que suscita preocupación. Otros factores, por ejemplo, el dolor y la
discapacidad, parecen estar bien equilibrados. La razón otra vez podría estar
relacionada con el tamaño de muestra pequeño. Para demostrar esto, toma dos
monedas y un amigo. Los dos tiran la moneda diez veces. ¿Obtienen el mismo
número de cara o cruz entre sí? ¿Tienes cinco caras y cinco cruces?
Probablemente no, porque este es un proceso aleatorio. Ahora intente voltear
las monedas 20 veces; es probable que aún obtenga una cantidad diferente de
caras y cruces entre sí, pero es probable que obtenga un número más equilibrado
de caras y cruces. Ahora intente dar vuelta la moneda 30 veces y el impacto de
aumentar el tamaño de la muestra, es decir, el número de volteos, se volverá
más claro a medida que el número de caras y cruces se acercan con más volteos.
2.
Diferencias en la dosis de ejercicio
recibida por los dos grupos
Se ha informado una relación de respuesta a la dosis
de ejercicio para pacientes que se quejan de dolor en el hombro, pero que aún
pueden mover su brazo [3,4]. Esto es importante en el contexto de este ECA que
busca evaluar si un tipo específico de ejercicio, es decir, ejercicios adicionales
de estabilización escápular, confiere mejores resultados clínicos. En este
contexto, debemos considerar si algún resultado se debe al tipo específico de
ejercicio o simplemente debido a que se hace más ejercicio.
Turgut et al. estandarizó los ejercicios de
estiramiento entre los grupos pero el grupo de intervención realizó diferentes
ejercicios de fortalecimiento para el grupo control (se agregó un paso a cada
uno) y una cantidad diferente de ejercicio resistido debido a la adición de los
ejercicios de estabilización escápular (un mínimo de 240 repeticiones y un
máximo de 480 repeticiones 3 veces por semana en comparación con un mínimo de
90 repeticiones y un máximo de 180 repeticiones 3 veces por semana en el grupo
de control). Por lo tanto, cualquier diferencia observada entre los dos grupos
podría deberse a la dosis adicional de ejercicio en lugar de deberse al tipo
específico de ejercicio.
3.
Medición de la disquinesia escapular:
Como ya se mencionó, la medición de la disquinesia
escapular es difícil e inherentemente poco confiable. Turgut et al. Utilizó un
sistema de seguimiento electromagnético e informó la evidencia que respalda la
confiabilidad y la validez, pero con errores de medición estándar que varían
entre 3.37⁰ y 7.44⁰ y un cambio mínimo detectable que varía de 7.81⁰ a 17.27⁰.
Dado que 8⁰ fue considerado como una diferencia asimétrica importante por los
autores, el desafío de medición es claro de ver. Pero, esta limitación es
apropiadamente reconocida por Turgut et al. en su sección de limitaciones y no
es inmediatamente evidente lo que podrían haber hecho de manera diferente con
respecto a la herramienta de medición utilizada; aun así, esta es una
limitación importante.
Sin embargo, dados estos problemas relacionados con
la medición, una característica del diseño que podría ser útil es cegar al
evaluador de resultados. El cegamiento es cuando los participantes / pacientes,
los médicos y aquellos que evalúan los resultados de la investigación
desconocen qué tratamiento recibió el paciente y se lo conoce como cegamiento
simple, doble y triple, respectivamente. El cegamiento del evaluador de
resultados protege contra el sesgo de medición. Sesgo de medición es un riesgo
donde la medición no es objetiva, por ejemplo, vivo o muerto, y donde el
evaluador de resultados podría influir en la medición consciente o inconscientemente,
tal vez porque tienen preferencia por una de las intervenciones. Por ejemplo,
si los propios investigadores tuvieran la hipótesis de que la adición de
ejercicios de estabilización escapular daría lugar a mejores resultados
clínicos para realizar la medición, es posible sugerir que podría haber un
riesgo de sesgo de medición.
El cegamiento de la evaluación de resultados no fue
informado por Turgot et al, pero debería haber sido factible, aunque muchos
estudios se hacen con limitaciones de recursos que podrían haber evitado el
empleo de personal adicional. A pesar de esto, la falta de cegamiento del
evaluador de resultados en este ECA es potencialmente otra limitación.
4. Tamaño de la muestra e incertidumbre:
Si bien es posible generar hallazgos a partir de un ECA
pequeño que se consideran con validez interna, es decir, podemos confiar en
ellos, lo que luego se vuelve difícil es generalizar con algún grado de certeza
esos hallazgos a la población en general. Recuerde, a menudo en la
investigación intentamos inferir los hallazgos de nuestra muestra de
investigación a la población en general, es decir, con respecto a Turgot et al,
de los 30 participantes en el ECA a la población más amplia de pacientes con este
tipo de dolor de hombro. Cuanto menor es la muestra, más inciertos estamos que
los hallazgos sean generalizables para la población en general porque
simplemente tenemos menos información. Esta incertidumbre a menudo ahora se
presenta como un intervalo de confianza del 95%, es decir, el rango de valores
dentro del cual tenemos un 95% de certeza de que radica el verdadero valor
poblacional (reconociendo que no estaremos 100% seguros a menos que
investiguemos la totalidad de la población, lo cual generalmente no es
posible). Por ejemplo, un ECA podría concluir que la diferencia entre los dos
grupos en el ensayo fue de dos puntos en una escala analógica visual del dolor
a favor del grupo de intervención con un intervalo de confianza del 95% de -2 a
+4. Estas estadísticas significan que en el ECA, la diferencia observada entre
los grupos fue de dos puntos. Pero, si tuviéramos que repetir este estudio, la
diferencia real podría ser dos puntos a favor del grupo de control (-2) o hasta
cuatro puntos a favor del grupo de intervención (+4). En este ejemplo, vemos
que el intervalo de confianza cruza el cero, es decir, el punto donde no hay
diferencia entre los dos grupos y, en consecuencia, este resultado se
consideraría como no estadísticamente significativo.
Es posible que esté familiarizado con la
significación estadística con respecto al valor p con p> 0.05 considerado
como no estadísticamente significativo. Esto significa, en base a los datos de
muestra, que no podemos rechazar la hipótesis nula, la cual no establece
ninguna diferencia entre los grupos. Es importante leer esta declaración con
cuidado porque no es lo mismo que decir que los dos grupos son iguales.
Dado que el intervalo de confianza del 95% brinda un
rango de valores que son más fáciles de interpretar, esto es ahora preferido
según lo que solicitan guías de reporte. Desafortunadamente, Turgot et al solo
nos presentan valores de p que sugieren que no hay una diferencia
estadísticamente significativa entre los dos grupos en términos de dolor de
hombro y discapacidad al inicio, después de seis y 12 semanas. Pero, observando
más de cerca, observamos que la diferencia entre los dos grupos en términos del
puntaje total SPADI (Índice de dolor y discapacidad del hombro) es de siete
puntos por seis semanas y de 13 puntos por 12 semanas a favor del grupo que
recibió los ejercicios adicionales de estabilización escapular (10 puntos se
consideran cambios clínicamente significativos en el SPADI). Entonces, ¿por qué
Turgot et al informan que no hay diferencia? Una razón podría ser que el número
de participantes en el ensayo es muy pequeño (15 en cada grupo), la variable de
datos y, por lo tanto, no hay pruebas suficientes para rechazar la hipótesis
nula que no hay una verdadera diferencia entre los dos grupos, debido a la
información limitada proporcionada por el pequeño número de participantes. Por
lo tanto, la falta de una diferencia estadísticamente significativa no se debe
a que los resultados del ECA sugieran que los dos grupos tienen el mismo
efecto, sino que no hay evidencia suficiente a partir de los datos - esta es
una diferencia vitalmente importante, posiblemente indicativa de un error de
Tipo II (alguna lectura adicional posterior al blog para usted).
Conclusión:
Entonces, debido a la preocupación por la diferencia
en las características basales, la diferente dosis de ejercicio, el posible
error de medición y el riesgo de sesgo, no podemos confiar en que los cambios
informados en la cinemática escapular sean válidos y atribuibles a la adición
de ejercicios de estabilización escapular. Además, debido al pequeño tamaño de
la muestra, no podemos estar seguros de que el informe de que ninguna
diferencia estadísticamente significativa entre los dos grupos infiera que la
efectividad clínica de las intervenciones en este ECA son similares. Por lo
tanto, en base a esta evaluación crítica, se recomienda que los hallazgos de
este ECA se traten con precaución; actualmente no está claro cómo estos
resultados desarrollan nuestra comprensión sobre cómo, o incluso si, la cinemática
escapular cambia en respuesta a la intervención. Tampoco está claro cómo los
resultados de este ECA nos ayudan a desarrollar nuestra comprensión de los
componentes importantes de un programa de ejercicios.
Es de esperar que haya algunos puntos de aprendizaje
en este blog, aunque una implicación clara para la futura investigación
relacionada con la fisioterapia es que los ECA que buscan determinar la
efectividad de diferentes intervenciones necesitan una muestra suficiente para
generar recomendaciones de tratamiento con confianza y sean diseñados para
aumentar la confianza de que cualquier diferencia observada se puede atribuir a
una variable de interés.
Gracias por leer, espero que haya sido útil;
pensamientos recibidos con gratitud
Translated by Tomas Parraguez on behalf of:
Chris Littlewood, Tomas Parraguez, Brian Cho, Sijmen Hacquebord, Paul Regan
[1] Bury J, West M, Chamorro-Moriana G,
Littlewood C. Effectiveness of scapula-focused approaches in patients with
rotator cuff related shoulder pain: A systematic review and meta-analysis. Man
Ther 2016;25:35–42. doi:10.1016/j.math.2016.05.337.
[2] Littlewood C,
Cools AMJ. Scapular dyskinesis and shoulder pain: the devil is in the detail.
Br J Sports Med 2017;0:bjsports-2017-098233. doi:10.1136/bjsports-2017-098233.
[3] Osteras H,
Torstensen T, Haugerud L, Osteras B. Dose-response effects of graded
therapeutic exercises in patients with long-standing subacromial pain. Adv
Physiother 2009;11:199–209.
[4] Littlewood C,
Malliaras P, Chance-Larsen K. Therapeutic Exercise for rotator cuff
tendinopathy: A systematic review of contextual factors and prescription
parameters. Int J Rehabil Res 2015;38.
No comments:
Post a Comment