viernes, 21 de julio de 2017

La importancia de la aleatorización

Fig.1
Lo que voy a comentar en esta entrada es conocido por la mayoría de todos nosotros seamos profesionales que leemos artículos científicos habitualmente o incluso personas legas mínimamente informadas. Pero creo que merece la pena que nos detengamos a reflexionar sobre este asunto porque continuamente en noticias científicas en la prensa u otros medios o en las que compartimos por las redes sociales -como Twitter- se nos informa de pretendidas relaciones causales entre una exposición a algo y un resultado en base a estudios que no están aleatorizados. La mayoría de los estudios que  vamos a leer son observacionales , sean prospectivos o retrospectivos que utilizan registros sanitarios y otras bases de datos pero muy pocos son aleatorizados. Y hay que tener muy clara una cosa: con datos observacionales nunca podemos estar seguros de que existe un proceso causal

Como podemos leer en Wikipedia, la aleatorización o randomización consiste en asignar aleatoriamente (al azar) a los participantes en un ensayo a dos o más grupos de tratamiento o de control. La aleatorización es una de las formas de evitar los sesgos de selección. El patrón oro de los estudios científicos es el estudio controlado aleatorizado pero este estándar, por razones éticas y prácticas, no se puede aplicar en la investigación de muchos fenómenos. El artículo de Andrade que cito en la bibliografía explica muy bien este problema tomando como ejemplo el uso de antidepresivos durante el embarazo. Imaginemos que hacemos un estudio comparando a mujeres que han usado antidepresivos durante el embarazo con mujeres que no los han usado. Instintivamente tendemos a pensar que si hacemos esta comparación la única diferencia entre ambos grupos es que unas mujeres han tomado el antidepresivo y otras no pero se supone que son iguales en todo lo demás. Pues esto no es cierto y asumir esto es no tener en cuenta un gran número de sesgos.

Por ejemplo, Boukhris y cols. realizaron un estudio de mujeres a las que se les había administrado o no un antidepresivo durante el embarazo y se observó que las que habían recibido antidepresivos eran más mayores, con menos estudios y con más probabilidad de vivir solas y de recibir ayudas sociales. También sufrían diabetes e hipertensión en mayor medida y podría haber habido otras diferencias que no se midieron como el consumo de tabaco o  el uso de drogas. Todas estas variables pueden ser responsables de los resultados del estudio y no el uso de antidepresivos.

Un caso especial de sesgo debido a la ausencia de randomización es la confusión con la indicación (confounding by indication). Esto ocurre cuando atribuimos un resultado al fármaco empleado pero el resultado se debe en realidad a la enfermedad para la que se ha prescrito el fármaco. Consideremos un hipotético estudio en el que se encuentra que los ISRS se asocian a un bajo peso al nacer. Es posible que los ISRS comprometan el crecimiento fetal pero es también posible que, dado que la depresión se asocia a pérdida de apetito, disminución del peso materno y peor nutrición materna, ese resultado se deba a la propia depresión materna. Lo contrario también es posible. Por ejemplo, si evitamos recetar antidepresivos tricíclicos a pacientes con patología cardiaca previa, observaremos una aparente seguridad cardiaca de estos antidepresivos en las personas que los reciben (poca gente que los tome tendrá complicaciones cardiacas) pero esto también sería debido a una confusión por la indicación.
Como decía, una manera de solucionar este problema de la confusión con la indicación en estudios no randomizados es comparar sólo mujeres con depresión que reciben o no un antidepresivo, con lo que parece que si los dos grupos de mujeres están deprimidas no surge el problema de la  confusión con la indicación. Sin embargo, en ausencia de aleatorización pueden ser sesgos desconocidos los que decidan que una mujer reciba el tratamiento y estos sesgos pueden influenciar el resultado. Por ejemplo, se podría tratar con un antidepresivo sólo a las mujeres que tuvieran las depresiones más graves y esa mayor gravedad se asocia a variables que no medimos (como peor nutrición, peor cumplimiento de las indicaciones ginecológicas/obstétricas, mayor consumo de tabaco o drogas, etc.) que afectan al resultado. El problema de la confusión por la indicación no se soluciona limitando el estudio sólo a mujeres depresivas.

Para solucionar todos estos problemas, se utilizan métodos estadísticos, como la regresión múltiple, pero hay que entender también sus limitaciones. Por ejemplo, no se pueden incluir variables que no se han medido o que no están en la base de datos y puede haber factores que influyen en el resultado que desconocemos y que, por lo tanto, no podemos controlar. Si no hemos medido el consumo de tabaco o el uso de drogas ilegales pues no lo vamos a poder arreglar con técnicas estadísticas. También ocurre que cuantas más variables corregimos va aumentando el intervalo de confianza, como podemos ver en la figura 2, con lo que al final no sabemos lo que estamos midiendo. Otras técnicas más sofisticadas como la Propensión Score Matching, de la que habla Andrade en su artículo, también tienen sus problemas. No voy a entrar en ellos pero el mensaje es que estas técnicas estadísticas son útiles cuando no podemos recurrir al patrón oro de los estudios aleatorizados pero nunca nos van a permitir llegar a conclusiones definitivas causa-efecto entre los tratamientos y los resultados. 

Aunque estoy refiriéndome a un tema algo técnico este problema como decía al principio lo vemos todos los días en la prensa. Por ejemplo, supongamos (estoy inventando) que se nos informa de que, según cierto estudio, los vegetarianos viven más que los no vegetarianos. El primer impulso es pensar que la mayor longevidad es debida a la dieta pero si nos acordamos del principio que estoy tratando en esta entrada nos vamos a dar cuenta de que puede haber miles de diferencias entre vegetarianos y no vegetarianos. Por ejemplo, los vegetarianos pueden estar más preocupados por su salud y además de dieta vegetariana resulta que no beben alcohol o no fuman o hacen más ejercicio, o tal vez tienen más nivel económico lo que les permite acceder a una mejor sanidad…Es sólo un ejemplo. 

Por último, tenemos que considerar los factores genéticos. La mayoría de estudios, incluidos los que se publican en revistas importantes, no controlan los genes. Vuelvo a improvisar pero se publican estudios que dicen que niños que oyen a Mozart o Beethoven de pequeños son más inteligentes de mayores; o que si sus padres les hacen leer luego van a ir mejor en los estudios; o que si sufren maltrato infantil esto va a tener determinado consecuencias. Pero hay que recordar que los padres pasan a los hijos dos cosas: unos genes y un ambiente y si no controlamos para los genes no sabemos si un efecto se debe al ambiente o a los genes. Es decir, padres más inteligentes escuchan a Mozart o leen más libros y tienen una  buen biblioteca en casa pero sus hijos no van a ser más inteligentes por la biblioteca que hay en casa sino porque han heredado unos genes (la inteligencia es heredable en un 80%) que les predisponen a leer, estudiar, etc. De igual manera, si un niño sufre maltrato infantil es posible que sea porque sus padres padecen algún trastorno mental como alcoholismo o un trastorno de personalidad. Este tipo de trastornos tienen una heredabilidad aproximada del 50%. Los problemas de mayores pueden deberse a la influencia de esos genes heredados de los padres.

En resumen, si nos grabamos bien este principio de que sin aleatorización no hay posibilidad de establecer relación de causalidad y que nos encontramos sólo ante una correlación vamos a estar muy bien armados para leer de una manera crítica los estudios que nos llegan continuamente y para separar mejor el polvo de la paja.

@pitiklinov

Referencias:





No hay comentarios:

Publicar un comentario