x
1

Paradoja de Simpson



En probabilidad y estadística, la paradoja de Simpson o efecto Yule-Simpson es una paradoja en la cual una tendencia que aparece en varios grupos de datos desaparece cuando estos grupos se combinan y en su lugar aparece la tendencia contraria para los datos agregados. Esta situación se presenta con frecuencia en las ciencias sociales, en los experimentos de Andre y en la estadística médica,[1]​ y es causa de confusión cuando a la frecuencia de los datos se le asigna sin fundamento una interpretación causal.[2]​ La paradoja desaparece cuando se analizan las relaciones causales presentes.

Aunque relativamente desconocida para la mayoría de las personas, la paradoja de Simpson es bien conocida para los estadísticos y se describe en muchos libros introductorios de estadística.[3][4]​ Muchos estadísticos creen que se debería informar al público sobre resultados contrarios a la intuición como la paradoja de Simpson.[5][6]

El fenómeno fue descrito por vez primera por Edward H. Simpson en un artículo técnico de 1951,[7]​ pero ya había sido descrito previamente por Karl Pearson, et al., en 1899,[8]​ y por Udny Yule en 1903[9]​ El nombre paradoja de Simpson fue usado por vez primera por Colin R. Blyth en 1972.[10]

Dado que Edward Simpson no descubrió realmente esta paradoja estadística (siendo un caso de la ley de eponimia de Stigler), algunos escritores prefieren hacer uso de los términos impersonales paradoja de la reversión y paradoja de la amalgamación, o en ocasiones el efecto Yule-Simpson.[11]

La siguiente tabla muestra los porcentajes de éxito y la cantidad de tratamientos que involucran cálculos grandes y pequeños. Aquí se denota por Tratamiento A a los procedimientos abiertos y por Tratamiento B a la nefrolitotomía percutánea:

La conclusión paradójica es que el tratamiento A es más efectivo cuando se usa tanto en cálculos pequeños como en cálculos grandes, aunque el tratamiento B es más efectivo cuando se consideran ambos tamaños al mismo tiempo. En este caso, la variable "escondida" (o factor de confusión) del tamaño del cálculo no se conocía que fuera importante de antemano antes de que se incluyeran sus efectos.

El tratamiento que se considera mejor se determina mediante una desigualdad entre dos proporciones (éxitos/total). La reversión de la desigualdad entre las proporciones crea la paradoja de Simpson, la cual sucede cuando los siguientes dos efectos se dan de forma simultánea.

Este ejemplo ficticio sigue en temática al del caso anterior, pero con números exageradamente dicotomizados con objeto de facilitar la comprensión del fenómeno.

La siguiente tabla muestra para este caso ficticio, igual que en el ejemplo real, los porcentajes de éxito y la cantidad de tratamientos que involucran al problema tipo "1" y al problema tipo "2":

En este caso está claro que el estudio no tiene validez por lo extremo de las muestras, pero la paradoja subyacente se conserva: el tratamiento A es mejor en ambos tipos de problema, pero el tratamiento B es mejor en el conjunto. Se hace asimismo más evidente dónde está el riesgo, al haberse explotado en el ejemplo: el hecho de que las muestras estadísticas sean tan dicotómicas entre tipos de problema, provoca la aparente contradicción.

Una de los ejemplos mejor conocidos de la paradoja de Simpson ocurrió cuando se presentó una demanda contra la Universidad de California, Berkeley por discriminación contra las mujeres que habían solicitado su ingreso al posgrado. Los resultados de las admisiones para el verano de 1973 mostraban que los hombres solicitantes tenían mayor posibilidad de ser elegidos que las mujeres y que la diferencia era tal que no era posible que fuera debida al azar.[14][15]

Sin embargo, al examinar los departamentos de forma individual, se encontró que en ningún departamento existía un sesgo contra las mujeres. De hecho, la mayoría de los departamentos había presentado un "pequeño pero estadísticamente significativo sesgo en favor de las mujeres"[15]​ Los datos de los seis mayores departamentos se listan debajo.

El artículo de investigación de Bickel, et al.[15]​ concluyó que las mujeres solían presentar solicitudes en campos competitivos con bajo porcentaje de admisiones (tales como el departamento de lengua inglesa) mientras que los hombres solían presentar en departamentos con menor competencia y mayor porcentaje de admisiones (como ingeniería y química). Las condiciones bajo las cuales los datos de frecuencia de las admisiones de departamentos específicos constituyeron una defensa contra los cargos de discriminación se encuentran consignadas en el libro Causality (Causalidad) por Pearl.[2]



Escribe un comentario o lo que quieras sobre Paradoja de Simpson (directo, no tienes que registrarte)


Comentarios
(de más nuevos a más antiguos)


Aún no hay comentarios, ¡deja el primero!