Le paradoxe de Simpson

Le paradoxe de Simpson et le test d'égalité des proportions
Je suis tombé par hasard sur un article intéressant expliquant comme mentir grâce aux statistiques. Cet article fait référence au paradoxe de Simpson. Le lecteur intéressé pourra également trouver des explications illustrées sous forme de dessins.
Le paradoxe de Simpson (Yule-Simpson) est un paradoxe statistique selon lequel le succès de plusieurs groupes s'inverse lorsque les groupes sont combinés. Ce résultat apparemment illogique est souvent rencontré dans la réalité, en particulier dans les sciences sociales et les statistiques médicales.

Sur la page Wikipédia, on y trouve cet exemple concret:

Un exemple réel provenant d'une étude médicale sur le succès de deux traitements contre les calculs rénaux permet de voir le paradoxe sous un autre angle.

La première table montre le succès global et le nombre de traitements pour chaque méthode.

Taux de succès (succès/total)
Traitement A Traitement B
78 % (273/350) 83 % (289/350)

Cela semble révéler que le traitement B est plus efficace. Maintenant, en ajoutant des données concernant la taille des calculs rénaux, la comparaison prend une autre tournure :

Résultats en fonction de la taille des calculs
petits calculs gros calculs
Traitement A Traitement B Traitement A Traitement B
93 % (81/87) 87 % (234/270) 73 % (192/263) 69 % (55/80)

L'information au sujet de la taille des calculs a inversé les conclusions concernant l'efficacité de chaque traitement. Le traitement A est maintenant considéré comme plus efficace dans les deux cas. Le traitement le plus efficace peut être déterminé grâce à l'inégalité entre les deux rapports (succès/total). Le rebroussement de cette inégalité, qui conduit au paradoxe, se produit à cause de deux effets concurrents :

  1. La variable supplémentaire (ici la taille) a un impact significatif sur les rapports.
  2. Les tailles des groupes qui sont combinés quand la variable supplémentaire est ignorée sont très différentes.

Curieux de nature, le statisticien cherche à savoir comment il aurait interpréter de tels résultats. C'est pourquoi j'ai simplement fait passer à ces résultats expérimentaux un petit test statistique. J'utilise le test d'égalité des proportions de R :

Pour le taux de succès global:
succes=c(273,289)
essais=c(350,350)
prop.test(succes,essais)

> p-value: 0.154
La différence dans le taux de succès global n'est pas significative au seuil de 1%, 5%, 10%, 15%...


Pour les petits calculs:
succes=c(81,234)
essais=c(87,270)
prop.test(succes,essais)

> p-value: 0.152
La différence pour les petits calculs rénaux n'est pas significative au seuil de 1%, 5%, 10%, 15%...


Pour les gros calculs:
succes=c(192,55)
essais=c(263,80)
prop.test(succes,essais)

> p-value: 0.548
La différence pour les gros calculs rénaux n'est pas significative au seuil de 1%, 5%, 10%, 15%...





Publié par olivier le 01 octobre 2012.
Lire les commentaires sur le paradoxe de simpson

Sur ce thème:
Analyse statistique : prévision du taux d'accès à internet en france
Analyse statistique : achat immobilier, quand acheter?