Tests de rangs - Travail d'Etude et de Recherche
Tests sur deux échantillons indépendants
Les statistiques de rangs trouvent leur application dans le cadre de tests de loi entre deux échantillons; c'est à dire, pour deux échantillonset , de variableet , de loiet inconnues, le testcontre .
Plus particulièrement, on s'intéressera ici au modèle dit de localisation :
de médiane nulle (), i.e. .
Nous effectuerons donc des tests sous l'hypothèse nulle : «et égales ».
Le test de localisation tire son nom du fait qu'il s'agit de déterminer si les médianes des deux lois sont « localisées » au même point. Pour ce faire, nous testerons si, après la réunion des échantillonset , la médiane de la loia été translatée ou non.
Ceci peut être résumé au fait de tester uniquement le paramètreainsi, le test d'hypothèse devientcontre .
Bien les tests se basent alors sur le paramètre, le domaine de statistique reste non paramétrique, car les loiset sont supposées inconnues.
Test de la médiane
Le principe de ce test est de déterminer la médiane empirique de la réunion des deux échantillons, et de compter le nombrede termes du second échantillon supérieurs à cette médiane.
Statistique du test de la médiane :
Soientles rangs dedans ;
.
Sous, donc : doncest un échantillon de loi; la loi deen est donc indépendante (voir théorème), etsuit ainsi une loi indépendante de.
Théorème : au niveau,
-
Cas: ;
quantile d'ordrede ;
-
Cas: ;
quantile d'ordrede ;
-
Cas: ;
quantile d'ordrede , quantile d'ordrede .
Théorème :
Sous, loi hypergéométrique, de paramètres dépendant de:
-
:
-
:
i.e :.
Corollaire : sous,
Corollaire : sous, centrée réduite converge en loi vers la loi gaussienne.
Plus exactement : si, , ;
alorsen loi.
Dans la pratique, on observe que la convergence s'applique même pour, siet sont assez grands (la loi hypergéométrique converge vers une loi binomiale, qui elle même converge vers une loi normale).