Tests de rangs - Travail d'Etude et de Recherche
Tests sur deux échantillons indépendants
Les
statistiques de rangs trouvent leur application dans le cadre de
tests de loi entre deux échantillons; c'est à dire,
pour deux échantillonset
,
de variable
et
,
de loi
et
inconnues,
le test
contre
.
Plus particulièrement, on s'intéressera ici au modèle dit de localisation :
de
médiane nulle (
),
i.e.
.
Nous
effectuerons donc des tests sous l'hypothèse nulle :
«et
égales
».
Le
test de localisation tire son nom du fait qu'il s'agit de déterminer
si les médianes des deux lois sont « localisées »
au même point. Pour ce faire, nous testerons si, après
la réunion des échantillonset
,
la médiane de la loi
a
été translatée ou non.
Ceci
peut être résumé au fait de tester uniquement le
paramètreainsi,
le test d'hypothèse devient
contre
.
Bien
les tests se basent alors sur le paramètre,
le domaine de statistique reste non paramétrique, car les
lois
et
sont
supposées inconnues.
Test de la médiane
Le
principe de ce test est de déterminer la médiane
empirique de la réunion des deux échantillons, et de
compter le nombrede
termes du second échantillon supérieurs à cette
médiane.
Statistique du test de la médiane :
Soientles
rangs de
dans
;
.
Sous,
donc
:
donc
est
un échantillon de loi
;
la loi de
en
est donc indépendante (voir théorème), et
suit
ainsi une loi indépendante de
.
Théorème
: au niveau,
-
Cas
:
;
quantile d'ordre
de
;
-
Cas
:
;
quantile d'ordre
de
;
-
Cas
:
;
quantile d'ordre
de
,
quantile d'ordre
de
.
Théorème :
Sous,
loi
hypergéométrique, de paramètres dépendant
de
:
-
:
-
:
i.e
:.
Corollaire
: sous,
Corollaire
: sous,
centrée
réduite converge en loi vers la loi gaussienne.
Plus
exactement : si,
,
;
alorsen
loi.
Dans
la pratique, on observe que la convergence s'applique même
pour,
si
et
sont
assez grands (la loi hypergéométrique converge vers une
loi binomiale, qui elle même converge vers une loi normale).