Python - Valeur P
La valeur p correspond à la force d'une hypothèse. Nous construisons une hypothèse basée sur un modèle statistique et comparons la validité du modèle en utilisant la valeur p. Une façon d'obtenir la valeur p est d'utiliser le test T.
Il s'agit d'un test bilatéral pour l'hypothèse nulle selon laquelle la valeur attendue (moyenne) d'un échantillon d'observations indépendantes `` a '' est égale à la moyenne de la population donnée, popmean. Prenons l'exemple suivant.
from scipy import stats
rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2))
print stats.ttest_1samp(rvs,5.0)
Le programme ci-dessus générera la sortie suivante.
Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]),
pvalue = array([ 0.16726344, 0.00945234]))
Comparaison de deux échantillons
Dans les exemples suivants, il y a deux échantillons, qui peuvent provenir de la même distribution ou d'une distribution différente, et nous voulons tester si ces échantillons ont les mêmes propriétés statistiques.
ttest_ind- Calcule le test T pour les moyennes de deux échantillons indépendants de scores. Il s'agit d'un test bilatéral pour l'hypothèse nulle selon laquelle deux échantillons indépendants ont des valeurs moyennes (attendues) identiques. Ce test suppose que les populations ont des variances identiques par défaut.
Nous pouvons utiliser ce test, si nous observons deux échantillons indépendants d'une population identique ou différente. Prenons l'exemple suivant.
from scipy import stats
rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
print stats.ttest_ind(rvs1,rvs2)
Le programme ci-dessus générera la sortie suivante.
Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)
Vous pouvez tester la même chose avec un nouveau tableau de même longueur, mais avec une moyenne variée. Utilisez une valeur différente dansloc et testez le même.