Python - P-значение
Значение p говорит о силе гипотезы. Мы строим гипотезу на основе некоторой статистической модели и сравниваем ее достоверность, используя значение p. Один из способов получить p-значение - использовать T-тест.
Это двусторонний тест для нулевой гипотезы о том, что ожидаемое значение (среднее значение) выборки независимых наблюдений 'a' равно заданному среднему значению генеральной совокупности, popmean. Рассмотрим следующий пример.
from scipy import stats
rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2))
print stats.ttest_1samp(rvs,5.0)
Вышеупомянутая программа сгенерирует следующий вывод.
Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]),
pvalue = array([ 0.16726344, 0.00945234]))
Сравнение двух образцов
В следующих примерах представлены две выборки, которые могут происходить как из одного, так и из разного распределения, и мы хотим проверить, имеют ли эти образцы одинаковые статистические свойства.
ttest_ind- Вычисляет Т-критерий для средних значений двух независимых выборок оценок. Это двусторонняя проверка нулевой гипотезы о том, что две независимые выборки имеют одинаковые средние (ожидаемые) значения. Этот тест предполагает, что по умолчанию совокупности имеют одинаковые дисперсии.
Мы можем использовать этот тест, если наблюдаем две независимые выборки из одной или разной совокупности. Рассмотрим следующий пример.
from scipy import stats
rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
print stats.ttest_ind(rvs1,rvs2)
Вышеупомянутая программа сгенерирует следующий вывод.
Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)
Вы можете протестировать то же самое с новым массивом той же длины, но с другим средним значением. Используйте другое значение вloc и протестируйте то же самое.