Статистика - Анализ остатков

Анализ остатков используется для оценки соответствия модели линейной регрессии путем определения остатков и изучения графиков графика остатков.

Остаточный

Остаток ($ e $) относится к разнице между наблюдаемым значением ($ y $) и прогнозируемым значением ($ \ hat y $). Каждая точка данных имеет один остаток.

$ {остаток = наблюдаемое значение - прогнозируемое значение \\ [7pt] e = y - \ hat y} $

Остаточный участок

График остатков - это график, на котором остатки расположены на вертикальной оси, а независимая переменная - на горизонтальной оси. Если точки случайным образом распределены вокруг горизонтальной оси, то для данных подходит модель линейной регрессии; в противном случае выберите нелинейную модель.

Виды остаточного участка

В следующем примере показано несколько шаблонов на остаточных графиках.

В первом случае точки располагаются случайным образом. Поэтому предпочтительна модель линейной регрессии. Во втором и третьем случае точки расположены неслучайно, что говорит о предпочтении метода нелинейной регрессии.

пример

Problem Statement:

Проверьте, подходит ли модель линейной регрессии для следующих данных.

$ x $ 60 70 80 85 95
$ y $ (Фактическое значение) 70 65 70 95 85
$ \ hat y $ (Прогнозируемое значение) 65,411 71 849 78 288 81,507 87,945

Solution:

Step 1: Вычислите остатки для каждой точки данных.

$ x $ 60 70 80 85 95
$ y $ (Фактическое значение) 70 65 70 95 85
$ \ hat y $ (Прогнозируемое значение) 65,411 71 849 78 288 81,507 87,945
$ e $ (Остаток) 4,589 -6,849 -8,288 13 493 -2,945

Step 2: - Нарисуйте остаточный график графика.

Step 3: - Проверить случайность остатков.

Здесь остаточный график демонстрирует случайный образец - первый остаток положительный, следующие два отрицательные, четвертый положительный и последний остаток отрицательный. Поскольку шаблон является довольно случайным, что указывает на то, что модель линейной регрессии подходит для приведенных выше данных.