Как смоделировать член взаимодействия с квадратичными регрессорами?

Aug 19 2020

Я провожу регрессию с взаимодействием квадратичного непрерывного регрессора с категориальным регрессором. В Stata оператор двойного креста ##производит все комбинации моих регрессоров. Вот произвольный MWE:

* load data
use http://www.stata-press.com/data/r13/nlswork

* set panel structure
xtset idcode year

* fixed effects regression with interaction and square term
quietly xtreg ln_wage c.wks_ue##c.wks_ue##i.race union age i.year, i(idcode) fe 
estimates store model1 

* generate square term without interaction
gen wks_ue_sq = wks_ue^2
quietly xtreg ln_wage c.wks_ue##i.race wks_ue_sq union age i.year, i(idcode) fe 
estimates store model2

estimates table model1 model2, keep(wks_ue c.wks_ue#c.wks_ue race#c.wks_ue race#c.wks_ue#c.wks_ue wks_ue_sq ) b p

Должен ли я всегда использовать то, что я называю «полной модерацией»? Как я сделал бы в тройном взаимодействии. Есть теоретическая причина, по которой у меня есть квадратный член, и для взаимодействия в целом. Но я не могу дать хороший аргумент о том, что на самом деле представляет собой квадратичное взаимодействие в моем случае.

Ответы

2 BigBendRegion Aug 19 2020 at 22:12

Два ответа. Во-первых, включение квадрата взаимодействия почти всегда теоретически оправдывается теоремой Стоуна-Вейерштрасса, которая (в общих чертах) утверждает, что ваша истинная функция среднего отклика лучше и лучше аппроксимируется полиномами более высокого порядка в вашем$X$переменные. Квадрат члена взаимодействия является одним из таких полиномов более высокого порядка. Конечно, на практике следует опасаться переобучения и использования аппроксимирующих многочленов из-за их плохих свойств экстраполяции.

Однако в вашем случае это оправдание кажется не таким уж большим, потому что вам нужно обоснование предмета. Второй ответ, хотя и апостериорный и, следовательно, не идеальный, заключается в оценке двух моделей: (i) более простой, без взаимодействия в квадрате, но со всем остальным, считающимся актуальным, и (ii) та же модель, но с учетом взаимодействия в квадрате. Затем постройте графики профиля оценочного среднего значения$Y$ как функция вашего непрерывного $X$ для фиксированных значений вашего категориального $X$. Наложите профили для модели (i) и модели (ii), получив по одному графику для каждого уровня вашей категориальной переменной. Сравнение этих графиков, наряду с использованием ваших знаний в предметной области, должно помочь вам решить, что делает ваш квадратный термин взаимодействия и насколько это важно.

Редактировать, 21.08.2020. Одна вещь, которую можно предвидеть априори, когда квадратичный непрерывный предсказатель взаимодействует с категориальным предсказателем, заключается в том, что характер кривизны будет различаться в зависимости от категориального уровня. Например, на одних уровнях может быть выраженная кривизна, а на других - нет.