Как смоделировать член взаимодействия с квадратичными регрессорами?
Я провожу регрессию с взаимодействием квадратичного непрерывного регрессора с категориальным регрессором. В Stata оператор двойного креста ##
производит все комбинации моих регрессоров. Вот произвольный MWE:
* load data
use http://www.stata-press.com/data/r13/nlswork
* set panel structure
xtset idcode year
* fixed effects regression with interaction and square term
quietly xtreg ln_wage c.wks_ue##c.wks_ue##i.race union age i.year, i(idcode) fe
estimates store model1
* generate square term without interaction
gen wks_ue_sq = wks_ue^2
quietly xtreg ln_wage c.wks_ue##i.race wks_ue_sq union age i.year, i(idcode) fe
estimates store model2
estimates table model1 model2, keep(wks_ue c.wks_ue#c.wks_ue race#c.wks_ue race#c.wks_ue#c.wks_ue wks_ue_sq ) b p

Должен ли я всегда использовать то, что я называю «полной модерацией»? Как я сделал бы в тройном взаимодействии. Есть теоретическая причина, по которой у меня есть квадратный член, и для взаимодействия в целом. Но я не могу дать хороший аргумент о том, что на самом деле представляет собой квадратичное взаимодействие в моем случае.
Ответы
Два ответа. Во-первых, включение квадрата взаимодействия почти всегда теоретически оправдывается теоремой Стоуна-Вейерштрасса, которая (в общих чертах) утверждает, что ваша истинная функция среднего отклика лучше и лучше аппроксимируется полиномами более высокого порядка в вашем$X$переменные. Квадрат члена взаимодействия является одним из таких полиномов более высокого порядка. Конечно, на практике следует опасаться переобучения и использования аппроксимирующих многочленов из-за их плохих свойств экстраполяции.
Однако в вашем случае это оправдание кажется не таким уж большим, потому что вам нужно обоснование предмета. Второй ответ, хотя и апостериорный и, следовательно, не идеальный, заключается в оценке двух моделей: (i) более простой, без взаимодействия в квадрате, но со всем остальным, считающимся актуальным, и (ii) та же модель, но с учетом взаимодействия в квадрате. Затем постройте графики профиля оценочного среднего значения$Y$ как функция вашего непрерывного $X$ для фиксированных значений вашего категориального $X$. Наложите профили для модели (i) и модели (ii), получив по одному графику для каждого уровня вашей категориальной переменной. Сравнение этих графиков, наряду с использованием ваших знаний в предметной области, должно помочь вам решить, что делает ваш квадратный термин взаимодействия и насколько это важно.
Редактировать, 21.08.2020. Одна вещь, которую можно предвидеть априори, когда квадратичный непрерывный предсказатель взаимодействует с категориальным предсказателем, заключается в том, что характер кривизны будет различаться в зависимости от категориального уровня. Например, на одних уровнях может быть выраженная кривизна, а на других - нет.