二乗回帰子との交互作用項をモデル化する方法は?
二乗連続回帰分析とカテゴリ回帰分析の相互作用を使用して回帰を実行します。Stataでは、ダブルクロス演算子##
は私のリグレッサーのすべての組み合わせを生成します。これが任意のMWEです。
* load data
use http://www.stata-press.com/data/r13/nlswork
* set panel structure
xtset idcode year
* fixed effects regression with interaction and square term
quietly xtreg ln_wage c.wks_ue##c.wks_ue##i.race union age i.year, i(idcode) fe
estimates store model1
* generate square term without interaction
gen wks_ue_sq = wks_ue^2
quietly xtreg ln_wage c.wks_ue##i.race wks_ue_sq union age i.year, i(idcode) fe
estimates store model2
estimates table model1 model2, keep(wks_ue c.wks_ue#c.wks_ue race#c.wks_ue race#c.wks_ue#c.wks_ue wks_ue_sq ) b p

私は常に「完全な節度」と呼ぶものに行くべきですか?私が3つの相互作用で行うように。私が二乗項を持っている理由と、一般的な相互作用には理論的な理由があります。しかし、私の場合、二乗項の相互作用が実際に何を表すかについては、良い議論をすることはできません。
回答
2つの答え。まず、二乗相互作用を含めることは、理論的には、ストーン・ワイエルシュトラスの定理によってほぼ常に正当化されます。これは、真の平均応答関数が、より高次の多項式によってより良く近似されることを(大まかに)述べています。$X$変数。二乗交互作用項は、そのような高次の多項式項の1つです。もちろん、実際には、過剰適合や、外挿特性が低いために近似多項式を使用することについて心配する必要があります。
ただし、主題の論理的根拠が必要なため、この正当化はあなたの場合はそれほど大きくないようです。2番目の答えは、事後的であり、したがって理想的ではありませんが、2つのモデルを推定することです。次に、の推定平均のプロファイルプロットを作成します。$Y$ あなたの継続的な関数として $X$ カテゴリの固定値の場合 $X$。カテゴリ変数のレベルごとに1つのグラフが与えられた場合、モデル(i)とモデル(ii)のプロファイルをオーバーレイします。これらのプロットを、主題の知識を使用して比較すると、二乗交互作用項が何をしているのか、そしてそれが重要かどうかを判断するのに役立ちます。
編集、2020年8月21日。二乗連続予測子がカテゴリ予測子と相互作用するときに事前に予測できることの1つは、曲率の特性がカテゴリレベルによって異なることです。たとえば、一部のレベルでは顕著な曲率があり、他のレベルではない場合があります。