一部の回帰係数がゼロであることがわかっている多変量回帰(マルチターゲット回帰)データセット
多変量線形回帰のサンプルデータセットを探しています。これは、マルチターゲットまたはマルチ出力とも呼ばれます。できれば、10を超える入力と10を超える出力を使用します。良い例はあまりないようです。理想的には、一部の回帰係数がゼロであることがわかっている、つまり特定の入力が特定の出力に影響を与えないことがわかっているようなデータセットも必要です。シミュレートされたデータセットを作成しましたが、実際のデータセットの例を期待しています。
あるとしましょう $p$ 入力変数と $q$ 応答変数、および回帰モデルは $Y = XC + \epsilon$。
$Y$ は $n \times q$ マトリックス、 $X$ は $n \times p$ 行列、および $C$ は $p \times q$マトリックス。の特定のエントリを知っているデータのセットを探しています$C$ は0ですが、の行全体ではありません $C$。つまり、出力に影響を与えない入力変数はなく、いくつかの出力変数に影響を与えない入力変数がいくつかあります。
マルチターゲットに適したデータセットはあまりないようですので、誰かが私を正しい方向に向けてくれることを願っています。
ありがとう
回答
マルチターゲット回帰に関するこの作業は、使用されたデータセットに関する詳細情報を提供します
編集:上記は無視してください。これは、マルチターゲット回帰に関する参考論文です。使用されるデータセットは、次のリンクで公開されています。http://mulan.sourceforge.net/datasets-mtr.html
このようなデータを簡単に収集できます。友達を集めて、身長とIDまたはクレジットカード番号の下2桁を書き留めてもらいます。しましょう$Y_1$ 高さであること、 $Y_2$ 2桁のIDであり、 $X_1$2桁の最初の数字になります。次に$X_1$ とは無関係です $Y_1$ しかし、強く関連しています $Y_2$。