Набор данных многомерной регрессии (многоцелевой регрессии), где известно, что некоторые коэффициенты регрессии равны нулю

Aug 19 2020

Я ищу образец набора данных для многомерной линейной регрессии, также известной как многоцелевой или многоцелевой. Желательно иметь более 10 входов и более 10 выходов. Кажется, здесь не так много хороших примеров. В идеале я бы также хотел, чтобы набор данных был таким, чтобы некоторые коэффициенты регрессии были заведомо равными нулю, т.е. мы знаем, что определенные входные данные не влияют на определенные выходы. Я создал смоделированный набор данных, но я надеюсь на набор реальных примеров данных.

Предположим, есть $p$ входные переменные и $q$ переменные ответа, а регрессионная модель $Y = XC + \epsilon$.
$Y$ является $n \times q$ матрица $X$ является $n \times p$ матрица и $C$ является $p \times q$матрица. Я ищу набор данных, в которых мы знаем определенные записи$C$ равны 0, но не целые строки $C$. Другими словами, у нас нет некоторых входных переменных, которые не влияют на какие-либо выходы, только некоторые входные переменные, которые не влияют на несколько выходных переменных.

Кажется, у меня не так много хороших наборов данных для нескольких целей, поэтому я надеюсь, что кто-то может указать мне правильное направление.

благодаря

Ответы

2 AkylasStratigakos Sep 21 2020 at 00:42

Эта работа по многоцелевой регрессии предоставляет подробную информацию об используемых наборах данных.

Изменить: игнорировать вышеизложенное. Это ссылка на статью о многоцелевой регрессии . Используемые наборы данных общедоступны по этой ссылке:http://mulan.sourceforge.net/datasets-mtr.html

BigBendRegion Aug 19 2020 at 21:28

Вы можете легко собрать такие данные. Соберите друзей и попросите их записать свой рост и последние две цифры своего удостоверения личности или номера кредитной карты. Позволять$Y_1$ быть высотой, $Y_2$ быть двухзначным идентификатором, и $X_1$быть первой из двух цифр. потом$X_1$ не имеет отношения к $Y_1$ но сильно связан с $Y_2$.