Conjunto de datos de regresión multivariante (regresión de múltiples objetivos) donde se sabe que algunos coeficientes de regresión son cero
Estoy buscando un conjunto de datos de muestra para la regresión lineal multivariante, también conocida como multi-objetivo o multi-salida. Preferiblemente con más de 10 entradas y más de 10 salidas. No parece haber muchos buenos ejemplos. Idealmente, también me gustaría que el conjunto de datos fuera tal que se sepa que algunos coeficientes de regresión son cero, es decir, sabemos que ciertas entradas no afectan a ciertas salidas. He creado un conjunto de datos simulado, pero espero un conjunto de datos de ejemplo real.
Supongamos que hay $p$ variables de entrada y $q$ variables de respuesta, y el modelo de regresión es $Y = XC + \epsilon$.
$Y$ es un $n \times q$ matriz, $X$ es un $n \times p$ matriz, y $C$ es un $p \times q$matriz. Estoy buscando un conjunto de datos donde sepamos ciertas entradas de$C$ son 0, pero no filas enteras de $C$. En otras palabras, no tenemos algunas variables de entrada que no afectan ninguna salida, solo algunas variables de entrada que no afectan algunas variables de salida.
No parece que haya muchos buenos conjuntos de datos para múltiples objetivos, así que espero que alguien pueda señalarme en la dirección correcta.
Gracias
Respuestas
Este trabajo sobre regresión de múltiples objetivos proporciona información detallada sobre los conjuntos de datos utilizados
Editar: ignore lo anterior. Este es el documento de referencia sobre regresión de objetivos múltiples . Los conjuntos de datos utilizados se ponen a disposición del público en este enlace:http://mulan.sourceforge.net/datasets-mtr.html
Fácilmente podría recopilar algunos datos como este. Reúna a algunos amigos y pídales que escriban su altura y los dos últimos dígitos de su identificación o número de tarjeta de crédito. Dejar$Y_1$ ser alto $Y_2$ ser el ID de dos dígitos, y $X_1$ser el primero de los dos dígitos. Luego$X_1$ no está relacionado con $Y_1$ pero fuertemente relacionado con $Y_2$.