일부 회귀 계수가 0 인 것으로 알려진 다변량 회귀 (다중 대상 회귀) 데이터 세트
다중 대상 또는 다중 출력이라고도하는 다변량 선형 회귀에 대한 샘플 데이터 세트를 찾고 있습니다. 10 개 이상의 입력과 10 개 이상의 출력을 사용하는 것이 좋습니다. 좋은 예가 많지 않은 것 같습니다. 이상적으로는 일부 회귀 계수가 0 인 것으로 알려진 데이터 세트가 필요합니다. 즉, 특정 입력이 특정 출력에 영향을 미치지 않는다는 것을 알고 있습니다. 시뮬레이션 된 데이터 세트를 만들었지 만 실제 예제 데이터 세트가 필요합니다.
거기에 있다고 가정하십시오 $p$ 입력 변수 및 $q$ 반응 변수이고 회귀 모델은 $Y = XC + \epsilon$.
$Y$ 이다 $n \times q$ 매트릭스, $X$ 이다 $n \times p$ 매트릭스 및 $C$ 이다 $p \times q$매트릭스. 특정 항목을 알고있는 데이터 세트를 찾고 있습니다.$C$ 0이지만 전체 행은 아닙니다. $C$. 즉, 출력에 영향을주지 않는 일부 입력 변수가없고 일부 출력 변수에 영향을주지 않는 일부 입력 변수 만 있습니다.
나는 다중 대상에 대한 좋은 데이터 세트가 많은 것 같지 않으므로 누군가가 나를 올바른 방향으로 안내 할 수 있기를 바랍니다.
감사
답변
다중 대상 회귀에 대한 이 작업 은 사용 된 데이터 세트에 대한 자세한 정보를 제공합니다.
편집 : 위의 내용을 무시하십시오. 이것은 다중 표적 회귀 에 대한 참조 논문입니다 . 사용 된 데이터 세트는 다음 링크에서 공개적으로 사용할 수 있습니다.http://mulan.sourceforge.net/datasets-mtr.html
이와 같은 데이터를 쉽게 수집 할 수 있습니다. 친구들을 모아 키와 신분증 또는 신용 카드 번호의 마지막 두 자리를 적도록하십시오. 허락하다$Y_1$ 키, $Y_2$ 두 자리 ID이고 $X_1$두 자리 중 첫 번째 여야합니다. 그때$X_1$ 관련이 없다 $Y_1$ 그러나 강하게 관련 $Y_2$.