ชุดข้อมูลการถดถอยหลายตัวแปร (การถดถอยแบบหลายเป้าหมาย) ซึ่งค่าสัมประสิทธิ์การถดถอยบางค่าเป็นศูนย์
ฉันกำลังมองหาชุดข้อมูลตัวอย่างสำหรับการถดถอยเชิงเส้นหลายตัวแปร - หรือที่เรียกว่าหลายเป้าหมายหรือหลายเอาต์พุต ควรมีมากกว่า 10 อินพุตและมากกว่า 10 เอาต์พุต ดูเหมือนจะไม่มีตัวอย่างที่ดีมากนัก ตามหลักการแล้วฉันต้องการให้ชุดข้อมูลเป็นเช่นนั้นโดยที่ค่าสัมประสิทธิ์การถดถอยบางค่าเป็นศูนย์กล่าวคือเรารู้ว่าอินพุตบางอย่างไม่ส่งผลต่อเอาต์พุตบางอย่าง ฉันได้สร้างชุดข้อมูลจำลองแล้ว แต่ฉันหวังว่าจะได้ชุดข้อมูลตัวอย่างจริง
สมมติว่ามี $p$ ตัวแปรอินพุตและ $q$ ตัวแปรตอบสนองและแบบจำลองการถดถอยคือ $Y = XC + \epsilon$.
$Y$ เป็น $n \times q$ เมทริกซ์ $X$ เป็น $n \times p$ เมทริกซ์และ $C$ เป็น $p \times q$เมทริกซ์ ฉันกำลังมองหาชุดข้อมูลที่เราทราบข้อมูลบางรายการ$C$ เป็น 0 แต่ไม่ใช่ทั้งแถว $C$. กล่าวอีกนัยหนึ่งเราไม่มีตัวแปรอินพุตบางตัวที่ไม่มีผลกับเอาต์พุตใด ๆ มีเพียงตัวแปรอินพุตบางตัวที่ไม่มีผลกับตัวแปรเอาต์พุตบางตัว
ดูเหมือนว่าฉันจะเป็นชุดข้อมูลที่ดีสำหรับหลายเป้าหมายไม่ได้ดังนั้นฉันหวังว่าใครบางคนจะสามารถชี้ให้ฉันไปในทิศทางที่ถูกต้องได้
ขอบคุณ
คำตอบ
งานนี้เกี่ยวกับการถดถอยหลายเป้าหมายให้ข้อมูลโดยละเอียดเกี่ยวกับชุดข้อมูลที่ใช้
แก้ไข: ละเว้นข้างต้น นี้เป็นกระดาษที่มีการอ้างอิงในการถดถอยหลายเป้าหมาย ชุดข้อมูลที่ใช้เผยแพร่ต่อสาธารณะที่ลิงค์นี้:http://mulan.sourceforge.net/datasets-mtr.html
คุณสามารถรวบรวมข้อมูลบางอย่างได้อย่างง่ายดายเช่นนี้ รวบรวมเพื่อนและให้พวกเขาเขียนส่วนสูงและตัวเลขสองหลักสุดท้ายของ ID หรือหมายเลขบัตรเครดิต ปล่อย$Y_1$ สูง $Y_2$ เป็นรหัสสองหลักและ $X_1$เป็นตัวแรกของสองหลัก แล้ว$X_1$ ไม่เกี่ยวข้องกับ $Y_1$ แต่เกี่ยวข้องอย่างยิ่งกับ $Y_2$.