การวิเคราะห์ข้อมูลการวัดซอฟต์แวร์
หลังจากรวบรวมข้อมูลที่เกี่ยวข้องเราจะต้องวิเคราะห์ด้วยวิธีที่เหมาะสม มีสามรายการหลักที่ต้องพิจารณาในการเลือกเทคนิคการวิเคราะห์
- ลักษณะของข้อมูล
- วัตถุประสงค์ของการทดลอง
- ข้อควรพิจารณาในการออกแบบ
ลักษณะของข้อมูล
ในการวิเคราะห์ข้อมูลเราต้องดูจำนวนประชากรที่มากขึ้นซึ่งแสดงโดยข้อมูลรวมทั้งการกระจายของข้อมูลนั้นด้วย
การสุ่มตัวอย่างประชากรและการกระจายข้อมูล
การสุ่มตัวอย่างเป็นกระบวนการเลือกชุดข้อมูลจากประชากรจำนวนมาก ตัวอย่างสถิติอธิบายและสรุปมาตรการที่ได้รับจากกลุ่มของผู้ทดลอง
พารามิเตอร์ประชากรแสดงถึงค่าที่จะได้รับหากวัดค่าที่เป็นไปได้ทั้งหมด
ประชากรหรือกลุ่มตัวอย่างสามารถอธิบายได้โดยการวัดแนวโน้มกลางเช่นค่าเฉลี่ยค่ามัธยฐานและโหมดและมาตรการการกระจายตัวเช่นความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน ข้อมูลหลายชุดมีการกระจายตามปกติดังแสดงในกราฟต่อไปนี้
ดังที่แสดงไว้ข้างต้นข้อมูลจะกระจายอย่างเท่าเทียมกันเกี่ยวกับค่าเฉลี่ย ซึ่งเป็นลักษณะสำคัญของการแจกแจงแบบปกติ
การแจกแจงอื่น ๆ ยังมีอยู่เมื่อข้อมูลถูกบิดเบือนเพื่อให้มีจุดข้อมูลที่ด้านหนึ่งของค่าเฉลี่ยมากกว่าด้านอื่น ๆ ตัวอย่างเช่น: หากข้อมูลส่วนใหญ่แสดงอยู่ทางด้านซ้ายมือของค่าเฉลี่ยเราสามารถพูดได้ว่าการแจกแจงเอียงไปทางซ้าย
วัตถุประสงค์ของการทดลอง
โดยปกติจะทำการทดลอง -
- เพื่อยืนยันทฤษฎี
- เพื่อสำรวจความสัมพันธ์
เพื่อให้บรรลุวัตถุประสงค์เหล่านี้ควรแสดงอย่างเป็นทางการในแง่ของสมมติฐานและการวิเคราะห์จะต้องกล่าวถึงสมมติฐานโดยตรง
เพื่อยืนยันทฤษฎี
การสืบสวนต้องได้รับการออกแบบมาเพื่อสำรวจความจริงของทฤษฎี โดยปกติทฤษฎีจะระบุว่าการใช้วิธีการเครื่องมือหรือเทคนิคบางอย่างมีผลเฉพาะเจาะจงต่อวิชาทำให้ดีกว่าวิธีอื่น
มีข้อมูลสองกรณีที่ต้องพิจารณา: normal data และ non-normal data.
ถ้าข้อมูลมาจากการแจกแจงแบบปกติและมีสองกลุ่มให้เปรียบเทียบก็สามารถใช้ t test ของนักเรียนในการวิเคราะห์ได้ หากมีมากกว่าสองกลุ่มที่จะเปรียบเทียบสามารถใช้การวิเคราะห์ทั่วไปของการทดสอบความแปรปรวนที่เรียกว่า F-statistics
หากข้อมูลไม่ปกติก็สามารถวิเคราะห์ข้อมูลได้โดยใช้การทดสอบ Kruskal-Wallis โดยการจัดลำดับ
เพื่อสำรวจความสัมพันธ์
การตรวจสอบได้รับการออกแบบมาเพื่อกำหนดความสัมพันธ์ระหว่างจุดข้อมูลที่อธิบายตัวแปรเดียวหรือหลายตัวแปร
มีเทคนิคสามประการในการตอบคำถามเกี่ยวกับความสัมพันธ์: แผนภาพกล่องแผนภาพการกระจายและการวิเคราะห์ความสัมพันธ์
ก box plot สามารถแสดงข้อมูลสรุปช่วงของชุดข้อมูล
ก scatter plot แสดงถึงความสัมพันธ์ระหว่างสองตัวแปร
Correlation analysis ใช้วิธีการทางสถิติเพื่อยืนยันว่ามีความสัมพันธ์ที่แท้จริงระหว่างสองคุณลักษณะหรือไม่
สำหรับค่าที่กระจายตามปกติให้ใช้ Pearson Correlation Coefficient เพื่อตรวจสอบว่าตัวแปรทั้งสองมีความสัมพันธ์กันอย่างมากหรือไม่
สำหรับข้อมูลที่ไม่ใช่ข้อมูลปกติให้จัดอันดับข้อมูลและใช้ไฟล์ Spearman Rank Correlation Coefficientเป็นมาตรการของการเชื่อมโยง มาตรการอื่นสำหรับข้อมูลที่ไม่ใช่ข้อมูลปกติคือKendall robust correlation coefficientซึ่งตรวจสอบความสัมพันธ์ระหว่างคู่ของจุดข้อมูลและสามารถระบุความสัมพันธ์บางส่วนได้
หากการจัดอันดับมีค่าที่เท่ากันจำนวนมากก chi-squared testบนตารางฉุกเฉินสามารถใช้เพื่อทดสอบความสัมพันธ์ระหว่างตัวแปร ในทำนองเดียวกันlinear regression สามารถใช้เพื่อสร้างสมการเพื่ออธิบายความสัมพันธ์ระหว่างตัวแปร
สำหรับตัวแปรมากกว่าสองตัวแปร multivariate regression สามารถใช้ได้.
ข้อควรพิจารณาในการออกแบบ
การออกแบบการสืบสวนจะต้องพิจารณาในขณะที่เลือกเทคนิคการวิเคราะห์ ในขณะเดียวกันความซับซ้อนของการวิเคราะห์ก็มีผลต่อการออกแบบที่เลือก หลายกลุ่มใช้สถิติ F แทนการทดสอบ T ของนักเรียนกับสองกลุ่ม
สำหรับการออกแบบแฟกทอเรียลที่ซับซ้อนซึ่งมีปัจจัยมากกว่าสองปัจจัยจำเป็นต้องมีการทดสอบความสัมพันธ์และนัยสำคัญที่ซับซ้อนมากขึ้น
เทคนิคทางสถิติสามารถใช้เพื่ออธิบายถึงผลกระทบของตัวแปรชุดหนึ่งที่มีต่อตัวแปรอื่น ๆ หรือเพื่อชดเชยเวลาหรือผลการเรียนรู้