การวิเคราะห์ข้อมูลการวัดซอฟต์แวร์

หลังจากรวบรวมข้อมูลที่เกี่ยวข้องเราจะต้องวิเคราะห์ด้วยวิธีที่เหมาะสม มีสามรายการหลักที่ต้องพิจารณาในการเลือกเทคนิคการวิเคราะห์

  • ลักษณะของข้อมูล
  • วัตถุประสงค์ของการทดลอง
  • ข้อควรพิจารณาในการออกแบบ

ลักษณะของข้อมูล

ในการวิเคราะห์ข้อมูลเราต้องดูจำนวนประชากรที่มากขึ้นซึ่งแสดงโดยข้อมูลรวมทั้งการกระจายของข้อมูลนั้นด้วย

การสุ่มตัวอย่างประชากรและการกระจายข้อมูล

การสุ่มตัวอย่างเป็นกระบวนการเลือกชุดข้อมูลจากประชากรจำนวนมาก ตัวอย่างสถิติอธิบายและสรุปมาตรการที่ได้รับจากกลุ่มของผู้ทดลอง

พารามิเตอร์ประชากรแสดงถึงค่าที่จะได้รับหากวัดค่าที่เป็นไปได้ทั้งหมด

ประชากรหรือกลุ่มตัวอย่างสามารถอธิบายได้โดยการวัดแนวโน้มกลางเช่นค่าเฉลี่ยค่ามัธยฐานและโหมดและมาตรการการกระจายตัวเช่นความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน ข้อมูลหลายชุดมีการกระจายตามปกติดังแสดงในกราฟต่อไปนี้

ดังที่แสดงไว้ข้างต้นข้อมูลจะกระจายอย่างเท่าเทียมกันเกี่ยวกับค่าเฉลี่ย ซึ่งเป็นลักษณะสำคัญของการแจกแจงแบบปกติ

การแจกแจงอื่น ๆ ยังมีอยู่เมื่อข้อมูลถูกบิดเบือนเพื่อให้มีจุดข้อมูลที่ด้านหนึ่งของค่าเฉลี่ยมากกว่าด้านอื่น ๆ ตัวอย่างเช่น: หากข้อมูลส่วนใหญ่แสดงอยู่ทางด้านซ้ายมือของค่าเฉลี่ยเราสามารถพูดได้ว่าการแจกแจงเอียงไปทางซ้าย

วัตถุประสงค์ของการทดลอง

โดยปกติจะทำการทดลอง -

  • เพื่อยืนยันทฤษฎี
  • เพื่อสำรวจความสัมพันธ์

เพื่อให้บรรลุวัตถุประสงค์เหล่านี้ควรแสดงอย่างเป็นทางการในแง่ของสมมติฐานและการวิเคราะห์จะต้องกล่าวถึงสมมติฐานโดยตรง

เพื่อยืนยันทฤษฎี

การสืบสวนต้องได้รับการออกแบบมาเพื่อสำรวจความจริงของทฤษฎี โดยปกติทฤษฎีจะระบุว่าการใช้วิธีการเครื่องมือหรือเทคนิคบางอย่างมีผลเฉพาะเจาะจงต่อวิชาทำให้ดีกว่าวิธีอื่น

มีข้อมูลสองกรณีที่ต้องพิจารณา: normal data และ non-normal data.

ถ้าข้อมูลมาจากการแจกแจงแบบปกติและมีสองกลุ่มให้เปรียบเทียบก็สามารถใช้ t test ของนักเรียนในการวิเคราะห์ได้ หากมีมากกว่าสองกลุ่มที่จะเปรียบเทียบสามารถใช้การวิเคราะห์ทั่วไปของการทดสอบความแปรปรวนที่เรียกว่า F-statistics

หากข้อมูลไม่ปกติก็สามารถวิเคราะห์ข้อมูลได้โดยใช้การทดสอบ Kruskal-Wallis โดยการจัดลำดับ

เพื่อสำรวจความสัมพันธ์

การตรวจสอบได้รับการออกแบบมาเพื่อกำหนดความสัมพันธ์ระหว่างจุดข้อมูลที่อธิบายตัวแปรเดียวหรือหลายตัวแปร

มีเทคนิคสามประการในการตอบคำถามเกี่ยวกับความสัมพันธ์: แผนภาพกล่องแผนภาพการกระจายและการวิเคราะห์ความสัมพันธ์

  • box plot สามารถแสดงข้อมูลสรุปช่วงของชุดข้อมูล

  • scatter plot แสดงถึงความสัมพันธ์ระหว่างสองตัวแปร

  • Correlation analysis ใช้วิธีการทางสถิติเพื่อยืนยันว่ามีความสัมพันธ์ที่แท้จริงระหว่างสองคุณลักษณะหรือไม่

    • สำหรับค่าที่กระจายตามปกติให้ใช้ Pearson Correlation Coefficient เพื่อตรวจสอบว่าตัวแปรทั้งสองมีความสัมพันธ์กันอย่างมากหรือไม่

    • สำหรับข้อมูลที่ไม่ใช่ข้อมูลปกติให้จัดอันดับข้อมูลและใช้ไฟล์ Spearman Rank Correlation Coefficientเป็นมาตรการของการเชื่อมโยง มาตรการอื่นสำหรับข้อมูลที่ไม่ใช่ข้อมูลปกติคือKendall robust correlation coefficientซึ่งตรวจสอบความสัมพันธ์ระหว่างคู่ของจุดข้อมูลและสามารถระบุความสัมพันธ์บางส่วนได้

หากการจัดอันดับมีค่าที่เท่ากันจำนวนมากก chi-squared testบนตารางฉุกเฉินสามารถใช้เพื่อทดสอบความสัมพันธ์ระหว่างตัวแปร ในทำนองเดียวกันlinear regression สามารถใช้เพื่อสร้างสมการเพื่ออธิบายความสัมพันธ์ระหว่างตัวแปร

สำหรับตัวแปรมากกว่าสองตัวแปร multivariate regression สามารถใช้ได้.

ข้อควรพิจารณาในการออกแบบ

การออกแบบการสืบสวนจะต้องพิจารณาในขณะที่เลือกเทคนิคการวิเคราะห์ ในขณะเดียวกันความซับซ้อนของการวิเคราะห์ก็มีผลต่อการออกแบบที่เลือก หลายกลุ่มใช้สถิติ F แทนการทดสอบ T ของนักเรียนกับสองกลุ่ม

สำหรับการออกแบบแฟกทอเรียลที่ซับซ้อนซึ่งมีปัจจัยมากกว่าสองปัจจัยจำเป็นต้องมีการทดสอบความสัมพันธ์และนัยสำคัญที่ซับซ้อนมากขึ้น

เทคนิคทางสถิติสามารถใช้เพื่ออธิบายถึงผลกระทบของตัวแปรชุดหนึ่งที่มีต่อตัวแปรอื่น ๆ หรือเพื่อชดเชยเวลาหรือผลการเรียนรู้