Yazılım Ölçüm Verilerini Analiz Etme
İlgili verileri topladıktan sonra uygun bir şekilde analiz etmemiz gerekiyor. Analiz tekniğini seçerken dikkate alınması gereken üç ana öğe vardır.
- Verinin doğası
- Deneyin amacı
- Tasarım konuları
Verinin Doğası
Verileri analiz etmek için, verilerin temsil ettiği daha büyük nüfusa ve bu verilerin dağılımına da bakmalıyız.
Örnekleme, popülasyon ve veri dağıtımı
Örnekleme, büyük bir popülasyondan bir veri kümesi seçme işlemidir. Örnek istatistikler, bir grup deneysel denekten elde edilen ölçümleri açıklar ve özetler.
Popülasyon parametreleri, tüm olası özneler ölçülürse elde edilecek değerleri temsil eder.
Popülasyon veya örnek, ortalama, medyan ve mod gibi merkezi eğilim ölçüleri ve varyans ve standart sapma gibi dağılım ölçüleri ile tanımlanabilir. Aşağıdaki grafikte gösterildiği gibi birçok veri seti normal olarak dağıtılmıştır.
Yukarıda gösterildiği gibi, veriler ortalama hakkında eşit olarak dağıtılacaktır. bu normal bir dağılımın önemli özellikleridir.
Verilerin çarpık olduğu başka dağılımlar da mevcuttur, böylece ortalamanın bir tarafında diğerinden daha fazla veri noktası vardır. Örneğin: Verilerin çoğu ortalamanın sol tarafında mevcutsa, dağılımın sola doğru çarpık olduğunu söyleyebiliriz.
Deneyin Amacı
Normalde deneyler yapılır -
- Bir teoriyi doğrulamak için
- Bir ilişkiyi keşfetmek için
Bunların her birine ulaşmak için, hedef resmi olarak hipotez açısından ifade edilmeli ve analiz hipotezi doğrudan ele almalıdır.
Bir teoriyi doğrulamak için
Soruşturma, bir teorinin doğruluğunu keşfetmek için tasarlanmalıdır. Teori genellikle belirli bir yöntem, araç veya tekniğin kullanımının konular üzerinde belirli bir etkiye sahip olduğunu ve onu bir şekilde diğerinden daha iyi hale getirdiğini belirtir.
Dikkate alınması gereken iki veri durumu vardır: normal data ve non-normal data.
Veriler normal bir dağılımdan alınmışsa ve karşılaştırılacak iki grup varsa, öğrencinin t testi analiz için kullanılabilir. Karşılaştırılacak ikiden fazla grup varsa, F-istatistikleri adı verilen genel bir varyans testi analizi kullanılabilir.
Veriler normal değilse, veriler Kruskal-Wallis testi kullanılarak derecelendirilerek analiz edilebilir.
Bir ilişkiyi keşfetmek için
Araştırmalar, bir değişkeni veya birden çok değişkeni tanımlayan veri noktaları arasındaki ilişkiyi belirlemek için tasarlanmıştır.
Bir ilişki hakkındaki soruları yanıtlamak için üç teknik vardır: kutu grafikleri, dağılım grafikleri ve korelasyon analizi.
Bir box plot bir dizi veri aralığının özetini temsil edebilir.
Bir scatter plot iki değişken arasındaki ilişkiyi temsil eder.
Correlation analysis iki öznitelik arasında gerçek bir ilişki olup olmadığını doğrulamak için istatistiksel yöntemler kullanır.
Normal dağıtılan değerler için kullanın Pearson Correlation Coefficient iki değişkenin yüksek oranda ilişkili olup olmadığını kontrol etmek için.
Normal olmayan veriler için verileri sıralayın ve Spearman Rank Correlation Coefficientbir ilişki ölçüsü olarak. Normal olmayan veriler için bir başka ölçü deKendall robust correlation coefficient, veri noktası çiftleri arasındaki ilişkiyi araştıran ve kısmi bir korelasyonu tanımlayabilen.
Sıralama çok sayıda bağlı değer içeriyorsa, chi-squared testbir olasılık tablosunda değişkenler arasındaki ilişkiyi test etmek için kullanılabilir. Benzer şekilde,linear regression değişkenler arasındaki ilişkiyi tanımlamak için bir denklem oluşturmak için kullanılabilir.
İkiden fazla değişken için, multivariate regression kullanılabilir.
Tasarım Hususları
Analiz teknikleri seçilirken araştırmanın tasarımı dikkate alınmalıdır. Aynı zamanda, analizin karmaşıklığı seçilen tasarımı etkileyebilir. Birden fazla grup, Öğrenci'nin iki gruplu T testi yerine F istatistiklerini kullanır.
İkiden fazla faktör içeren karmaşık faktöriyel tasarımlar için, daha sofistike bir ilişki ve önem testi gereklidir.
İstatistiksel teknikler, bir değişken setinin diğerleri üzerindeki etkisini hesaba katmak veya zamanlama veya öğrenme etkilerini telafi etmek için kullanılabilir.