Манипуляция данными
Метрики программного обеспечения - это стандарт измерения, который включает в себя множество действий, требующих некоторой степени измерения. Успех в измерении программного обеспечения зависит от качества собранных и проанализированных данных.
Что такое хорошие данные?
Собранные данные можно рассматривать как хорошие данные, если они могут дать ответы на следующие вопросы:
Are they correct? - Данные можно считать правильными, если они были собраны в соответствии с точными правилами определения метрики.
Are they accurate? - Под точностью понимается разница между данными и фактическим значением.
Are they appropriately precise? - Точность связана с количеством десятичных знаков, необходимых для выражения данных.
Are they consistent? - Данные можно считать согласованными, если они не показывают существенных различий между одним измерительным прибором.
Are they associated with a particular activity or time period? - Если данные связаны с определенной деятельностью или периодом времени, то это должно быть четко указано в данных.
Can they be replicated?- Обычно исследования, такие как опросы, тематические исследования и эксперименты, часто повторяются при различных обстоятельствах. Следовательно, данные также должны легко воспроизводиться.
Как определить данные?
Данные, которые собираются для целей измерения, бывают двух типов:
Raw data- Необработанные данные, полученные в результате первоначального измерения процесса, продуктов или ресурсов. Например: еженедельное расписание сотрудников в организации.
Refined data - Уточненные данные являются результатом извлечения важных элементов данных из необработанных данных для получения значений атрибутов.
Данные могут быть определены в соответствии со следующими пунктами -
- Location
- Timing
- Symptoms
- Конечный результат
- Mechanism
- Cause
- Severity
- Cost
Как собирать данные?
Сбор данных требует человеческого наблюдения и отчетности. Менеджеры, системные аналитики, программисты, тестировщики и пользователи должны записывать строковые данные в формы. Для сбора точных и полных данных важно:
Делайте процедуры простыми
Избегайте ненужной записи
Обучите сотрудников необходимости регистрировать данные и применяемым процедурам
Предоставлять результаты сбора и анализа данных исходным поставщикам данных быстро и в удобной форме, которая поможет им в их работе.
Проверяйте все данные, собранные в центральном пункте сбора
Планирование сбора данных включает в себя несколько шагов -
Решите, какие продукты измерять, на основе анализа GQM
Убедитесь, что продукт находится под контролем конфигурации
Решите, какие именно атрибуты измерять и как будут производиться косвенные показатели.
После того, как набор показателей ясен и набор компонентов, которые необходимо измерить, определен, разработайте схему для идентификации каждого действия, участвующего в процессе измерения.
Установите порядок обработки форм, анализа данных и отчетности о результатах.
Планирование сбора данных должно начинаться, когда начинается планирование проекта. Фактический сбор данных происходит на многих этапах разработки.
For example - Некоторые данные, относящиеся к персоналу проекта, могут быть собраны в начале проекта, в то время как сбор других данных, например, об усилиях, начинается при запуске проекта и продолжается в процессе эксплуатации и обслуживания.
Как хранить и извлекать данные
В программной инженерии данные должны храниться в базе данных и настраиваться с помощью системы управления базами данных (СУБД). Пример структуры базы данных показан на следующем рисунке. В этой базе данных будет храниться информация о разных сотрудниках, работающих в разных отделах организации.
На приведенной выше диаграмме каждое поле представляет собой таблицу в базе данных, а стрелка обозначает сопоставление «многие к одному» из одной таблицы в другую. Отображения определяют ограничения, сохраняющие логическую непротиворечивость данных.
Когда база данных спроектирована и заполнена данными, мы можем использовать языки манипулирования данными для извлечения данных для анализа.