Да, разработка через тестирование полезна в науке о данных.

Nov 29 2022

Имея опыт работы в области аналитики и науки о данных, я привык считать написание тестов чем-то болезненным. Я знал, что это важно, но никогда не знал, с чего начать, и всегда откладывал проект до конца.

В последнее время я стал смотреть на вещи с другой стороны. Я открыл для себя разработку через тестирование: пишите свои тесты до того, как вы на самом деле кодируете функциональную часть кода. Это лучшая практика разработки программного обеспечения, которая заслуживает того, чтобы ее чаще применяли к проектам по науке о данных.

Что такое разработка через тестирование (TDD)?

Проще всего это сделать через фреймворк Red/Green/Refactor . Каждый раз, когда вы хотите добавить функциональность в код, вы можете следовать трехэтапному циклу:

Красный . Создайте тест, который не работает. т.е. напишите функциональные потребности вашего кода
Зеленый . Напишите производственный код, который проходит тест. т.е. выполнить функциональные потребности кода
Рефакторинг. Уберите беспорядок, который вы только что сделали. т.е. очистить свой код без изменения функциональности

Проиллюстрируем это на примере из реальной жизни. В качестве шага постобработки для проекта распознавания именованных объектов мы хотим создать функцию обработки для извлечения единицы продолжительности (день/неделя/месяц/..) и значения длительности в тексте.

Давайте напишем модульный тест, отвечающий функциональным потребностям, и пустую функцию.

Функция

Модульный тест

2. Пишем код, который проходит тест.

Тест ЗЕЛЕНЫЙ Ура!! Подожди... мы уверены, что это СУХОЕ, ТВЕРДОЕ, pep8??

3. Мы рефакторим функцию, чтобы обеспечить лучшие практики кодирования.

Здесь мы добавили аннотации типов, создали общую функцию для преобразования числа букв в число с плавающей запятой (также с собственным модульным тестом) и реорганизовали способ заполнения словаря.

Где мы можем применить разработку через тестирование в науке о данных?

Разработка через тестирование не актуальна на каждом этапе проекта по науке о данных. Например, это не стоит того во время исследования данных или моделей , когда вы не уверены в том, что ищете: написание тестов без знания ожидаемого результата, вероятно, является излишним.

Это становится очень полезным всякий раз, когда вам нужно построить надежные производственные конвейеры .

В этом контексте нам необходимо реализовать несколько типов тестов:

Модульные тесты: тест для каждого фрагмента кода проекта.
Тесты модели : убедитесь, что модель имеет хорошую производительность и ведет себя правильно.
Интеграционные тесты : обеспечение хорошей связи между каждым фрагментом кода.

Для модельных испытаний его следует использовать осторожно. Имея дело с прогностическими моделями, мы имеем дело с неопределенностью . Действительно, многие алгоритмы машинного обучения по своей сути случайны — несколько запусков с использованием одних и тех же входных данных могут каждый раз давать несколько разные результаты. Это может привести к ненадежным тестам : тест, который иногда проходит, а иногда терпит неудачу, несмотря на отсутствие изменений в коде или самом тесте. Если мы слишком конкретизируем тестовые случаи во время первой разработки через тестирование, весьма вероятно, что некоторые тесты сломаются на следующей итерации. Новая модель может вести себя по-другому в некоторых случаях, но при этом работать лучше в глобальном масштабе. Поэтому в модельные тесты лучше включать только базовые случаи, которые необходимы для проекта.

Наконец, для интеграционных тестов это хорошо применимо к фрагментам кода, которые не включают предсказания модели. Если он включает прогнозирование модели, лучше протестировать формат вывода, чем фактический вывод.

Хорошей практикой является включение этих тестов в CI/CD вашего проекта. Поэтому всякий раз, когда делается предложение о новой функциональности, гарантируется, что никакая другая функциональность не будет нарушена.

Почему это меняет правила игры?

Внедрение разработки через тестирование действительно меняет способ организации сеансов кодирования и дает массу преимуществ: