CNTK - Обучение нейронной сети

Здесь мы разберемся с обучением нейронной сети в CNTK.

Обучение модели в CNTK

В предыдущем разделе мы определили все компоненты для модели глубокого обучения. Пришло время его потренировать. Как мы обсуждали ранее, мы можем обучить модель NN в CNTK, используя комбинациюlearner и trainer.

Выбор ученика и настройка обучения

В этом разделе мы будем определять learner. CNTK предоставляет несколькоlearnersвыбирать из. Для нашей модели, определенной в предыдущих разделах, мы будем использоватьStochastic Gradient Descent (SGD) learner.

Для обучения нейронной сети настроим learner и trainer с помощью следующих шагов -

Step 1 - Во-первых, нам нужно импортировать sgd функция от cntk.lerners пакет.

from cntk.learners import sgd

Step 2 - Далее нам нужно импортировать Trainer функция от cntk.train.trainer пакет.

from cntk.train.trainer import Trainer

Step 3 - Теперь нам нужно создать learner. Его можно создать, вызвавsgd функция наряду с предоставлением параметров модели и значения скорости обучения.

learner = sgd(z.parametrs, 0.01)

Step 4 - Наконец, нам нужно инициализировать trainer. Должна быть предусмотрена сеть, комбинацияloss и metric вместе с learner.

trainer = Trainer(z, (loss, error_rate), [learner])

Скорость обучения, которая контролирует скорость оптимизации, должна быть небольшим числом от 0,1 до 0,001.

Выбор учащегося и настройка обучения - Полный пример

from cntk.learners import sgd
from cntk.train.trainer import Trainer
learner = sgd(z.parametrs, 0.01)
trainer = Trainer(z, (loss, error_rate), [learner])

Загрузка данных в трейнер

После того, как мы выбрали и настроили трейнер, пришло время загрузить набор данных. Мы сохранилиiris набор данных как файл.CSV файл, и мы будем использовать пакет обработки данных с именем pandas для загрузки набора данных.

Шаги по загрузке набора данных из файла .CSV

Step 1 - Во-первых, нам нужно импортировать pandas пакет.

from import pandas as pd

Step 2 - Теперь нам нужно вызвать функцию с именем read_csv функция для загрузки файла .csv с диска.

df_source = pd.read_csv(‘iris.csv’, names = [‘sepal_length’, ‘sepal_width’, 
‘petal_length’, ‘petal_width’, index_col=False)

После загрузки набора данных нам нужно разделить его на набор функций и метку.

Шаги по разделению набора данных на объекты и подписи

Step 1- Во-первых, нам нужно выбрать все строки и первые четыре столбца из набора данных. Это можно сделать, используяiloc функция.

x = df_source.iloc[:, :4].values

Step 2- Затем нам нужно выбрать столбец видов из набора данных ирисов. Мы будем использовать свойство values ​​для доступа к базовомуnumpy массив.

x = df_source[‘species’].values

Шаги по кодированию столбца видов в числовое векторное представление

Как мы обсуждали ранее, наша модель основана на классификации, она требует числовых входных значений. Следовательно, здесь нам нужно закодировать столбец видов в числовое векторное представление. Давайте посмотрим, как это сделать -

Step 1- Во-первых, нам нужно создать выражение списка для перебора всех элементов в массиве. Затем выполните поиск в словаре label_mapping для каждого значения.

label_mapping = {‘Iris-Setosa’ : 0, ‘Iris-Versicolor’ : 1, ‘Iris-Virginica’ : 2}

Step 2- Затем преобразуйте это преобразованное числовое значение в вектор с горячим кодированием. Мы будем использоватьone_hot функционируют следующим образом -

def one_hot(index, length):
result = np.zeros(length)
result[index] = 1
return result

Step 3 - Наконец, нам нужно превратить этот преобразованный список в numpy массив.

y = np.array([one_hot(label_mapping[v], 3) for v in y])

Шаги по обнаружению переобучения

Ситуация, когда ваша модель запоминает образцы, но не может вывести правила из обучающих образцов, является переобучением. С помощью следующих шагов мы можем обнаружить переоснащение нашей модели -

Step 1 - Во-первых, из sklearn пакет, импортируйте train_test_split функция от model_selection модуль.

from sklearn.model_selection import train_test_split

Step 2 - Затем нам нужно вызвать функцию train_test_split с функциями x и метками y следующим образом:

x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0-2, 
stratify=y)

Мы указали test_size равным 0,2, чтобы выделить 20% всех данных.

label_mapping = {‘Iris-Setosa’ : 0, ‘Iris-Versicolor’ : 1, ‘Iris-Virginica’ : 2}

Шаги по загрузке обучающего набора и набора проверки в нашу модель

Step 1 - Чтобы обучить нашу модель, сначала мы будем вызывать train_minibatchметод. Затем дайте ему словарь, который сопоставляет входные данные с входной переменной, которую мы использовали для определения NN и связанной с ней функции потерь.

trainer.train_minibatch({ features: X_train, label: y_train})

Step 2 - Далее звоните train_minibatch используя следующий цикл for -

for _epoch in range(10):
trainer.train_minbatch ({ feature: X_train, label: y_train})
print(‘Loss: {}, Acc: {}’.format(
trainer.previous_minibatch_loss_average,
trainer.previous_minibatch_evaluation_average))

Загрузка данных в трейнер - Полный пример

from import pandas as pd
df_source = pd.read_csv(‘iris.csv’, names = [‘sepal_length’, ‘sepal_width’, ‘petal_length’, ‘petal_width’, index_col=False)
x = df_source.iloc[:, :4].values
x = df_source[‘species’].values
label_mapping = {‘Iris-Setosa’ : 0, ‘Iris-Versicolor’ : 1, ‘Iris-Virginica’ : 2}
def one_hot(index, length):
result = np.zeros(length)
result[index] = 1
return result
y = np.array([one_hot(label_mapping[v], 3) for v in y])
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0-2, stratify=y)
label_mapping = {‘Iris-Setosa’ : 0, ‘Iris-Versicolor’ : 1, ‘Iris-Virginica’ : 2}
trainer.train_minibatch({ features: X_train, label: y_train})
for _epoch in range(10):
trainer.train_minbatch ({ feature: X_train, label: y_train})
print(‘Loss: {}, Acc: {}’.format(
trainer.previous_minibatch_loss_average,
trainer.previous_minibatch_evaluation_average))

Измерение производительности NN

Чтобы оптимизировать нашу модель NN, всякий раз, когда мы передаем данные через трейнер, он измеряет производительность модели с помощью метрики, которую мы настроили для трейнера. Такое измерение производительности модели NN во время обучения происходит на данных обучения. Но с другой стороны, для полноценного анализа производительности модели нам также нужны тестовые данные.

Итак, чтобы измерить производительность модели с использованием тестовых данных, мы можем вызвать test_minibatch метод на trainer следующим образом -

trainer.test_minibatch({ features: X_test, label: y_test})

Прогнозирование с помощью NN

После того как вы обучили модель глубокого обучения, самое важное - делать прогнозы с ее помощью. Чтобы сделать прогноз на основе обученной выше NN, мы можем выполнить следующие шаги:

Step 1 - Во-первых, нам нужно выбрать случайный элемент из тестового набора, используя следующую функцию -

np.random.choice

Step 2 - Затем нам нужно выбрать образцы данных из набора тестов, используя sample_index.

Step 3 - Теперь, чтобы преобразовать числовой вывод в NN в фактическую метку, создайте инвертированное отображение.

Step 4 - Теперь используйте выбранный sampleданные. Сделайте прогноз, вызвав NN z как функцию.

Step 5- Теперь, когда вы получили прогнозируемый результат, возьмите индекс нейрона, который имеет наибольшее значение, в качестве прогнозируемого значения. Это можно сделать с помощьюnp.argmax функция от numpy пакет.

Step 6 - Наконец, преобразуйте значение индекса в реальную метку, используя inverted_mapping.

Прогнозирование с помощью NN - Полный пример

sample_index = np.random.choice(X_test.shape[0])
sample = X_test[sample_index]
inverted_mapping = {
   1:’Iris-setosa’,
   2:’Iris-versicolor’,
   3:’Iris-virginica’
}
prediction = z(sample)
predicted_label = inverted_mapping[np.argmax(prediction)]
print(predicted_label)

Вывод

После обучения указанной выше модели глубокого обучения и ее запуска вы получите следующий результат:

Iris-versicolor