CNTK - Modèle de régression logistique

Ce chapitre traite de la construction d'un modèle de régression logistique dans CNTK.

Bases du modèle de régression logistique

La régression logistique, l'une des techniques de ML les plus simples, est une technique spécialement conçue pour la classification binaire. En d'autres termes, pour créer un modèle de prédiction dans des situations où la valeur de la variable à prédire peut être l'une des deux valeurs catégorielles. L'un des exemples les plus simples de régression logistique est de prédire si la personne est un homme ou une femme, en fonction de son âge, de sa voix, de ses cheveux, etc.

Exemple

Comprenons mathématiquement le concept de régression logistique à l'aide d'un autre exemple -

Supposons que nous voulions prédire la solvabilité d'une demande de prêt; 0 signifie rejeter et 1 signifie approuver, en fonction du candidatdebt , income et credit rating. Nous représentons la dette avec X1, le revenu avec X2 et la cote de crédit avec X3.

Dans la régression logistique, nous déterminons une valeur de poids, représentée par w, pour chaque fonctionnalité et une seule valeur de biais, représentée par b.

Supposons maintenant,

X1 = 3.0
X2 = -2.0
X3 = 1.0

Et supposons que nous déterminions le poids et le biais comme suit -

W1 = 0.65, W2 = 1.75, W3 = 2.05 and b = 0.33

Maintenant, pour prédire la classe, nous devons appliquer la formule suivante -

Z = (X1*W1)+(X2*W2)+(X3+W3)+b
i.e. Z = (3.0)*(0.65) + (-2.0)*(1.75) + (1.0)*(2.05) + 0.33
= 0.83

Ensuite, nous devons calculer P = 1.0/(1.0 + exp(-Z)). Ici, la fonction exp () est le nombre d'Euler.

P = 1.0/(1.0 + exp(-0.83)
= 0.6963

La valeur P peut être interprétée comme la probabilité que la classe soit 1. Si P <0,5, la prédiction est class = 0 sinon la prédiction (P> = 0,5) est class = 1.

Pour déterminer les valeurs de pondération et de biais, nous devons obtenir un ensemble de données d'apprentissage ayant les valeurs de prédicteur d'entrée connues et les valeurs d'étiquettes de classe correctes connues. Après cela, nous pouvons utiliser un algorithme, généralement Gradient Descent, afin de trouver les valeurs de poids et de biais.

Exemple d'implémentation du modèle LR

Pour ce modèle LR, nous allons utiliser l'ensemble de données suivant -

1.0, 2.0, 0
3.0, 4.0, 0
5.0, 2.0, 0
6.0, 3.0, 0
8.0, 1.0, 0
9.0, 2.0, 0
1.0, 4.0, 1
2.0, 5.0, 1
4.0, 6.0, 1
6.0, 5.0, 1
7.0, 3.0, 1
8.0, 5.0, 1

Pour démarrer cette implémentation de modèle LR dans CNTK, nous devons d'abord importer les packages suivants -

import numpy as np
import cntk as C

Le programme est structuré avec la fonction main () comme suit -

def main():
print("Using CNTK version = " + str(C.__version__) + "\n")

Maintenant, nous devons charger les données d'entraînement en mémoire comme suit -

data_file = ".\\dataLRmodel.txt"
print("Loading data from " + data_file + "\n")
features_mat = np.loadtxt(data_file, dtype=np.float32, delimiter=",", skiprows=0, usecols=[0,1])
labels_mat = np.loadtxt(data_file, dtype=np.float32, delimiter=",", skiprows=0, usecols=[2], ndmin=2)

Maintenant, nous allons créer un programme de formation qui crée un modèle de régression logistique compatible avec les données de formation -

features_dim = 2
labels_dim = 1
X = C.ops.input_variable(features_dim, np.float32)
y = C.input_variable(labels_dim, np.float32)
W = C.parameter(shape=(features_dim, 1)) # trainable cntk.Parameter
b = C.parameter(shape=(labels_dim))
z = C.times(X, W) + b
p = 1.0 / (1.0 + C.exp(-z))
model = p

Maintenant, nous devons créer Lerner et formateur comme suit -

ce_error = C.binary_cross_entropy(model, y) # CE a bit more principled for LR
fixed_lr = 0.010
learner = C.sgd(model.parameters, fixed_lr)
trainer = C.Trainer(model, (ce_error), [learner])
max_iterations = 4000

Formation modèle LR

Une fois que nous avons créé le modèle LR, ensuite, il est temps de commencer le processus de formation -

np.random.seed(4)
N = len(features_mat)
for i in range(0, max_iterations):
row = np.random.choice(N,1) # pick a random row from training items
trainer.train_minibatch({ X: features_mat[row], y: labels_mat[row] })
if i % 1000 == 0 and i > 0:
mcee = trainer.previous_minibatch_loss_average
print(str(i) + " Cross-entropy error on curr item = %0.4f " % mcee)

Maintenant, avec l'aide du code suivant, nous pouvons imprimer les poids et biais du modèle -

np.set_printoptions(precision=4, suppress=True)
print("Model weights: ")
print(W.value)
print("Model bias:")
print(b.value)
print("")
if __name__ == "__main__":
main()

Formation d'un modèle de régression logistique - Exemple complet

import numpy as np
import cntk as C
   def main():
print("Using CNTK version = " + str(C.__version__) + "\n")
data_file = ".\\dataLRmodel.txt" # provide the name and the location of data file
print("Loading data from " + data_file + "\n")
features_mat = np.loadtxt(data_file, dtype=np.float32, delimiter=",", skiprows=0, usecols=[0,1])
labels_mat = np.loadtxt(data_file, dtype=np.float32, delimiter=",", skiprows=0, usecols=[2], ndmin=2)
features_dim = 2
labels_dim = 1
X = C.ops.input_variable(features_dim, np.float32)
y = C.input_variable(labels_dim, np.float32)
W = C.parameter(shape=(features_dim, 1)) # trainable cntk.Parameter
b = C.parameter(shape=(labels_dim))
z = C.times(X, W) + b
p = 1.0 / (1.0 + C.exp(-z))
model = p
ce_error = C.binary_cross_entropy(model, y) # CE a bit more principled for LR
fixed_lr = 0.010
learner = C.sgd(model.parameters, fixed_lr)
trainer = C.Trainer(model, (ce_error), [learner])
max_iterations = 4000
np.random.seed(4)
N = len(features_mat)
for i in range(0, max_iterations):
row = np.random.choice(N,1) # pick a random row from training items
trainer.train_minibatch({ X: features_mat[row], y: labels_mat[row] })
if i % 1000 == 0 and i > 0:
mcee = trainer.previous_minibatch_loss_average
print(str(i) + " Cross-entropy error on curr item = %0.4f " % mcee)
np.set_printoptions(precision=4, suppress=True)
print("Model weights: ")
print(W.value)
print("Model bias:")
print(b.value)
if __name__ == "__main__":
  main()

Production

Using CNTK version = 2.7
1000 cross entropy error on curr item = 0.1941
2000 cross entropy error on curr item = 0.1746
3000 cross entropy error on curr item = 0.0563
Model weights:
[-0.2049]
   [0.9666]]
Model bias:
[-2.2846]

Prédiction à l'aide du modèle LR entraîné

Une fois que le modèle LR a été formé, nous pouvons l'utiliser pour la prédiction comme suit -

Tout d'abord, notre programme d'évaluation importe le package numpy et charge les données d'entraînement dans une matrice de caractéristiques et une matrice d'étiquette de classe de la même manière que le programme d'entraînement que nous implémentons ci-dessus -

import numpy as np
def main():
data_file = ".\\dataLRmodel.txt" # provide the name and the location of data file
features_mat = np.loadtxt(data_file, dtype=np.float32, delimiter=",",
skiprows=0, usecols=(0,1))
labels_mat = np.loadtxt(data_file, dtype=np.float32, delimiter=",",
skiprows=0, usecols=[2], ndmin=2)

Ensuite, il est temps de fixer les valeurs des poids et du biais qui ont été déterminés par notre programme de formation -

print("Setting weights and bias values \n")
weights = np.array([0.0925, 1.1722], dtype=np.float32)
bias = np.array([-4.5400], dtype=np.float32)
N = len(features_mat)
features_dim = 2

Ensuite, notre programme d'évaluation calculera la probabilité de régression logistique en parcourant chaque élément de formation comme suit -

print("item pred_prob pred_label act_label result")
for i in range(0, N): # each item
   x = features_mat[i]
   z = 0.0
   for j in range(0, features_dim):
   z += x[j] * weights[j]
   z += bias[0]
   pred_prob = 1.0 / (1.0 + np.exp(-z))
  pred_label = 0 if pred_prob < 0.5 else 1
   act_label = labels_mat[i]
   pred_str = ‘correct’ if np.absolute(pred_label - act_label) < 1.0e-5 \
    else ‘WRONG’
  print("%2d %0.4f %0.0f %0.0f %s" % \ (i, pred_prob, pred_label, act_label, pred_str))

Maintenant, montrons comment faire des prédictions -

x = np.array([9.5, 4.5], dtype=np.float32)
print("\nPredicting class for age, education = ")
print(x)
z = 0.0
for j in range(0, features_dim):
z += x[j] * weights[j]
z += bias[0]
p = 1.0 / (1.0 + np.exp(-z))
print("Predicted p = " + str(p))
if p < 0.5: print("Predicted class = 0")
else: print("Predicted class = 1")

Programme complet d'évaluation des prédictions

import numpy as np
def main():
data_file = ".\\dataLRmodel.txt" # provide the name and the location of data file
features_mat = np.loadtxt(data_file, dtype=np.float32, delimiter=",",
skiprows=0, usecols=(0,1))
labels_mat = np.loadtxt(data_file, dtype=np.float32, delimiter=",",
skiprows=0, usecols=[2], ndmin=2)
print("Setting weights and bias values \n")
weights = np.array([0.0925, 1.1722], dtype=np.float32)
bias = np.array([-4.5400], dtype=np.float32)
N = len(features_mat)
features_dim = 2
print("item pred_prob pred_label act_label result")
for i in range(0, N): # each item
   x = features_mat[i]
   z = 0.0
   for j in range(0, features_dim):
     z += x[j] * weights[j]
   z += bias[0]
   pred_prob = 1.0 / (1.0 + np.exp(-z))
   pred_label = 0 if pred_prob < 0.5 else 1
   act_label = labels_mat[i]
   pred_str = ‘correct’ if np.absolute(pred_label - act_label) < 1.0e-5 \
     else ‘WRONG’
  print("%2d %0.4f %0.0f %0.0f %s" % \ (i, pred_prob, pred_label, act_label, pred_str))
x = np.array([9.5, 4.5], dtype=np.float32)
print("\nPredicting class for age, education = ")
print(x)
z = 0.0
for j in range(0, features_dim):
   z += x[j] * weights[j]
z += bias[0]
p = 1.0 / (1.0 + np.exp(-z))
print("Predicted p = " + str(p))
if p < 0.5: print("Predicted class = 0")
else: print("Predicted class = 1")
if __name__ == "__main__":
  main()

Production

Définition des poids et des valeurs de biais.

Item  pred_prob  pred_label  act_label  result
0   0.3640         0             0     correct
1   0.7254         1             0      WRONG
2   0.2019         0             0     correct
3   0.3562         0             0     correct
4   0.0493         0             0     correct
5   0.1005         0             0     correct
6   0.7892         1             1     correct
7   0.8564         1             1     correct
8   0.9654         1             1     correct
9   0.7587         1             1     correct
10  0.3040         0             1      WRONG
11  0.7129         1             1     correct
Predicting class for age, education =
[9.5 4.5]
Predicting p = 0.526487952
Predicting class = 1