# I - Préliminaires - Fonctions utiles

In [None]:
%matplotlib inline

In [None]:
import matplotlib.pyplot as plt
import itertools
import numpy as np
def plot_confusion_matrix(cm, classes,
 normalize=False,
 title='Matrice de confusion',
 cmap=plt.cm.Blues):
 """
 This function prints and plots the confusion matrix.
 Normalization can be applied by setting `normalize=True`.
 from http://scikit-learn.org/stable/auto_examples/model_selection/plot_confusion_matrix.html
 :param cm: (numpy matrix) confusion matrix
 :param classes: [str]
 :param normalize: (bool)
 :param title: (str)
 :param cmap: (matplotlib color map)
 """
 if normalize:
 cm = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis]
 
 plt.figure(figsize=(8, 8)) 
 plt.imshow(cm, interpolation='nearest', cmap=cmap)
 plt.title(title)
 plt.colorbar()
 tick_marks = np.arange(len(classes))
 plt.xticks(tick_marks, classes, rotation=45)
 plt.yticks(tick_marks, classes)

 fmt = '.2f' if normalize else 'd'
 thresh = cm.max() / 2.
 for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])):
 plt.text(j, i, format(cm[i, j], fmt),
 horizontalalignment="center",
 color="white" if cm[i, j] > thresh else "black")

 plt.tight_layout()
 plt.ylabel('Vérité Terrain')
 plt.xlabel('Prédiction')

# II - Entraînement d'un CNN pour la classification sur CIFAR10

### II.1. Chargement et Dimensionnement de la base CIFAR10

In [None]:
from keras import backend as K
print(K.backend())

In [None]:
from keras.datasets import cifar10

Réduction de la taille du dataset (pour accélérer l'apprentissage), et standardisation des données

In [None]:
(x_train_full, y_train_full), (x_test_full, y_test_full) = cifar10.load_data()
print("Dimension de la base d'apprentissage CIFAR10 :",x_train_full.shape)
print("Dimension des vecteurs d'étiquette de classe :",y_train_full.shape)
print("Dimension de la base de test CIFAR10 :",x_test_full.shape)

In [None]:
classes = ('plane', 'car', 'bird', 'cat',
 'deer', 'dog', 'frog', 'horse', 'ship', 'truck')

In [None]:
n_training_samples = 5000
n_other_samples = 2000

def standardize(img_data):
 img_data_mean = np.mean(img_data, axis=(1,2), keepdims=True)
 img_data_std = np.std(img_data, axis=(1,2), keepdims=True)
 img_data = (img_data - img_data_mean) / img_data_std
 return img_data

train_ids = np.random.choice(len(x_train_full), size=n_training_samples, replace=False)
other_ids = np.random.choice(len(x_test_full), size=n_other_samples, replace=False)

n_valid = n_other_samples // 2
val_ids = other_ids[:n_valid]
test_ids = other_ids[n_valid:]

x_train_initial, y_train = x_train_full[train_ids], y_train_full[train_ids]
x_val_initial, y_val = x_test_full[val_ids], y_test_full[val_ids]
x_test_initial, y_test = x_test_full[test_ids], y_test_full[test_ids]

x_train = standardize(x_train_initial)
x_val = standardize(x_val_initial)
x_test = standardize(x_test_initial)

print("Dimension de notre base d'apprentissage :",x_train.shape)
print("Dimension des vecteurs d'étiquette de classe :",y_train.shape)
print("Dimension de notre base de validation :",x_val.shape)
print("Dimension de notre base de test :",x_test.shape)


On affiche quelques images d'entraînement avec leur étiquette...

In [None]:
n_display = 12
random_ids = np.random.choice(len(x_train), n_display, replace=False)
f, axarr = plt.subplots(1,n_display,figsize=(16,16))
for k in range(n_display):
 axarr[k].imshow(x_train_initial[random_ids[k]])
 axarr[k].title.set_text(classes[y_train[random_ids[k]][0]])

In [None]:
from keras.utils import to_categorical
y_train = to_categorical(y_train)
y_val = to_categorical(y_val)
y_test = to_categorical(y_test)

print("Dimension des matrices d'étiquette de classe (train) :",y_train.shape)
print("Dimension des matrices d'étiquette de classe (val) :",y_val.shape)
print("Dimension des matrices d'étiquette de classe (test) :",y_test.shape)

### II.2. Definition de l'architecture du CNN

Un simple réseau convolutionnel... 

In [None]:
from keras.models import Sequential
from keras.layers import Conv2D, MaxPool2D, Flatten, Dense, Dropout, Activation
from keras.regularizers import l2

model = Sequential()
model.add(Conv2D(filters=8, 
 kernel_size = (3, 3),
 activation = 'relu',
 padding = 'same',
 input_shape = (32, 32, 3),
 kernel_regularizer = l2(0.00)))
model.add(Dropout(0.0))
model.add(MaxPool2D(pool_size=(2,2)))
model.add(Flatten())
model.add(Dense(64, activation='relu', kernel_regularizer = l2(0.00)))
model.add(Dropout(0.0))
model.add(Dense(10, activation='softmax', kernel_regularizer = l2(0.00)))
model.add(Dropout(0.0))

On enregistre les poids initiaux pour plus tard...

In [None]:
weights_init = model.get_weights()

### II.3. Definition de la fonction de coût et choix de l'algorithme d'optimisation

In [None]:
from keras.optimizers import Adam, SGD

opt = SGD(lr=0.01,momentum=0.0)
# opt = Adam(lr=0.001)
model.compile(optimizer=opt,
 loss='categorical_crossentropy',
 metrics=['acc'])

On affiche un résumé de la structure du modèle...

In [None]:
print(model.summary())

### II.4. Entraînement du CNN

*Definition du callback. A passer en première lecture.*

In [None]:
from keras.callbacks import Callback
from keras.callbacks import ModelCheckpoint
import time

class TimeHistory(Callback):
 def on_train_begin(self, logs={}):
 self.times = []

 def on_epoch_begin(self, batch, logs={}):
 self.epoch_time_start = time.time()

 def on_epoch_end(self, batch, logs={}):
 self.times.append(time.time() - self.epoch_time_start)
time_callback = TimeHistory()
filepath = "my_model.h5"
checkpoint = ModelCheckpoint(filepath, monitor='val_acc', verbose=1, save_best_only=True, mode='max', period=2)

callbacks = [time_callback, checkpoint]

In [None]:
history = model.fit(x_train, y_train, batch_size=32, epochs=20, verbose=1, validation_data=(x_val, y_val),
 callbacks=callbacks)

Statistiques sur le temps d'entraînement d'une epoch

In [None]:
times = time_callback.times
print("Mean: {}".format(np.mean(times)))
print("Std: {}".format(np.std(times)))

Tracé des courbes d'évolution des fonctions de coût

In [None]:
history.history.keys()

In [None]:
import matplotlib.pyplot as plt

history_dict = history.history
loss_values = history_dict['loss']
val_loss_values = history_dict['val_loss']
acc_values = history_dict['acc']
val_acc_values = history_dict['val_acc']

epochs = range(1, len(history_dict['acc']) + 1)

fig, ax1 = plt.subplots()
ax1.set_xlabel('Epochs')
ax1.set_ylabel('Loss')
ax1.plot(epochs, loss_values, color='b', label='Training loss')
ax1.plot(epochs, val_loss_values, color='g', label='Validation loss')
ax1.tick_params(axis='y')
plt.legend()

ax2 = ax1.twinx() # instantiate a second axes that shares the same x-axis

ax2.set_ylabel('Accuracy') # we already handled the x-label with ax1
ax2.plot(epochs, acc_values, color='c', label='Training accuracy')
ax2.plot(epochs, val_acc_values, color='r', label='Validation accuracy')
ax2.tick_params(axis='y')

fig.tight_layout() # otherwise the right y-label is slightly clipped
plt.legend(loc=1)
plt.show()

### II.5. Entraînement d'un CNN avec points d'arrêt et reprises (à passer en première lecture)

Pour des entraînements plus conséquents, il est primordial d'enregistrer les modèles intermédiaires afin de ne pas tout perdre si l'apprentissage venait à s'interrompre de façon impromptue. On peut enregistrer le modèle dans un fichier .hdf

Si vous regardez plus attentivement, lors de l'entrainement précédent nous avons crée un object **ModelCheckpoint**. Il permet d'enregistrer le meilleur modèle (au sens d'une metrique à préciser) dans un fichier nommé *my_model.h5*. Verifiez que ce fichier se trouve bien votre espace de travail.

L'argument ***period*** de l'objet ModelCheckpoint vous permet de definir la fréquence des enregistrements.

In [None]:
from keras.models import load_model

Une fois le modele obtenu, on peut l'enregister et le recharger comme ceci: load_model(filepath)

In [None]:
from keras.models import load_model

import pathlib
file = pathlib.Path(filepath)
if file.exists():
 model = load_model(filepath)
else:
 model.set_weights(weights_init)
 callbacks = [time_callback,checkpoint]
history_2 = model.fit(x_train, y_train, batch_size=8, epochs=10, verbose=1, validation_data=(x_val, y_val),
 callbacks = callbacks)

# III - Test et Évaluation du modèle en prédiction

### III.1. Test du modèle sur les données de test

Testons la prédiction de notre modèle sur quelques images de test au hasard...

In [None]:
random_ids = np.random.choice(len(x_test), n_display, replace=False)
pred = np.argmax(model.predict(x_test[random_ids]), axis=1)
f, axarr = plt.subplots(1,n_display,figsize=(16,16))
for k in range(n_display):
 axarr[k].imshow(x_test_initial[random_ids[k]])
 axarr[k].title.set_text(classes[pred[k]])

Vos premiers résultats semblent-ils corrects ?

Hum ! Affichons à présent la précision sur l'ensemble de votre base :

In [None]:
print("Précision du réseau sur les {} images d'entraînement : {:.2f} %".format(n_training_samples, 100 * history_dict['acc'][-1]))
print("Précision du réseau sur les {} images de validation : {:.2f} %".format(n_valid, 100 * history_dict['val_acc'][-1]))

In [None]:
def accuracy_per_class(model):
 n_classes = len(classes)
 confusion_matrix = np.zeros((n_classes, n_classes), dtype=np.int64)
 
 pred = np.argmax(model.predict(x_test), axis=1)
 for i in range(len(y_test)):
 confusion_matrix[np.argmax(y_test[i]), pred[i]] += 1
 
 print("{:<10} {:^10}".format("Classe", "Précision (%)"))
 total_correct = 0
 for i in range(n_classes):
 class_total = confusion_matrix[i, :].sum()
 class_correct = confusion_matrix[i, i]
 total_correct += class_correct
 percentage_correct = 100.0 * float(class_correct) / class_total
 print('{:<10} {:^10.2f}'.format(classes[i], percentage_correct))
 test_acc = 100.0 * float(total_correct) / len(y_test)
 print("Précision du réseau sur les {} images de test : {:.2f} %".format(len(y_test),test_acc))
 return confusion_matrix

confusion_matrix = accuracy_per_class(model)

### III.2. Matrices de Confusion

Les matrices de confusion nous renseignent plus précisément sur la nature des erreurs commises par notre modèle.

In [None]:
# Plot normalized confusion matrix
plot_confusion_matrix(confusion_matrix, classes, normalize=True,
 title='Matrice de confusion normalisée')

# Plot non-normalized confusion matrix
plot_confusion_matrix(confusion_matrix, classes,
 title='Matrice de confusion non normalisée')

# IV - Visualisation des zones d'activation

In [None]:
from keras.models import Model

reduced_model = Model(inputs=model.inputs, outputs=model.layers[1].output)
reduced_model.summary()

In [None]:
feature_maps = reduced_model.predict(x_test)

In [None]:
def get_mask(k):
 feature_maps_positive = np.maximum(feature_maps[k], 0)
 mask = np.sum(feature_maps_positive,axis=2)
 mask = mask / np.max(mask)
 return mask

In [None]:
random_ids = np.random.choice(len(x_test), n_display, replace=False)
f, rd_img = plt.subplots(1,n_display,figsize=(16,16))
for k in range(n_display):
 img = x_test_initial[random_ids[k]]
 rd_img[k].imshow(img)
 rd_img[k].axis('off')
f, rd_maps = plt.subplots(1,n_display,figsize=(16,16))
for k in range(n_display):
 mask = get_mask(random_ids[k])
 rd_maps[k].imshow(mask)
 rd_maps[k].axis('off')