Le previsioni della CNN funzionano dal set di test ma non dalle immagini
Sto provando a fare un classificatore di genere della CNN e funziona bene con le immagini dal set di test, ma quando inserisco iamges da Google è sempre classificato come maschio. Ho provato a ottenere la risposta da qui ma non è stato risolto.
data = pd.read_csv('/content/age_gender.csv')
## Converting pixels into numpy array
data['pixels']=data['pixels'].apply(lambda x: np.array(x.split(), dtype="float32"))
classification = ['Male', 'Female']
X = np.array(data['pixels'].tolist())
## Converting pixels from 1D to 3D
X = X.reshape(X.shape[0],48,48,1)
X = X / 255.0
y = data['gender'].values
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.22, random_state=37)
model = Sequential..... # create the CNN and compile it
history = model.fit..... # fit the model and evaluate it gives me val_accuracy: 0.8902
Perdita del test: 0,24722696840763092 Precisione del test: 0,8912960290908813
Quando prevedo un'immagine dal set di test utilizzando il codice seguente, funziona bene.
index = 5009
image = X_test[index]
pred = model.predict(image.reshape(1, 48, 48, 1), batch_size=1)
print(classification[pred.argmax()])
Ma quando provo a prevedere le immagini da Google torna sempre come maschio.
file = "/content/female-2.jpeg"
image = cv.imread(file, cv.IMREAD_GRAYSCALE)
image = cv.resize(image, (48, 48))
image = image.reshape(1, 48, 48, 1)
image = image.astype('float32')
image = 255-image
image /= 255
pred = model.predict(image.reshape(1, 48, 48, 1), batch_size=1)
print(classification[pred.argmax()])
Ho provato un sacco di immagini diverse che sono femmine e torna SEMPRE come maschio. Cosa mi manca qui?
Risposte
Le immagini da Google vengono pre-elaborate in modo diverso rispetto a quando si addestra il modello. La normalizzazione dei valori dei pixel è ciò che causa il problema.
image = 255-image
image /= 255
Questo dovrebbe invece essere:
image /= 255.0