Le previsioni della CNN funzionano dal set di test ma non dalle immagini

Jan 02 2021

Sto provando a fare un classificatore di genere della CNN e funziona bene con le immagini dal set di test, ma quando inserisco iamges da Google è sempre classificato come maschio. Ho provato a ottenere la risposta da qui ma non è stato risolto.

data = pd.read_csv('/content/age_gender.csv')

## Converting pixels into numpy array
data['pixels']=data['pixels'].apply(lambda x:  np.array(x.split(), dtype="float32"))

classification = ['Male', 'Female']

X = np.array(data['pixels'].tolist())

## Converting pixels from 1D to 3D
X = X.reshape(X.shape[0],48,48,1)
X = X / 255.0

y = data['gender'].values

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.22, random_state=37)

model = Sequential.....   # create the CNN and compile it
history = model.fit.....          # fit the model and evaluate it gives me val_accuracy: 0.8902

Perdita del test: 0,24722696840763092 Precisione del test: 0,8912960290908813

Quando prevedo un'immagine dal set di test utilizzando il codice seguente, funziona bene.

index = 5009
image = X_test[index]

pred = model.predict(image.reshape(1, 48, 48, 1), batch_size=1)

print(classification[pred.argmax()])

Ma quando provo a prevedere le immagini da Google torna sempre come maschio.

file = "/content/female-2.jpeg"
image = cv.imread(file, cv.IMREAD_GRAYSCALE)

image = cv.resize(image, (48, 48))
image = image.reshape(1, 48, 48, 1)
image = image.astype('float32')
image = 255-image
image /= 255

pred = model.predict(image.reshape(1, 48, 48, 1), batch_size=1)
print(classification[pred.argmax()])

Ho provato un sacco di immagini diverse che sono femmine e torna SEMPRE come maschio. Cosa mi manca qui?

Risposte

2 yudhiesh Jan 02 2021 at 10:34

Le immagini da Google vengono pre-elaborate in modo diverso rispetto a quando si addestra il modello. La normalizzazione dei valori dei pixel è ciò che causa il problema.

image = 255-image
image /= 255

Questo dovrebbe invece essere:

image /= 255.0