As previsões da CNN funcionam a partir do conjunto de testes, mas não das próprias imagens

Jan 02 2021

Estou tentando fazer um classificador de gênero CNN e funciona bem com imagens do conjunto de teste, mas quando eu insiro imagens do Google, está sempre classificado como masculino. Tentei obter a resposta daqui, mas não resolveu.

data = pd.read_csv('/content/age_gender.csv')

## Converting pixels into numpy array
data['pixels']=data['pixels'].apply(lambda x:  np.array(x.split(), dtype="float32"))

classification = ['Male', 'Female']

X = np.array(data['pixels'].tolist())

## Converting pixels from 1D to 3D
X = X.reshape(X.shape[0],48,48,1)
X = X / 255.0

y = data['gender'].values

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.22, random_state=37)

model = Sequential.....   # create the CNN and compile it
history = model.fit.....          # fit the model and evaluate it gives me val_accuracy: 0.8902

Perda de teste: 0,24722696840763092 Precisão de teste: 0,8912960290908813

Quando eu prevejo uma imagem do conjunto de teste usando o código a seguir, ele funciona bem.

index = 5009
image = X_test[index]

pred = model.predict(image.reshape(1, 48, 48, 1), batch_size=1)

print(classification[pred.argmax()])

Mas quando tento prever imagens do google, sempre volta como masculino.

file = "/content/female-2.jpeg"
image = cv.imread(file, cv.IMREAD_GRAYSCALE)

image = cv.resize(image, (48, 48))
image = image.reshape(1, 48, 48, 1)
image = image.astype('float32')
image = 255-image
image /= 255

pred = model.predict(image.reshape(1, 48, 48, 1), batch_size=1)
print(classification[pred.argmax()])

Eu tentei um monte de imagens diferentes de mulheres e SEMPRE voltou como masculina. O que estou perdendo aqui?

Respostas

2 yudhiesh Jan 02 2021 at 10:34

Você pré-processa as imagens do Google de forma diferente em comparação com quando treina o modelo. A normalização dos valores dos pixels é o que causa o problema.

image = 255-image
image /= 255

Em vez disso, deveria ser:

image /= 255.0