Jeux vidéo - Prédire les classements "ESRB" à l'aide de l'apprentissage automatique

Dec 05 2022

Introduction Ce blog fait suite à notre blog précédent - Jeux vidéo - Analyse des genres, des fonctionnalités et des scores - qui comprenait notre collecte de données et notre processus d'analyse exploratoire des données. Nous allons maintenant montrer comment nous avons formé des modèles d'apprentissage automatique pour prédire les notes et rendre compte de leur efficacité.

Source des images

Introduction

Ce blog fait suite à notre blog précédent - Jeux vidéo - Analyse des genres, des fonctionnalités et des scores - qui comprenait notre collecte de données et notre processus d'analyse exploratoire des données. Nous allons maintenant montrer comment nous avons formé des modèles d'apprentissage automatique pour prédire les notes et rendre compte de leur efficacité.

résumer

Ensemble de données : l' ensemble de données initial était le classement des jeux vidéo par « ESRB » de Kaggle ( source ), qui ne comprenait que le titre du jeu, ses fonctionnalités et la classification ESRB. ESRB signifie Entertainment Software Ratings Board. En utilisant les titres de jeux de l'ensemble de données ESRB pour envoyer un ping à metacritic.com, nous avons obtenu des données sur le score, la date de sortie, l'éditeur et les genres de Metacritic. Nous avons fusionné les ensembles de données et résolu les incohérences.

Variables : titres, développeur et éditeur, date de sortie, fonctionnalités, genres, score métacritique, classement ESRB.

Analyse exploratoire des données

Il y a une représentation inégale des genres.
Une corrélation négligeable entre le nombre de jeux publiés par un développeur et le score Metacritic/utilisateur moyen généré par ses jeux
Accord général entre Metacritic et les utilisateurs sur les genres les plus populaires (ayant un score moyen plus élevé) au cours de divers mois de l'année.
Certains genres sont généralement restés populaires à des périodes spécifiques.
Une corrélation positive généralement forte existe entre le score Metacritic et le score de l'utilisateur.
Metacritic et les utilisateurs ont des points de vue différents sur leurs 10 développeurs les mieux notés.
Heatmap suggère une corrélation plus élevée entre le contenu sexuel fort et la violence dans les jeux vidéo.
Le manque de descripteurs, le langage doux/la violence et l'humour grossier sont négativement corrélés avec les scores de Metacritic et des utilisateurs.
Les jeux « matures » ont le score métacritique moyen le plus élevé par rapport aux autres, et les jeux pour « tout le monde » ont le plus bas.

Apprentissage automatique pour prédire les classements ESRB

Objectif : Notre variable d'intérêt est la caractéristique - la notation ESRB - que nous avons l'intention de prédire avec notre modèle.

Ensembles d'entraînement et de test

Nous avons divisé notre ensemble de données en ensembles d'entraînement et de test en utilisant une répartition 80-20. Nous avons abandonné les titres des jeux et n'avons conservé que les données numériques. La forme des jeux de données est la suivante :

train_X : (1895, 32) train_Y : (1895, 1)

text_X : (500, 32) train_Y : (500, 1)

Entraînement

Étant donné que les données étaient trop bruyantes et non structurées pour s'adapter à un modèle linéaire, nous avons décidé d'essayer des modèles non linéaires. Nous avons expérimenté plusieurs ensembles de paramètres pour tous les modèles, et les paramètres finaux sont simplement basés sur ceux qui ont fourni la plus grande précision.

K-Voisin le plus proche (KNN)

Paramètres:

n_neighbors est le nombre de voisins les plus proches que nous utilisons pour déterminer la variable prédite d'un jeu vidéo (classement). Nous avons essayé différentes valeurs entières dans la plage de 3 à 7.

pondérations : une pondération uniforme signifie que chacun des « n » voisins a la même importance dans la détermination de la sortie moyenne. Le poids de la distance implique que l'étendue varie inversement avec leur distance ou leur niveau de différence par rapport au jeu que nous classons. Par exemple, le voisin (jeu dans l'ensemble de données d'entraînement) qui n'est pas très similaire au jeu que nous classifions aura moins d'importance/d'impact dans la détermination du résultat moyen (notation).

p : 1 signifie la distance de Manhattan et 2 signifie la distance euclidienne.

Les meilleurs paramètres que nous avons trouvés étaient :

Le rapport de classification et la matrice de confusion utilisant KNN avec ces paramètres sont les suivants :

rapport de classement KNN

Matrice de confusion KNN

Classificateur de vecteur de support (SVC)

Paramètres:

C est le paramètre de régularisation ; nous avons essayé 20 valeurs dans la plage 0–1.

Kernel : la fonction du noyau utilisée pour transformer les données ; nous avons essayé les fonctions polynomiales, RBF (fonction de base radiale) et les fonctions de noyau sigmoïde.

Degré : le degré de la fonction polynomiale du noyau, nous avons essayé de quadratique à 4 degrés.

Forme de la fonction de décision : nous avons essayé de former une fonction de décision un contre repos ou un contre un

Les meilleurs paramètres que nous avons trouvés étaient :

Le rapport de classification et la matrice de confusion utilisant SVC avec ces paramètres sont les suivants :

Rapport de classement SVC

Matrice de confusion SVC

Forêt aléatoire

Paramètres:

n_estimators est le nombre d'arbres dans la forêt ; nous avons essayé 20 valeurs différentes entre 10 et 200.

Profondeur max : nous avons essayé 10 valeurs différentes de 10 à 100.

Le critère est comme une fonction de perte pour évaluer la qualité d'une division ; nous avons essayé les fonctions de Gini, d'entropie et de perte de journal.

Max_features : fonctionnalités que nous considérons lorsque nous divisons un nœud ; nous avons essayé sqrt, log2 et None.

Les meilleurs paramètres que nous avons trouvés étaient :

Le rapport de classification et la matrice de confusion utilisant Random Forest avec ces paramètres sont les suivants :

Rapport de classement RF

Matrice de confusion RF

Importance des fonctionnalités

Nous avons tracé un graphique à barres des caractéristiques dans notre modèle Random Forest pour déterminer les caractéristiques essentielles.

Le graphique montre que les caractéristiques essentielles de la forêt aléatoire pour déterminer les classes sont l'absence de descripteurs et un langage fort, ce qui indique que ces deux caractéristiques, plus que toute autre, aident à classer correctement le jeu.

Conclusion

À partir de l'analyse et de la modélisation des données, on peut conclure qu'il vaut mieux éviter les genres comme l'action, le jeu de tir et le jeu de rôle car ils sont surpeuplés et compétitifs. De plus, le nombre de jeux publiés par le développeur n'a pas nécessairement de relation causale avec le score métacritique moyen de ces jeux, mais un grand nombre de jeux peut toujours entraîner une diminution du score moyen.

La popularité des différents genres a constamment changé au fil des ans, les jeux de rôle japonais et de style japonais se portant mieux que tous les autres actuellement. Ces genres pourraient offrir aux développeurs des jeux plus performants en ce moment. Cependant, l'intégration de contenu mature n'a pas nécessairement d'impact sur le score Metacritic du jeu.

En ce qui concerne les classements ESRB, parmi toutes les fonctionnalités des jeux, le langage grossier, le sang, le gore et la violence fantastique ont eu l'impact le plus drastique sur le classement ESRB. Ainsi, ces fonctionnalités peuvent jouer un rôle important dans la prédiction de la classification ESRB d'un jeu vidéo, les prédictions les plus précises à cet égard provenant du classificateur SVM formé sur l'ensemble de données.