Videojuegos: predicción de calificaciones 'ESRB' mediante el aprendizaje automático

Dec 05 2022
Introducción Este blog es una continuación de nuestro blog anterior, Videojuegos: análisis de géneros, funciones y puntuaciones, que incluía nuestra recopilación de datos y el proceso de análisis exploratorio de datos. Ahora demostraremos cómo entrenamos modelos de aprendizaje automático para predecir calificaciones e informar su eficiencia.
Fuente de imagen

Introducción

Este blog es una continuación de nuestro blog anterior, Videojuegos: análisis de géneros, características y puntajes , que incluía nuestra recopilación de datos y el proceso de análisis exploratorio de datos. Ahora demostraremos cómo entrenamos modelos de aprendizaje automático para predecir calificaciones e informar su eficiencia.

Resumen

Conjunto de datos: el conjunto de datos inicial fue Video Game Ratings by 'ESRB', de Kaggle ( fuente ), que solo incluía el título del juego, sus funciones y la clasificación ESRB. ESRB significa Consejo de clasificación de software de entretenimiento. Usando los títulos de juegos del conjunto de datos ESRB para hacer ping a metacritic.com, obtuvimos datos sobre el puntaje de Metacritic, la fecha de lanzamiento, el editor y los géneros. Fusionamos los conjuntos de datos y resolvimos las inconsistencias.

Variables: Títulos, desarrollador y editor, fecha de lanzamiento, características, géneros, puntaje metacrítico, calificación ESRB.

Perspectivas de análisis de datos exploratorios

  • Hay una representación desigual de los géneros.
  • Una correlación insignificante entre la cantidad de juegos lanzados por un desarrollador y el puntaje promedio de Metacritic/usuario generado por sus juegos.
  • Acuerdo general entre Metacritic y los usuarios sobre qué géneros son más populares (tienen una puntuación media más alta) durante varios meses del año.
  • Ciertos géneros generalmente se han mantenido populares en períodos específicos.
  • Existe una correlación positiva generalmente fuerte entre la puntuación de Metacritic y la puntuación del usuario.
  • Metacritic y los usuarios tienen puntos de vista diferentes sobre sus 10 desarrolladores mejor calificados.
  • El mapa de calor sugiere una mayor correlación entre el fuerte contenido sexual y la violencia en los videojuegos.
  • La falta de descriptores, lenguaje leve/violencia y humor crudo se correlacionan negativamente con Metacritic y las puntuaciones de los usuarios.
  • Los juegos para "maduros" tienen el puntaje promedio más alto de Metacritic en comparación con otros, y los juegos para "Todos" tienen el más bajo.

Aprendizaje automático para predecir las calificaciones de la ESRB

Meta: Nuestra variable de interés es la característica (calificación ESRB) que pretendemos predecir con nuestro modelo.

Conjuntos de entrenamiento y prueba

Dividimos nuestro conjunto de datos en conjuntos de entrenamiento y prueba utilizando una división de 80-20. Eliminamos los títulos de los juegos y solo conservamos los datos numéricos. La forma de los conjuntos de datos es la siguiente:

tren_X: (1895, 32) tren_Y: (1895, 1)

texto_X: (500, 32) tren_Y: (500, 1)

Capacitación

Dado que los datos eran demasiado ruidosos y no estaban estructurados para ajustarse a un modelo lineal, decidimos probar modelos no lineales. Experimentamos con varios conjuntos de parámetros para todos los modelos, y los parámetros finales se basan solo en los que proporcionaron la mayor precisión.

K-vecino más cercano (KNN)

Parámetros:

n_neighbors es el número de vecinos más cercanos que usamos para determinar la variable predicha (calificación) de un videojuego. Probamos diferentes valores enteros en el rango de 3 a 7.

pesos: El peso uniforme significa que cada uno de los 'n' vecinos tiene la misma importancia para determinar la salida promedio. El peso de la distancia implica que la medida varía inversamente con su distancia o nivel de diferencia con el juego que estamos clasificando. Por ejemplo, el vecino (juego en el conjunto de datos de entrenamiento) que no es muy similar al juego que estamos clasificando tendrá menos importancia/impacto para determinar el resultado promedio (calificación).

p: 1 significa distancia de Manhattan y 2 significa distancia euclidiana.

Los mejores parámetros que encontramos fueron:

El informe de clasificación y matriz de confusión utilizando KNN con estos parámetros es el siguiente:

informe de clasificación KNN
Matriz de confusión KNN

Clasificador de vectores de soporte (SVC)

Parámetros:

C es el parámetro de regularización; probamos 20 valores en el rango de 0-1.

Kernel: la función del kernel utilizada para transformar los datos; Probamos funciones polinómicas, RBF (función de base radial) y kernel sigmoide.

Grado: el grado de la función kernel polinomial, probamos de cuadrático a 4 grados.

Forma de la función de decisión: intentamos entrenar una función de decisión uno contra el resto o uno contra uno

Los mejores parámetros que encontramos fueron:

El informe de clasificación y matriz de confusión utilizando SVC con estos parámetros es el siguiente:

Informe de clasificación SVC
Confusión Matrix SVC

Bosque aleatorio

Parámetros:

n_estimators es el número de árboles en el bosque; probamos 20 valores diferentes entre 10 y 200.

Profundidad máxima: probamos 10 valores diferentes de 10 a 100.

El criterio es como una función de pérdida para evaluar qué tan buena es una división; Probamos funciones de Gini, entropía y pérdida de registro.

Max_features: características que consideramos cuando dividimos un nodo; probamos sqrt, log2 y Ninguno.

Los mejores parámetros que encontramos fueron:

El reporte de clasificación y matriz de confusión usando Random Forest con estos parámetros es el siguiente:

Informe de clasificación RF
Matriz de confusión RF

Importancia de la función

Trazamos un gráfico de barras de características en nuestro modelo Random Forest para determinar las características esenciales.

El gráfico muestra que las características esenciales con las que ha llegado Random Forest para determinar las clases son la ausencia de descriptores y un lenguaje fuerte, lo que indica que estas dos características, más que cualquier otra, ayudan a clasificar correctamente el juego.

Conclusión

Del análisis de datos y el modelado, se puede concluir que es mejor evitar géneros como acción, disparos y juegos de rol, ya que están superpoblados y son competitivos. Además, la cantidad de juegos lanzados por el desarrollador no necesariamente tiene una relación causal con el puntaje promedio de Metacritic de esos juegos, pero una gran cantidad de juegos aún puede resultar en un puntaje promedio reducido.

La popularidad de los diferentes géneros ha cambiado constantemente a lo largo de los años, y los juegos de rol japoneses y de estilo japonés funcionan mejor que todos los demás actualmente. Estos géneros podrían ofrecer a los desarrolladores juegos con un mejor rendimiento en este momento. Sin embargo, la incorporación de contenido para adultos no necesariamente tiene un impacto en la puntuación de Metacritic del juego.

En cuanto a las calificaciones de la ESRB, de todas las características de los juegos, el lenguaje fuerte, la sangre, el gore y la violencia de fantasía tuvieron el impacto más drástico en la calificación de la ESRB. Por lo tanto, estas características pueden desempeñar un papel importante en la predicción de la calificación ESRB de un videojuego, las predicciones más precisas a este respecto provienen del clasificador SVM entrenado en el conjunto de datos.

Grupo 4

Eimaan Saqib, Muhammad Hamza, Harris Ahmad, Neha Nadeem, Maaz Owais