Видеоигры — прогнозирование рейтинга ESRB с помощью машинного обучения

Dec 05 2022
Введение Этот блог является продолжением нашего предыдущего блога «Видеоигры — анализ жанров, функций и результатов», в котором мы рассказывали о процессе сбора и исследовательского анализа данных. Теперь мы продемонстрируем, как мы научили модели машинного обучения прогнозировать рейтинги и сообщать об их эффективности.
Источник изображения

Введение

Этот блог является продолжением нашего предыдущего блога « Видеоигры — анализ жанров, функций и результатов », в котором мы включили процесс сбора и исследовательского анализа данных. Теперь мы продемонстрируем, как мы научили модели машинного обучения прогнозировать рейтинги и сообщать об их эффективности.

Резюме

Набор данных: исходным набором данных был рейтинг видеоигр от ESRB от Kaggle ( источник ), который включал только название игры, ее функции и рейтинг ESRB. ESRB расшифровывается как Совет по рейтингам развлекательного программного обеспечения. Используя названия игр из набора данных ESRB для проверки связи с metacritic.com, мы получили данные о рейтинге Metacritic, дате выпуска, издателе и жанрах. Мы объединили наборы данных и устранили несоответствия.

Переменные: названия, разработчик и издатель, дата выпуска, функции, жанры, рейтинг Metacritic, рейтинг ESRB.

Исследовательский анализ данных

  • Существует неравномерное представительство жанров.
  • Незначительная корреляция между количеством игр, выпущенных разработчиком, и средней оценкой Metacritic/пользователя, полученной их играми.
  • Общее согласие между Metacritic и пользователями относительно того, какие жанры более популярны (имеют более высокий средний балл) в разные месяцы года.
  • Определенные жанры обычно оставались популярными в определенные периоды.
  • В целом существует сильная положительная корреляция между оценкой Metacritic и пользовательской оценкой.
  • Metacritic и пользователи по-разному относятся к своим 10 разработчикам с самым высоким рейтингом.
  • Тепловая карта предполагает более высокую корреляцию между откровенно сексуальным содержанием и насилием в видеоиграх.
  • Отсутствие описаний, мягкий язык/насилие и грубый юмор отрицательно коррелируют с оценками Metacritic и пользователей.
  • Игры для взрослых имеют самый высокий средний балл на Metacritic по сравнению с другими, а игры для всех — самые низкие.

Машинное обучение для прогнозирования рейтингов ESRB

Цель: интересующей нас переменной является характеристика — рейтинг ESRB, которую мы намереваемся предсказать с помощью нашей модели.

Тренировочные и тестовые наборы

Мы разделили наш набор данных на обучающие и тестовые наборы, используя разделение 80–20. Мы отказались от названий игр и оставили только числовые данные. Форма наборов данных следующая:

поезд_X: (1895, 32) поезд_Y: (1895, 1)

text_X: (500, 32) train_Y: (500, 1)

Подготовка

Поскольку данные были слишком зашумлены и неструктурированы, чтобы соответствовать линейной модели, мы решили попробовать нелинейные модели. Мы экспериментировали с несколькими наборами параметров для всех моделей, и окончательные параметры основаны только на том, какие из них обеспечивают наибольшую точность.

K-ближайший сосед (KNN)

Параметры:

n_neighbors — это количество ближайших соседей, которые мы используем для определения прогнозируемой переменной (рейтинга) видеоигры. Мы пробовали разные целочисленные значения в диапазоне от 3 до 7.

веса: Равномерный вес означает, что каждый из «n» соседей имеет одинаковую важность при определении среднего результата. Вес расстояния подразумевает, что степень изменяется обратно пропорционально их расстоянию или уровню отличия от игры, которую мы классифицируем. Например, сосед (игра в обучающем наборе данных), который не очень похож на игру, которую мы классифицируем, будет иметь меньшее значение/влияние на определение среднего результата (рейтинга).

p: 1 означает манхэттенское расстояние, а 2 означает евклидово расстояние.

Лучшими параметрами, которые мы нашли, были:

Отчет о классификации и матрица путаницы с использованием KNN с этими параметрами выглядят следующим образом:

классификационный отчет КНН
Матрица путаницы KNN

Классификатор опорных векторов (SVC)

Параметры:

C — параметр регуляризации; мы попробовали 20 значений в диапазоне 0–1.

Ядро: функция ядра, используемая для преобразования данных; мы опробовали полиномиальные, RBF (радиальные базисные функции) и сигмовидные функции ядра.

Степень: степень полиномиальной функции ядра, мы пробовали от квадратичной до 4-й степени.

Форма функции принятия решений: мы пытались обучить функцию принятия решений «один против остальных» или «один против одного».

Лучшими параметрами, которые мы нашли, были:

Отчет о классификации и матрица путаницы с использованием SVC с этими параметрами выглядят следующим образом:

Отчет о классификации SVC
Матрица путаницы SVC

Случайный лес

Параметры:

n_estimators — количество деревьев в лесу; мы попробовали 20 различных значений от 10 до 200.

Максимальная глубина: мы попробовали 10 различных значений от 10 до 100.

Критерий похож на функцию потерь для оценки того, насколько хорош сплит; мы пробовали функции Джини, энтропии и логарифмических потерь.

Max_features: функции, которые мы учитываем при разделении узла; мы пробовали sqrt, log2 и None.

Лучшими параметрами, которые мы нашли, были:

Отчет о классификации и матрица путаницы с использованием Random Forest с этими параметрами выглядят следующим образом:

Классификационный отчет РФ
Матрица путаницы RF

Важность функции

Мы построили гистограмму функций в нашей модели случайного леса, чтобы определить основные функции.

На графике показано, что основными функциями, которые случайный лес имеет для определения классов, являются отсутствие дескрипторов и строгие формулировки, что указывает на то, что эти две функции больше, чем какие-либо другие, помогают правильно классифицировать игру.

Вывод

Из анализа данных и моделирования можно сделать вывод, что таких жанров, как боевики, шутеры и ролевые игры, лучше избегать, поскольку они перенаселены и конкурентны. Более того, количество игр, выпущенных разработчиком, не обязательно имеет причинно-следственную связь со средней оценкой этих игр на Metacritic, но большое количество игр все же может привести к снижению средней оценки.

Популярность различных жанров постоянно менялась с годами, и в настоящее время японские ролевые игры и ролевые игры в японском стиле живут лучше, чем все остальные. Эти жанры могут дать разработчикам более производительные игры прямо сейчас. Однако включение контента для взрослых не обязательно влияет на оценку игры на Metacritic.

Что касается рейтингов ESRB, то из всех особенностей игры ненормативная лексика, кровь, запекшаяся кровь и фэнтезийное насилие оказали наибольшее влияние на рейтинг ESRB. Таким образом, эти функции могут играть важную роль в прогнозировании рейтинга ESRB видеоигры, причем наиболее точные прогнозы в этом отношении исходят от классификатора SVM, обученного на наборе данных.

Группа 4

Эйман Сакиб, Мухаммад Хамза, Харрис Ахмад, Неха Надим, Мааз Овайс