Пример преобразования текста в SQL с преобразователями Huggingface

May 01 2023
Переобучение базовой модели T5 с набором данных WikiSQL на графическом процессоре Kaggle NVIDIA TESLA P100
В этой статье я внимательно слежу за подробным блокнотом от Мануэля Ромеро с небольшими изменениями, такими как замена малой модели T5 базовой моделью T5 (таким образом увеличивая количество обучаемых параметров с 60M до примерно 223M). Полную информацию об анализе можно найти в этой общедоступной записной книжке Kaggle.
Фото Caspar Camille Rubin на Unsplash

В этой статье я внимательно слежу за подробным блокнотом от Мануэля Ромеро с небольшими изменениями, такими как замена малой модели T5 базовой моделью T5 (таким образом увеличивая количество обучаемых параметров с 60M до примерно 223M ). Полную информацию об анализе можно найти в этой общедоступной записной книжке Kaggle .

В результате обучения в течение 5 эпох (занимает около 2 часов графического процессора NVIDIA TESLA P100 , доступного для пользователей Kaggle ), соответствующий ROUGE2 Fscore составляет около 0,7904 , или на 2,86 процентных пункта выше, чем полученный в исходном ноутбуке :

Источник: автор, text2sql_T5_retrain | Каггл

Некоторые из предсказанных примеров преобразования текста в SQL, выполняемого обученной моделью, вместе с ожидаемыми SQL-запросами:

translate to SQL: What is terrence ross' nationality
Predicted: SELECT Nationality FROM table WHERE Player = Terrence Ross
Expected: SELECT Nationality FROM table WHERE Player = Terrence Ross

translate to SQL: how many schools or teams had jalen rose
Predicted: SELECT COUNT School/Club Team FROM table WHERE Player = Jalen Rose
Expected: SELECT COUNT School/Club Team FROM table WHERE Player = Jalen Rose

translate to SQL: What was the date of the race in Misano?
Predicted: SELECT Date FROM table WHERE Location = misano
Expected: SELECT Date FROM table WHERE Circuit = Misano

translate to SQL: How many different college/junior/club teams provided a player to the Washington Capitals NHL Team?
Predicted: SELECT COUNT College/junior/club team FROM table WHERE NHL Team = Washington Capitals
Expected: SELECT COUNT College/junior/club team FROM table WHERE NHL team = Washington Capitals

translate to SQL: What is the nationality of the player from Vancouver Canucks?
Predicted: SELECT Nationality FROM table WHERE NHL team = Vancouver Canucks
Expected: SELECT Nationality FROM table WHERE NHL team = Vancouver Canucks

translate to SQL: List the # for ships commissioned on december 18, 1965.
Predicted: SELECT # FROM table WHERE Commissioned = December 18, 1965
Expected: SELECT # FROM table WHERE Commissioned = December 18, 1965

translate to SQL:  What could a spanish coronel be addressed as in the commonwealth military?
Predicted: SELECT Address FROM table WHERE Country = commonwealth military AND Language = spanish coronel
Expected: SELECT Commonwealth equivalent FROM table WHERE Rank in Spanish = Coronel

translate to SQL: If you're a major general in the US air force then what ranking will you receive in the commonwealth's air force?
Predicted: SELECT Air Force Ranking FROM table WHERE Major General = US Air Force
Expected: SELECT Commonwealth equivalent FROM table WHERE US Air Force equivalent = Major General

Я надеюсь, что эти результаты могут быть полезны для вас. В случае вопросов/комментариев, не стесняйтесь писать в комментариях ниже или связаться со мной напрямую через LinkedIn или Twitter .

Вы также можете подписаться на мои новые статьи или стать приглашенным пользователем Medium .