Загрузите датасет из ЛР1. Датасет большой, рекомендуется для работы взять его часть (далее - корпус). Если вам не нравится этот набор данных, можете использовать другой, по своему вкусу.
Рассмотрите каждый объект корпуса как отдельный текстовый документ. Выполните предварительную обработку каждого объекта.
Выполните векторизацию каждого документа любым способом (можно с помощью своих моделей Word2Vec, при условии, что Word2Vec модели обучались на той же выборке документов; можно использовать другие библиотеки и модели).
Закодируйте значения целевого признака (категория обращения). Разделите данные на обучающую и тестирующую выборку.
С помощью PyTorch соберите и обучите три нейронных сети для решения задачи классификации (предсказания категории обращения); количество слоев и значения других параметров конфигурируете по вашему усмотрению:
сеть на базе блока RNN;
сеть на базе блока LSTM;
сеть на базе блока GRU.
Используя известные вам метрики классификации и тестирующую выборку оцените качество каждой из обученных моделей. Сделайте вывод о том, какая из моделей на ваших данных отработала лучше других.