- Посмотреть возможности библиотек scikit-learn и gensim для решения задачи тематического моделирования.
-
Возьмите обучающие и тестовые данные из лабораторной работы №5.
-
Выполните тематическое моделирование новостных статей при помощи следующих объектов из библиотек:
- LDA (sklearn и gensim);
- NMF (sklearn и gensim);
- SVD / LSA (sklearn).
-
Проинтерпретируйте полученные наборы тем.
- Изучены возможности библиотек для тематического моделирования.
- Выполнено тематическое моделирование новостных статей с применением данных объектов.
- Полученные модели проинтерпретированы.