Загрузите в рабочую среду одномерный временной ряд, посвященный измерению солнечной активности (этот набор данных описывает ежемесячный подсчет количества наблюдавшихся солнечных пятен за чуть более 230 лет, 1749-1983 гг.).
Выполните анализ типов данных датасета, если нужно, сделайте приведение типов. Проверьте, сохраняется ли во временном ряду частота дискретизации временных меток. Если она нарушается, добавьте недостающие метки.
Используя инструменты библиотеки sklearn, разделите датасет на обучающую и тестовую выборки (обязательно проконтролируйте, чтобы временная структура сохранялась). Визуализируйте их.
Проверьте, есть ли в данных пропущенные значения. Если таковые имеются, локализуйте их и заполните с использованием следующих методов:
backward fill;
forward fill;
линейная интерполяция;
квадратная интерполяция;
IterativeImputer (MICE);
KNNImputer.
Визуализируйте результаты заполнения пропусков, выберите лучший алгоритм заполнения.
Используя известные вам методы детекции выбросов в данных, удалите сильно выделяющиеся значения временного ряда (выполните клиппинг). Можно использовать один метод, можно использовать комбинацию методов.
На полученных данных постройте наивную модель прогнозирования временного ряда. Одну модель возьмите из библиотеки etna (класс NaiveModel из пакета etna.models, не забудьте, что для корректной работы библиотеки необходимо представить данные в определенном формате). А другую -- из библиотеки sktime (класс NaiveForecaster из пакета sktime.forecasting.naive, библиотека похожа на sklearn, работает с обычными датафреймами).
Визуализируйте прогноз моделей, реальные значения тестовой выборки, а также обучающие данные (для каждого графика должны быть свой цвет и легенда).