3.6 KiB
3.6 KiB
Лабораторная работа 5
Вариант 10
Задание:
- Используя данные из "F1DriversDataset.csv" сформулировать задачу, решаемую регрессией: Предсказать количество чемпионских титулов по характеристикам:
Race_Entries
,Race_Starts
,Pole_Positions
,Race_Wins
,Podiums
,Fastest_Laps
Алгоритм кластеризации:
- Линейная регрессия (по варианту)
Запуск
- Запустить файл lab5.py
Технологии
- Язык - 'Python'
- Библиотеки sklearn, pandas, matplotlib
Что делает
- Программа обучает модель линейной регрессии на 95% данных
- Программа оценивает качество предсказаний, используя Коэффициент детерминации R^2 (Мера качества модели регрессии и оценивает, насколько хорошо модель соответствует данным. Она измеряет долю дисперсии зависимой переменной, которая может быть объяснена моделью, относительно общей дисперсии зависимой переменной) на тестовой выборке остальных 5%
- Программа позволяет вручную ввести требуемые характеристики пилота и предсказать количество титулов для данного пилота
- Также результат предсказания можно интерпретировать в другом ключе: если мы введем реальные характеристики гонщика, мы можем посмотреть, насколько он достоин быть титулованным, справедливо или несправедливо отнеслась к нему судьба:)
- Программа дополнительно выводит график, позволяющий визуально определить качество работы модели
Пример работы
Пример работы представлен в виде скриншотов:
- В результате по графику мы можем видеть, что модель линейной регрессии действительно неплохо справилась со своей задачей предсказания, это подтверждает и хороший R^2 коэффициент, равный 0.89.
- В качестве реального гонщика был выбран действующий чемпион Формулы 1 - Макс Ферстаппен. Любопытно, что модель содержит данные до 23 года и на этих данных модель предсказала, что Ферстаппен - трехкратный чемпион мира в округлении (скриншот консоли). И действительно совсем недавно Макс Ферстаппен стал трехкратным чемпионом мира, оформив чемпионский титул 2023 года. Это еще раз доказывает, что модель действительно неплохо научилась предсказывать.