IIS_2023_1/ilbekov_dmitriy_lab_5/README.md
2023-10-22 21:41:29 +04:00

3.6 KiB
Raw Blame History

Лабораторная работа 5

Вариант 10

Задание:

  • Используя данные из "F1DriversDataset.csv" сформулировать задачу, решаемую регрессией: Предсказать количество чемпионских титулов по характеристикам: Race_Entries, Race_Starts, Pole_Positions, Race_Wins, Podiums, Fastest_Laps

Алгоритм кластеризации:

  • Линейная регрессия (по варианту)

Запуск

  • Запустить файл lab5.py

Технологии

  • Язык - 'Python'
  • Библиотеки sklearn, pandas, matplotlib

Что делает

  • Программа обучает модель линейной регрессии на 95% данных
  • Программа оценивает качество предсказаний, используя Коэффициент детерминации R^2 (Мера качества модели регрессии и оценивает, насколько хорошо модель соответствует данным. Она измеряет долю дисперсии зависимой переменной, которая может быть объяснена моделью, относительно общей дисперсии зависимой переменной) на тестовой выборке остальных 5%
  • Программа позволяет вручную ввести требуемые характеристики пилота и предсказать количество титулов для данного пилота
  • Также результат предсказания можно интерпретировать в другом ключе: если мы введем реальные характеристики гонщика, мы можем посмотреть, насколько он достоин быть титулованным, справедливо или несправедливо отнеслась к нему судьба:)
  • Программа дополнительно выводит график, позволяющий визуально определить качество работы модели

Пример работы

Пример работы представлен в виде скриншотов:

Console Graphics

  • В результате по графику мы можем видеть, что модель линейной регрессии действительно неплохо справилась со своей задачей предсказания, это подтверждает и хороший R^2 коэффициент, равный 0.89.
  • В качестве реального гонщика был выбран действующий чемпион Формулы 1 - Макс Ферстаппен. Любопытно, что модель содержит данные до 23 года и на этих данных модель предсказала, что Ферстаппен - трехкратный чемпион мира в округлении (скриншот консоли). И действительно совсем недавно Макс Ферстаппен стал трехкратным чемпионом мира, оформив чемпионский титул 2023 года. Это еще раз доказывает, что модель действительно неплохо научилась предсказывать.