IIS_2023_1/ilbekov_dmitriy_lab_5/README.md
2023-10-22 21:41:29 +04:00

29 lines
3.6 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Лабораторная работа 5
### Вариант 10
### Задание:
- Используя данные из "F1DriversDataset.csv" сформулировать задачу, решаемую регрессией: Предсказать количество чемпионских титулов по характеристикам: `Race_Entries`, `Race_Starts`, `Pole_Positions`, `Race_Wins`, `Podiums`, `Fastest_Laps`
### Алгоритм кластеризации:
- Линейная регрессия (по варианту)
### Запуск
- Запустить файл lab5.py
### Технологии
- Язык - 'Python'
- Библиотеки sklearn, pandas, matplotlib
### Что делает
- Программа обучает модель линейной регрессии на 95% данных
- Программа оценивает качество предсказаний, используя Коэффициент детерминации R^2 (Мера качества модели регрессии и оценивает, насколько хорошо модель соответствует данным. Она измеряет долю дисперсии зависимой переменной, которая может быть объяснена моделью, относительно общей дисперсии зависимой переменной) на тестовой выборке остальных 5%
- Программа позволяет вручную ввести требуемые характеристики пилота и предсказать количество титулов для данного пилота
- Также результат предсказания можно интерпретировать в другом ключе: если мы введем реальные характеристики гонщика, мы можем посмотреть, насколько он достоин быть титулованным, справедливо или несправедливо отнеслась к нему судьба:)
- Программа дополнительно выводит график, позволяющий визуально определить качество работы модели
### Пример работы
Пример работы представлен в виде скриншотов:
![Console](console.jpg)
![Graphics](graphics.png)
- В результате по графику мы можем видеть, что модель линейной регрессии действительно неплохо справилась со своей задачей предсказания, это подтверждает и хороший R^2 коэффициент, равный 0.89.
- В качестве реального гонщика был выбран действующий чемпион Формулы 1 - Макс Ферстаппен. Любопытно, что модель содержит данные до 23 года и на этих данных модель предсказала, что Ферстаппен - трехкратный чемпион мира в округлении (скриншот консоли). И действительно совсем недавно Макс Ферстаппен стал трехкратным чемпионом мира, оформив чемпионский титул 2023 года. Это еще раз доказывает, что модель действительно неплохо научилась предсказывать.