IIS_2023_1/gusev_vladislav_lab_5
2023-10-26 17:31:14 +04:00
..
diamonds_prices.csv gusev_vladislav_lab_5 is ready 2023-10-26 17:31:14 +04:00
gusev_vladislav_lab_5.py gusev_vladislav_lab_5 is ready 2023-10-26 17:31:14 +04:00
img.png gusev_vladislav_lab_5 is ready 2023-10-26 17:31:14 +04:00
README.md gusev_vladislav_lab_5 is ready 2023-10-26 17:31:14 +04:00

Вариант 9

Задание на лабораторную работу:

Использовать регрессию по варианту для данных из курсовой работы. Самостоятельно сформулировав задачу. Интерпретировать результаты и оценить, насколько хорошо он подходит для решения сформулированной задачи.

Как запустить лабораторную работу:

Выполняем файл gusev_vladislav_lab_5.py, будет выведен график на экран.

Технологии

NumPy - библиотека для работы с многомерными массивами. Mathplotlib - библиотека для визуализации данных двумерной и трехмерной графикой. Sklearn - библиотека с большим количеством алгоритмов машинного обучения.

Задача

Мною было принято решение посмотреть, как зависит

По коду

  1. Для начала загружаем данные из csv файла
  2. Разделяем данные на обучающее и тестовые
  3. Рескейлим данные из столбца price, который был в диапозоне от 370 до 2700 к диапозону от 0 до 1
  4. Обучаем модель, находим R^2 (среднеквадратическая ошибка) и коэффициент детерминации
  5. Выводим графики

img.png

Вывод

  • Среднеквадарическая ошибка получилась довольно низкой, что говорит нам о точности тестовых и предсказанных значений, однако коэффициент детерминации получился крайне низким, даже отрицательным. Это значит, что модель не понимает зависимости данных.
  • Итог: гребневая модель регресси не применима к нашей задаче