IIS_2023_1/madyshev_egor_lab_5
2023-11-02 19:03:28 +04:00
..
main.py madyshev_egor_lab_5 is ready 2023-11-02 19:03:28 +04:00
readme.md madyshev_egor_lab_5 is ready 2023-11-02 19:03:28 +04:00
StudentsPerformance.csv madyshev_egor_lab_5 is ready 2023-11-02 19:03:28 +04:00

Задание

Использовать регрессию по варианту для данных из таблицы 1 по варианту (таблица 10), самостоятельно сформулировав задачу. Оценить, насколько хорошо она подходит для решения сформулированной вами задачи.

Задание по варианту

Полиномиальная регрессия

Решение

Запуск программы

Для запуска программы необходимо запустить файл main.py, содержащий код программы

Используемые технологии

Программа использует следующие библиотеки:

  • numpy - библиотека для работы с массивами и матрицами.
  • matplotlib - библиотека для создания графиков и визуализации данных.
  • sklearn - библиотека для машинного обучения и анализа данных.

Что делает программа

Программа читает данные из csv файла. Подготавливает их для работы модели, приводя текстовые параметры к числам. И пытается научиться предсказывать оценку по математике на основании остальных данных с помощью различных моделей.

Тесты

Данные без подготовки:
gender race/ethnicity parental level of education lunch test preparation course math score reading score writing score
0 female group B bachelor's degree standard none 72 72 74
1 female group C some college standard completed 69 90 88
2 female group B master's degree standard none 90 95 93
3 male group A associate's degree free/reduced none 47 57 44
4 male group C some college standard none 76 78 75

Данные после подготовки:
gender race/ethnicity parental level of education lunch test preparation course math score reading score writing score
0 0 0 0 0 0 72 72 74
1 0 1 1 0 1 69 90 88
2 0 0 2 0 0 90 95 93
3 1 2 3 1 0 47 57 44
4 1 1 1 0 0 76 78 75

Линейная регрессия: 0.8769480272687482
Полиномиальная регрессия: 0.736490555768213
Лассо-регрессия: 0.8299946331354273
Гребневая регрессия: 0.8768384994076267

Логическая регрессия не подошла так как требует чтобы переменная ответа была двоичной. Из результатов четырех моделей видно, что для решения задачи предсказания оценки по математике неплохо подходит модель Линейной регрессии.
Модель гребневой регрессии имеет схожие результаты. Далее идет лассо, и хуже всех полиномиальная регрессия.

Вывод: Для решения задачи предсказания результатов экзамена по математике неплохо подходят линейные модели, а именно линейная регрессия и гребневая регрессия