41 lines
4.4 KiB
Markdown
41 lines
4.4 KiB
Markdown
|
# Задание
|
|||
|
Использовать регрессию по варианту для данных из таблицы 1 по варианту (таблица 10), самостоятельно сформулировав задачу. Оценить, насколько хорошо она подходит для решения сформулированной вами задачи.
|
|||
|
## Задание по варианту
|
|||
|
Полиномиальная регрессия
|
|||
|
## Решение
|
|||
|
### Запуск программы
|
|||
|
Для запуска программы необходимо запустить файл main.py, содержащий код программы
|
|||
|
### Используемые технологии
|
|||
|
Программа использует следующие библиотеки:
|
|||
|
- numpy - библиотека для работы с массивами и матрицами.
|
|||
|
- matplotlib - библиотека для создания графиков и визуализации данных.
|
|||
|
- sklearn - библиотека для машинного обучения и анализа данных.
|
|||
|
### Что делает программа
|
|||
|
Программа читает данные из csv файла. Подготавливает их для работы модели, приводя текстовые параметры к числам. И пытается научиться предсказывать оценку по математике на основании остальных данных с помощью различных моделей.
|
|||
|
### Тесты
|
|||
|
Данные без подготовки:
|
|||
|
gender race/ethnicity parental level of education lunch test preparation course math score reading score writing score
|
|||
|
0 female group B bachelor's degree standard none 72 72 74
|
|||
|
1 female group C some college standard completed 69 90 88
|
|||
|
2 female group B master's degree standard none 90 95 93
|
|||
|
3 male group A associate's degree free/reduced none 47 57 44
|
|||
|
4 male group C some college standard none 76 78 75
|
|||
|
|
|||
|
Данные после подготовки:
|
|||
|
gender race/ethnicity parental level of education lunch test preparation course math score reading score writing score
|
|||
|
0 0 0 0 0 0 72 72 74
|
|||
|
1 0 1 1 0 1 69 90 88
|
|||
|
2 0 0 2 0 0 90 95 93
|
|||
|
3 1 2 3 1 0 47 57 44
|
|||
|
4 1 1 1 0 0 76 78 75
|
|||
|
|
|||
|
Линейная регрессия: 0.8769480272687482
|
|||
|
Полиномиальная регрессия: 0.736490555768213
|
|||
|
Лассо-регрессия: 0.8299946331354273
|
|||
|
Гребневая регрессия: 0.8768384994076267
|
|||
|
|
|||
|
Логическая регрессия не подошла так как требует чтобы переменная ответа была двоичной.
|
|||
|
Из результатов четырех моделей видно, что для решения задачи предсказания оценки по математике неплохо подходит модель Линейной регрессии.
|
|||
|
Модель гребневой регрессии имеет схожие результаты. Далее идет лассо, и хуже всех полиномиальная регрессия.
|
|||
|
|
|||
|
Вывод: Для решения задачи предсказания результатов экзамена по математике неплохо подходят линейные модели, а именно линейная регрессия и гребневая регрессия
|