38 lines
2.1 KiB
Markdown
38 lines
2.1 KiB
Markdown
## Лабораторная работа №5
|
||
|
||
### Ранжирование признаков
|
||
|
||
## ПИбд-41 Абанин Даниил
|
||
|
||
### Как запустить лабораторную работу:
|
||
|
||
* установить python, pandas, matplotlib, sklearn
|
||
* запустить проект (стартовая точка lab4)
|
||
|
||
### Какие технологии использовались:
|
||
|
||
* Язык программирования `Python`, библиотеки pandas, matplotlib, sklearn
|
||
* Среда разработки `PyCharm`
|
||
|
||
### Что делает лабораторная работа:
|
||
Программа решает задачу регрессии, используя полиномиальную регрессию.
|
||
Цель - предсказать сумму займа (LoanAmount), используя имеющиеся признаки: ApplicantIncome - доход заявителя, Credit_History - статус соответствия кредитной истории стандартам банка,
|
||
Education - наличие образования, Married - заявитель женат/замужем (Да/Нет), Self_Employed - самозанятый (Да/Нет)
|
||
|
||
### Тест
|
||
Зелёные маркеры на графике - тестовые результаты
|
||
Красные маркеры на графике - предсказанные результаты
|
||
|
||
При небольшом объёме тестовых данных, алгоритм показывает неплохие результаты обучения
|
||
|
||

|
||
|
||

|
||
|
||
Но при увеличении объёма данных, алгоритм теряет свою эффективность
|
||
|
||

|
||
|
||

|
||
|
||
Вывод: На малых объёмах данных алгоритм показывает свою эффективность. Но при большем объём стоит использовать другие методы для данного набора информации |