IIS_2023_1/malkova_anastasia_lab_5/README.md

49 lines
2.5 KiB
Markdown
Raw Normal View History

2023-11-17 00:28:29 +04:00
# Лабораторная работа №5
> Регрессия
### Как запустить лабораторную работу
1. Установить python, numpy, sklearn
2. Запустить команду `python main1.py` в корне проекта для запуска 1 части
3. Запустить команду `python main2.py` в корне проекта для запуска 2 части
### Использованные технологии
* Язык программирования `python`
* Библиотеки `numpy, sklearn`
* Среда разработки `PyCharm`
### Что делает программа?
Цель программы: на основе данных об автомобилях на вторичном рынке обучить модель регрессии на предсказание цены.
Используемая модель: Лассо-регрессия
#### Определим признаки
LINEAR [('Year', 1.0), ('Mileage', 0.4868), ('State', 0.0729), ('Vin', 0.015), ('City', 0.0037), ('Model', 0.0002), ('Make', 0.0)]
RIDGE [('Year', 1.0), ('Mileage', 0.4868), ('State', 0.0729), ('Vin', 0.015), ('City', 0.0037), ('Model', 0.0002), ('Make', 0.0)]
LASSO [('Year', 1.0), ('Mileage', 0.4868), ('State', 0.0729), ('Vin', 0.015), ('City', 0.0037), ('Model', 0.0002), ('Make', 0.0)]
RFE [('Year', 1.0), ('State', 1.0), ('Mileage', 1.0), ('City', 0.5), ('Vin', 0.5), ('Model', 0.0), ('Make', 0.0)]
f_regression [('Year', 1.0), ('State', 0.1438), ('Vin', 0.0878), ('City', 0.0845), ('Mileage', 0.0711), ('Model', 0.0335), ('Make', 0.0)]
MEAN [('Year', 0.2), ('Mileage', 0.0974), ('State', 0.0146), ('Vin', 0.003), ('City', 0.0007), ('Model', 0.0), ('Make', 0.0)]
Отсечение признаков, у которых MEAN ниже 0.001. Выделенные признаки для дальнейшего обучения модели Lasso.
##### Запуск модели Lasso с параметрами
![main2.py](main2.png)
#### Итоговые выводы
Были выбраны основные признаки для обучения модели, которые имеют большее влияние на предсказание.
Проведены несколько тестов по обучению модели Lasso с разными alpha (силой влияния регуляризации),
но это не оказало большого влияния. Точность в 94.33% приемлемая.