49 lines
2.5 KiB
Markdown
49 lines
2.5 KiB
Markdown
# Лабораторная работа №5
|
||
|
||
> Регрессия
|
||
|
||
### Как запустить лабораторную работу
|
||
|
||
1. Установить python, numpy, sklearn
|
||
2. Запустить команду `python main1.py` в корне проекта для запуска 1 части
|
||
3. Запустить команду `python main2.py` в корне проекта для запуска 2 части
|
||
|
||
### Использованные технологии
|
||
|
||
* Язык программирования `python`
|
||
* Библиотеки `numpy, sklearn`
|
||
* Среда разработки `PyCharm`
|
||
|
||
### Что делает программа?
|
||
|
||
Цель программы: на основе данных об автомобилях на вторичном рынке обучить модель регрессии на предсказание цены.
|
||
|
||
Используемая модель: Лассо-регрессия
|
||
|
||
#### Определим признаки
|
||
|
||
LINEAR [('Year', 1.0), ('Mileage', 0.4868), ('State', 0.0729), ('Vin', 0.015), ('City', 0.0037), ('Model', 0.0002), ('Make', 0.0)]
|
||
|
||
RIDGE [('Year', 1.0), ('Mileage', 0.4868), ('State', 0.0729), ('Vin', 0.015), ('City', 0.0037), ('Model', 0.0002), ('Make', 0.0)]
|
||
|
||
LASSO [('Year', 1.0), ('Mileage', 0.4868), ('State', 0.0729), ('Vin', 0.015), ('City', 0.0037), ('Model', 0.0002), ('Make', 0.0)]
|
||
|
||
RFE [('Year', 1.0), ('State', 1.0), ('Mileage', 1.0), ('City', 0.5), ('Vin', 0.5), ('Model', 0.0), ('Make', 0.0)]
|
||
|
||
f_regression [('Year', 1.0), ('State', 0.1438), ('Vin', 0.0878), ('City', 0.0845), ('Mileage', 0.0711), ('Model', 0.0335), ('Make', 0.0)]
|
||
|
||
MEAN [('Year', 0.2), ('Mileage', 0.0974), ('State', 0.0146), ('Vin', 0.003), ('City', 0.0007), ('Model', 0.0), ('Make', 0.0)]
|
||
|
||
Отсечение признаков, у которых MEAN ниже 0.001. Выделенные признаки для дальнейшего обучения модели Lasso.
|
||
|
||
##### Запуск модели Lasso с параметрами
|
||
|
||
![main2.py](main2.png)
|
||
|
||
#### Итоговые выводы
|
||
|
||
Были выбраны основные признаки для обучения модели, которые имеют большее влияние на предсказание.
|
||
Проведены несколько тестов по обучению модели Lasso с разными alpha (силой влияния регуляризации),
|
||
но это не оказало большого влияния. Точность в 94.33% приемлемая.
|
||
|