IIS_2023_1/malkova_anastasia_lab_5/README.md
2023-11-17 00:28:29 +04:00

49 lines
2.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Лабораторная работа №5
> Регрессия
### Как запустить лабораторную работу
1. Установить python, numpy, sklearn
2. Запустить команду `python main1.py` в корне проекта для запуска 1 части
3. Запустить команду `python main2.py` в корне проекта для запуска 2 части
### Использованные технологии
* Язык программирования `python`
* Библиотеки `numpy, sklearn`
* Среда разработки `PyCharm`
### Что делает программа?
Цель программы: на основе данных об автомобилях на вторичном рынке обучить модель регрессии на предсказание цены.
Используемая модель: Лассо-регрессия
#### Определим признаки
LINEAR [('Year', 1.0), ('Mileage', 0.4868), ('State', 0.0729), ('Vin', 0.015), ('City', 0.0037), ('Model', 0.0002), ('Make', 0.0)]
RIDGE [('Year', 1.0), ('Mileage', 0.4868), ('State', 0.0729), ('Vin', 0.015), ('City', 0.0037), ('Model', 0.0002), ('Make', 0.0)]
LASSO [('Year', 1.0), ('Mileage', 0.4868), ('State', 0.0729), ('Vin', 0.015), ('City', 0.0037), ('Model', 0.0002), ('Make', 0.0)]
RFE [('Year', 1.0), ('State', 1.0), ('Mileage', 1.0), ('City', 0.5), ('Vin', 0.5), ('Model', 0.0), ('Make', 0.0)]
f_regression [('Year', 1.0), ('State', 0.1438), ('Vin', 0.0878), ('City', 0.0845), ('Mileage', 0.0711), ('Model', 0.0335), ('Make', 0.0)]
MEAN [('Year', 0.2), ('Mileage', 0.0974), ('State', 0.0146), ('Vin', 0.003), ('City', 0.0007), ('Model', 0.0), ('Make', 0.0)]
Отсечение признаков, у которых MEAN ниже 0.001. Выделенные признаки для дальнейшего обучения модели Lasso.
##### Запуск модели Lasso с параметрами
![main2.py](main2.png)
#### Итоговые выводы
Были выбраны основные признаки для обучения модели, которые имеют большее влияние на предсказание.
Проведены несколько тестов по обучению модели Lasso с разными alpha (силой влияния регуляризации),
но это не оказало большого влияния. Точность в 94.33% приемлемая.