.. | ||
config.py | ||
dataset.py | ||
fit.py | ||
lasso_test.py | ||
main1.py | ||
main2.png | ||
main2.py | ||
ranks.py | ||
README.md | ||
scores.py | ||
true_car_listings.csv |
Лабораторная работа №5
Регрессия
Как запустить лабораторную работу
- Установить python, numpy, sklearn
- Запустить команду
python main1.py
в корне проекта для запуска 1 части - Запустить команду
python main2.py
в корне проекта для запуска 2 части
Использованные технологии
- Язык программирования
python
- Библиотеки
numpy, sklearn
- Среда разработки
PyCharm
Что делает программа?
Цель программы: на основе данных об автомобилях на вторичном рынке обучить модель регрессии на предсказание цены.
Используемая модель: Лассо-регрессия
Определим признаки
LINEAR [('Year', 1.0), ('Mileage', 0.4868), ('State', 0.0729), ('Vin', 0.015), ('City', 0.0037), ('Model', 0.0002), ('Make', 0.0)]
RIDGE [('Year', 1.0), ('Mileage', 0.4868), ('State', 0.0729), ('Vin', 0.015), ('City', 0.0037), ('Model', 0.0002), ('Make', 0.0)]
LASSO [('Year', 1.0), ('Mileage', 0.4868), ('State', 0.0729), ('Vin', 0.015), ('City', 0.0037), ('Model', 0.0002), ('Make', 0.0)]
RFE [('Year', 1.0), ('State', 1.0), ('Mileage', 1.0), ('City', 0.5), ('Vin', 0.5), ('Model', 0.0), ('Make', 0.0)]
f_regression [('Year', 1.0), ('State', 0.1438), ('Vin', 0.0878), ('City', 0.0845), ('Mileage', 0.0711), ('Model', 0.0335), ('Make', 0.0)]
MEAN [('Year', 0.2), ('Mileage', 0.0974), ('State', 0.0146), ('Vin', 0.003), ('City', 0.0007), ('Model', 0.0), ('Make', 0.0)]
Отсечение признаков, у которых MEAN ниже 0.001. Выделенные признаки для дальнейшего обучения модели Lasso.
Запуск модели Lasso с параметрами
Итоговые выводы
Были выбраны основные признаки для обучения модели, которые имеют большее влияние на предсказание. Проведены несколько тестов по обучению модели Lasso с разными alpha (силой влияния регуляризации), но это не оказало большого влияния. Точность в 94.33% приемлемая.