IIS_2023_1/malkova_anastasia_lab_5
2023-11-17 00:28:29 +04:00
..
config.py lab5 ready 2023-11-17 00:28:29 +04:00
dataset.py lab5 ready 2023-11-17 00:28:29 +04:00
fit.py lab5 ready 2023-11-17 00:28:29 +04:00
lasso_test.py lab5 ready 2023-11-17 00:28:29 +04:00
main1.py lab5 ready 2023-11-17 00:28:29 +04:00
main2.png lab5 ready 2023-11-17 00:28:29 +04:00
main2.py lab5 ready 2023-11-17 00:28:29 +04:00
ranks.py lab5 ready 2023-11-17 00:28:29 +04:00
README.md lab5 ready 2023-11-17 00:28:29 +04:00
scores.py lab5 ready 2023-11-17 00:28:29 +04:00
true_car_listings.csv lab5 ready 2023-11-17 00:28:29 +04:00

Лабораторная работа №5

Регрессия

Как запустить лабораторную работу

  1. Установить python, numpy, sklearn
  2. Запустить команду python main1.py в корне проекта для запуска 1 части
  3. Запустить команду python main2.py в корне проекта для запуска 2 части

Использованные технологии

  • Язык программирования python
  • Библиотеки numpy, sklearn
  • Среда разработки PyCharm

Что делает программа?

Цель программы: на основе данных об автомобилях на вторичном рынке обучить модель регрессии на предсказание цены.

Используемая модель: Лассо-регрессия

Определим признаки

LINEAR [('Year', 1.0), ('Mileage', 0.4868), ('State', 0.0729), ('Vin', 0.015), ('City', 0.0037), ('Model', 0.0002), ('Make', 0.0)]

RIDGE [('Year', 1.0), ('Mileage', 0.4868), ('State', 0.0729), ('Vin', 0.015), ('City', 0.0037), ('Model', 0.0002), ('Make', 0.0)]

LASSO [('Year', 1.0), ('Mileage', 0.4868), ('State', 0.0729), ('Vin', 0.015), ('City', 0.0037), ('Model', 0.0002), ('Make', 0.0)]

RFE [('Year', 1.0), ('State', 1.0), ('Mileage', 1.0), ('City', 0.5), ('Vin', 0.5), ('Model', 0.0), ('Make', 0.0)]

f_regression [('Year', 1.0), ('State', 0.1438), ('Vin', 0.0878), ('City', 0.0845), ('Mileage', 0.0711), ('Model', 0.0335), ('Make', 0.0)]

MEAN [('Year', 0.2), ('Mileage', 0.0974), ('State', 0.0146), ('Vin', 0.003), ('City', 0.0007), ('Model', 0.0), ('Make', 0.0)]

Отсечение признаков, у которых MEAN ниже 0.001. Выделенные признаки для дальнейшего обучения модели Lasso.

Запуск модели Lasso с параметрами

main2.py

Итоговые выводы

Были выбраны основные признаки для обучения модели, которые имеют большее влияние на предсказание. Проведены несколько тестов по обучению модели Lasso с разными alpha (силой влияния регуляризации), но это не оказало большого влияния. Точность в 94.33% приемлемая.