IIS_2023_1/faskhutdinov_idris_lab_3/Readme.md

85 lines
4.2 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Лабораторная работа №3. Деревья решений
## 6 вариант
### Задание:
Решите с помощью библиотечной реализации дерева решений
задачу из лабораторной работы «Веб-сервис «Дерево решений» по предмету
«Методы искусственного интеллекта» на 99% ваших данных. Проверьте
работу модели на оставшемся проценте, сделайте вывод
В моем случае данными является датасет о продаже автомобилей. В датасете представлены следующие столбцы:
* id
* Company Name
* Model Name
* Price
* Model Year
* Location
* Mileage
* Engine Type
* Engine Capacity
* Color
* Assembly
* Body Type
* Transmission Type
* Registration Status
### Как запустить лабораторную
1. Запустить файл main.py
### Используемые технологии
1. Библиотека pandas
2. Библиотека scikit-learn
3. Python
4. IDE PyCharm
### Описание лабораторной работы
Программа загружает данные из файла Clean_Data_pakwheels.csv, после чего выбирает необходимые для создания модели столбцы.
Выбранные столбцы разделяются на целевую переменную (Y) и признаки (X). Некоторые столбцы в датасете представлены в виде текстовых значений, поэтому мы представляем их как численные значения
Затем программа обучает модель, выполняет прогнозы и оценивает точность. В консоль выводятся признаки по их важности
Целевой признак - Registration Status
### Результат
Accuracy: 0.9327548806941431
* Признак Важность
* 1 Mileage 0.332722
* 2 Price 0.332358
* 0 Model Year 0.175522
* 34 Transmission Type_Automatic 0.086699
* 13 Company Name_Honda 0.021243
* 31 Company Name_Toyota 0.015743
* 30 Company Name_Suzuki 0.008819
* 10 Company Name_Daihatsu 0.007749
* 25 Company Name_Nissan 0.007616
* 4 Company Name_Audi 0.003018
* 23 Company Name_Mercedes 0.001886
* 22 Company Name_Mazda 0.001800
* 18 Company Name_KIA 0.001416
* 24 Company Name_Mitsubishi 0.001044
* 29 Company Name_Subaru 0.000787
* 5 Company Name_BMW 0.000458
* 19 Company Name_Land 0.000407
* 27 Company Name_Range 0.000332
* 26 Company Name_Porsche 0.000331
* 35 Transmission Type_Manual 0.000050
* 20 Company Name_Lexus 0.000000
* 21 Company Name_MINI 0.000000
* 9 Company Name_Daewoo 0.000000
* 8 Company Name_DFSK 0.000000
* 14 Company Name_Hummer 0.000000
* 7 Company Name_Chevrolet 0.000000
* 11 Company Name_FAW 0.000000
* 17 Company Name_Jeep 0.000000
* 28 Company Name_SsangYong 0.000000
* 16 Company Name_Jaguar 0.000000
* 6 Company Name_Chery 0.000000
* 15 Company Name_Hyundai 0.000000
* 32 Company Name_United 0.000000
* 33 Company Name_Volvo 0.000000
* 3 Company Name_Adam 0.000000
* 12 Company Name_Fiat 0.000000
### Вывод
Исходя из результатов работы программы можно сделать вывод, что наиболее важным признаком, отвечающим за
то, зарегистрирована машина или нет, является её пробег, а так же её цена на рынке. Точность модели составляет 93%, что говорит о том,
что она классифицирует данные при заданных условиях с высокой точностью.