85 lines
4.2 KiB
Markdown
85 lines
4.2 KiB
Markdown
# Лабораторная работа №3. Деревья решений
|
||
## 6 вариант
|
||
### Задание:
|
||
Решите с помощью библиотечной реализации дерева решений
|
||
задачу из лабораторной работы «Веб-сервис «Дерево решений» по предмету
|
||
«Методы искусственного интеллекта» на 99% ваших данных. Проверьте
|
||
работу модели на оставшемся проценте, сделайте вывод
|
||
|
||
В моем случае данными является датасет о продаже автомобилей. В датасете представлены следующие столбцы:
|
||
* id
|
||
* Company Name
|
||
* Model Name
|
||
* Price
|
||
* Model Year
|
||
* Location
|
||
* Mileage
|
||
* Engine Type
|
||
* Engine Capacity
|
||
* Color
|
||
* Assembly
|
||
* Body Type
|
||
* Transmission Type
|
||
* Registration Status
|
||
|
||
### Как запустить лабораторную
|
||
1. Запустить файл main.py
|
||
|
||
### Используемые технологии
|
||
1. Библиотека pandas
|
||
2. Библиотека scikit-learn
|
||
3. Python
|
||
4. IDE PyCharm
|
||
|
||
### Описание лабораторной работы
|
||
|
||
Программа загружает данные из файла Clean_Data_pakwheels.csv, после чего выбирает необходимые для создания модели столбцы.
|
||
Выбранные столбцы разделяются на целевую переменную (Y) и признаки (X). Некоторые столбцы в датасете представлены в виде текстовых значений, поэтому мы представляем их как численные значения
|
||
Затем программа обучает модель, выполняет прогнозы и оценивает точность. В консоль выводятся признаки по их важности
|
||
Целевой признак - Registration Status
|
||
### Результат
|
||
Accuracy: 0.9327548806941431
|
||
* Признак Важность
|
||
* 1 Mileage 0.332722
|
||
* 2 Price 0.332358
|
||
* 0 Model Year 0.175522
|
||
* 34 Transmission Type_Automatic 0.086699
|
||
* 13 Company Name_Honda 0.021243
|
||
* 31 Company Name_Toyota 0.015743
|
||
* 30 Company Name_Suzuki 0.008819
|
||
* 10 Company Name_Daihatsu 0.007749
|
||
* 25 Company Name_Nissan 0.007616
|
||
* 4 Company Name_Audi 0.003018
|
||
* 23 Company Name_Mercedes 0.001886
|
||
* 22 Company Name_Mazda 0.001800
|
||
* 18 Company Name_KIA 0.001416
|
||
* 24 Company Name_Mitsubishi 0.001044
|
||
* 29 Company Name_Subaru 0.000787
|
||
* 5 Company Name_BMW 0.000458
|
||
* 19 Company Name_Land 0.000407
|
||
* 27 Company Name_Range 0.000332
|
||
* 26 Company Name_Porsche 0.000331
|
||
* 35 Transmission Type_Manual 0.000050
|
||
* 20 Company Name_Lexus 0.000000
|
||
* 21 Company Name_MINI 0.000000
|
||
* 9 Company Name_Daewoo 0.000000
|
||
* 8 Company Name_DFSK 0.000000
|
||
* 14 Company Name_Hummer 0.000000
|
||
* 7 Company Name_Chevrolet 0.000000
|
||
* 11 Company Name_FAW 0.000000
|
||
* 17 Company Name_Jeep 0.000000
|
||
* 28 Company Name_SsangYong 0.000000
|
||
* 16 Company Name_Jaguar 0.000000
|
||
* 6 Company Name_Chery 0.000000
|
||
* 15 Company Name_Hyundai 0.000000
|
||
* 32 Company Name_United 0.000000
|
||
* 33 Company Name_Volvo 0.000000
|
||
* 3 Company Name_Adam 0.000000
|
||
* 12 Company Name_Fiat 0.000000
|
||
|
||
### Вывод
|
||
Исходя из результатов работы программы можно сделать вывод, что наиболее важным признаком, отвечающим за
|
||
то, зарегистрирована машина или нет, является её пробег, а так же её цена на рынке. Точность модели составляет 93%, что говорит о том,
|
||
что она классифицирует данные при заданных условиях с высокой точностью.
|
||
|