IIS_2023_1/faskhutdinov_idris_lab_4
2024-01-14 20:54:07 +04:00
..
Clean Data_pakwheels.csv faskhutdinov_idris_lab_4 is ready 2024-01-14 20:54:07 +04:00
linkage.png faskhutdinov_idris_lab_4 is ready 2024-01-14 20:54:07 +04:00
main.py faskhutdinov_idris_lab_4 is ready 2024-01-14 20:54:07 +04:00
Readme.md faskhutdinov_idris_lab_4 is ready 2024-01-14 20:54:07 +04:00

Лабораторная работа №4. Кластеризация

2 вариант(27 % 2 = 2)

Задание:

Использовать метод кластеризации по варианту для данных из таблицы 1 по варианту (таблица 9), самостоятельно сформулировав задачу. Интерпретировать результаты и оценить, насколько хорошо он подходит для решения сформулированной вами задачи.

Используемый метод: linkage

В моем случае данными является датасет о продаже автомобилей. В датасете представлены следующие столбцы:

  • id
  • Company Name
  • Model Name
  • Price
  • Model Year
  • Location
  • Mileage
  • Engine Type
  • Engine Capacity
  • Color
  • Assembly
  • Body Type
  • Transmission Type
  • Registration Status

Как запустить лабораторную

  1. Запустить файл main.py

Используемые технологии

  1. Библиотека matplotlib
  2. Библиотека scikit-learn
  3. Библиотека pandas
  4. Python
  5. IDE PyCharm

Описание лабораторной работы

Программа выполняет кластеризацию данных методом linkage, используя для своей работы признаки "Стоимость" и "Пробег" Для работы программы выбирается часть данных(Ввиду того, что работы программы на полном объеме данных требует больших вычислительных мощностей), после чего они стандартизируются, а затем к ним применяется кластеризация. После чего строится график, который показывается на экране, а так же сохраняется в папке проекта.

Скриншот работы программы представлен в папке проекта.

Результат

Кластеризация представленного датасета позволяет увидеть схожие пары "Стоимость"-"Пробег", что позволяет выделить более или менее схожие автомобили.