# Лабораторная работа №4. Кластеризация ## 2 вариант(27 % 2 = 2) ### Задание: Использовать метод кластеризации по варианту для данных из таблицы 1 по варианту (таблица 9), самостоятельно сформулировав задачу. Интерпретировать результаты и оценить, насколько хорошо он подходит для решения сформулированной вами задачи. Используемый метод: linkage В моем случае данными является датасет о продаже автомобилей. В датасете представлены следующие столбцы: * id * Company Name * Model Name * Price * Model Year * Location * Mileage * Engine Type * Engine Capacity * Color * Assembly * Body Type * Transmission Type * Registration Status ### Как запустить лабораторную 1. Запустить файл main.py ### Используемые технологии 1. Библиотека matplotlib 2. Библиотека scikit-learn 3. Библиотека pandas 3. Python 4. IDE PyCharm ### Описание лабораторной работы Программа выполняет кластеризацию данных методом linkage, используя для своей работы признаки "Стоимость" и "Пробег" Для работы программы выбирается часть данных(Ввиду того, что работы программы на полном объеме данных требует больших вычислительных мощностей), после чего они стандартизируются, а затем к ним применяется кластеризация. После чего строится график, который показывается на экране, а так же сохраняется в папке проекта. Скриншот работы программы представлен в папке проекта. ### Результат Кластеризация представленного датасета позволяет увидеть схожие пары "Стоимость"-"Пробег", что позволяет выделить более или менее схожие автомобили.