45 lines
2.5 KiB
Markdown
45 lines
2.5 KiB
Markdown
|
# Лабораторная работа №4. Кластеризация
|
|||
|
## 2 вариант(27 % 2 = 2)
|
|||
|
### Задание:
|
|||
|
Использовать метод кластеризации по варианту для данных из таблицы
|
|||
|
1 по варианту (таблица 9), самостоятельно сформулировав задачу.
|
|||
|
Интерпретировать результаты и оценить, насколько хорошо он подходит для
|
|||
|
решения сформулированной вами задачи.
|
|||
|
|
|||
|
Используемый метод: linkage
|
|||
|
|
|||
|
В моем случае данными является датасет о продаже автомобилей. В датасете представлены следующие столбцы:
|
|||
|
* id
|
|||
|
* Company Name
|
|||
|
* Model Name
|
|||
|
* Price
|
|||
|
* Model Year
|
|||
|
* Location
|
|||
|
* Mileage
|
|||
|
* Engine Type
|
|||
|
* Engine Capacity
|
|||
|
* Color
|
|||
|
* Assembly
|
|||
|
* Body Type
|
|||
|
* Transmission Type
|
|||
|
* Registration Status
|
|||
|
|
|||
|
### Как запустить лабораторную
|
|||
|
1. Запустить файл main.py
|
|||
|
|
|||
|
### Используемые технологии
|
|||
|
1. Библиотека matplotlib
|
|||
|
2. Библиотека scikit-learn
|
|||
|
3. Библиотека pandas
|
|||
|
3. Python
|
|||
|
4. IDE PyCharm
|
|||
|
|
|||
|
### Описание лабораторной работы
|
|||
|
Программа выполняет кластеризацию данных методом linkage, используя для своей работы признаки "Стоимость" и "Пробег"
|
|||
|
Для работы программы выбирается часть данных(Ввиду того, что работы программы на полном объеме данных требует больших вычислительных мощностей), после чего они стандартизируются,
|
|||
|
а затем к ним применяется кластеризация. После чего строится график, который показывается на экране, а так же сохраняется в папке проекта.
|
|||
|
|
|||
|
Скриншот работы программы представлен в папке проекта.
|
|||
|
### Результат
|
|||
|
|
|||
|
Кластеризация представленного датасета позволяет увидеть схожие пары "Стоимость"-"Пробег", что позволяет выделить более или менее схожие автомобили.
|