IIS_2023_1/ilbekov_dmitriy_lab_4/README.md
2023-10-22 20:34:25 +04:00

26 lines
2.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Лабораторная работа 4
### Вариант 10
### Задание:
- Используя данные из "F1DriversDataset.csv" сформулировать задачу, решаемую кластеризацией: Выделить 3 группы гонщиков ("условно" легендарные, выдающиеся, обыкновенные) с похожими достижениями в гонках и определить характеристики каждой группы
### Алгоритм кластеризации:
- K-means (по варианту)
### Запуск
- Запустить файл lab4.py
### Технологии
- Язык - 'Python'
- Библиотеки sklearn, numpy, pandas, matplotlib
### Что делает
- Программа реализовывает кластеризацию алгоритмом k-means, в результате чего мы получаем 3 кластера гонщиков (с определенными характеристиками для каждого кластера)
- Программа также оценивает качество кластеризации, используя Индекс силуэта (Метрика, которая измеряет, насколько каждый объект в кластере похож на свой собственный кластер по сравнению с другими кластерами. Вычисление индекса силуэта включает в себя вычисление среднего значения коэффициента силуэта для всех объектов. Чем ближе значение индекса силуэта к 1, тем лучше кластеризация.)
- Программа выводит график, позволяющий визуально понять, как прошла кластеризация
### Пример работы
Пример работы представлен в виде скриншотов:
![Console](console.jpg)
![Graphics](graphics.png)
Как мы видим кластеризация помолга нам распределить гонщиков на 3 группы и определить характеристики групп, оценка качества кластеризации - 0.77, что довольно хороший показатель, значит алгоритм K-means справился со своей задачей