.. | ||
data.csv | ||
laba4.py | ||
README.md | ||
screen1.png |
Задание (вариант 7)
Выполнить кластеризацию с помощью DBSCAN.
Мои данные представляют собой описание картин по номерам.
Столбцы, которые я буду использовать:
- Количество отзывов
- Жанр
- Поджанр
Решение задачи кластеризации
DBSCAN - алгоритм, который позволяет выделять кластеры в пространстве данных, основываясь на плотности точек.
С помощью кластеризации я хочу посмотреть с какими животными чаще заказываю и в каком количестве.
Получаю 3 кластера:
- Фиолетовый - заказы до 100.000
- Голубой - примерно 110.000 заказов
- Желтый примерно 690.000 заказов
Таким образом, можно сказать что в основном заказывают разные картины в пределе до 100.000. Чаще всего заказывают картины с котами, лисами и медведями.