IIS_2023_1/gordeeva_anna_lab_4/README.md

25 lines
1.3 KiB
Markdown
Raw Permalink Normal View History

2023-11-17 23:58:52 +04:00
## Задание (вариант 7)
Выполнить кластеризацию с помощью DBSCAN.
Мои данные представляют собой описание картин по номерам.
Столбцы, которые я буду использовать:
* Количество отзывов
* Жанр
* Поджанр
## Решение задачи кластеризации
DBSCAN - алгоритм, который позволяет выделять кластеры в пространстве данных, основываясь на плотности точек.
С помощью кластеризации я хочу посмотреть с какими животными чаще заказываю и в каком количестве.
График, который я получаю:
![Alt text](screen1.png "Optional Title")
Получаю 3 кластера:
* Фиолетовый - заказы до 100.000
* Голубой - примерно 110.000 заказов
* Желтый примерно 690.000 заказов
Таким образом, можно сказать что в основном заказывают разные картины в пределе до 100.000. Чаще всего заказывают
картины с котами, лисами и медведями.