25 lines
1.3 KiB
Markdown
25 lines
1.3 KiB
Markdown
|
## Задание (вариант 7)
|
|||
|
Выполнить кластеризацию с помощью DBSCAN.
|
|||
|
|
|||
|
Мои данные представляют собой описание картин по номерам.
|
|||
|
|
|||
|
Столбцы, которые я буду использовать:
|
|||
|
* Количество отзывов
|
|||
|
* Жанр
|
|||
|
* Поджанр
|
|||
|
|
|||
|
## Решение задачи кластеризации
|
|||
|
DBSCAN - алгоритм, который позволяет выделять кластеры в пространстве данных, основываясь на плотности точек.
|
|||
|
|
|||
|
С помощью кластеризации я хочу посмотреть с какими животными чаще заказываю и в каком количестве.
|
|||
|
|
|||
|
График, который я получаю:
|
|||
|
![Alt text](screen1.png "Optional Title")
|
|||
|
|
|||
|
Получаю 3 кластера:
|
|||
|
* Фиолетовый - заказы до 100.000
|
|||
|
* Голубой - примерно 110.000 заказов
|
|||
|
* Желтый примерно 690.000 заказов
|
|||
|
|
|||
|
Таким образом, можно сказать что в основном заказывают разные картины в пределе до 100.000. Чаще всего заказывают
|
|||
|
картины с котами, лисами и медведями.
|