IIS_2023_1/gordeeva_anna_lab_4/README.md
2023-11-17 23:58:52 +04:00

1.3 KiB
Raw Blame History

Задание (вариант 7)

Выполнить кластеризацию с помощью DBSCAN.

Мои данные представляют собой описание картин по номерам.

Столбцы, которые я буду использовать:

  • Количество отзывов
  • Жанр
  • Поджанр

Решение задачи кластеризации

DBSCAN - алгоритм, который позволяет выделять кластеры в пространстве данных, основываясь на плотности точек.

С помощью кластеризации я хочу посмотреть с какими животными чаще заказываю и в каком количестве.

График, который я получаю: Alt text

Получаю 3 кластера:

  • Фиолетовый - заказы до 100.000
  • Голубой - примерно 110.000 заказов
  • Желтый примерно 690.000 заказов

Таким образом, можно сказать что в основном заказывают разные картины в пределе до 100.000. Чаще всего заказывают картины с котами, лисами и медведями.