IIS_2023_1/zavrazhnova_svetlana_lab_4/README.md

24 lines
2.3 KiB
Markdown
Raw Normal View History

2023-10-19 21:51:39 +04:00
# Задание:
Использовать метод кластеризации linkage.
Задача: Группировка транзакций на основе их суммы, возраста и пола клиента с целью выявления схожих поведенческих характеристик и обнаружения возможных случаев мошенничества.
### Как запустить лабораторную работу:
ЛР запускается в файле zavrazhnova_svetlana_lab_4.py через Run, сначала появится окно с графиком, а затем в консоли должны появится вычисления.
### Технологии
Метод AgglomerativeClustering из библиотеки sklearn, который можно использовать для кластеризации данных, чтобы найти внутреннюю структуру или группы в данных, основываясь на их сходстве.
Библиотека scipy для выполнения иерархической кластеризации и построения dendrogram
### Что делает лабораторная:
Выполняет кластеризацию данных и анализ мошеннических операций в каждом кластере.
### Пример выходных значений:
Отрисовывается в отдельном окне dendrogram
![dendrogram.png](dendrogram.png)
В консоли затем выводятся значения признаков "transaction_amount", "age" и "cluster_label" для каждой точки данных
![signs.png](signs.png)
а также среднее значение метки мошенничества для каждого кластера и количество транзакций мошенничества в каждом кластере
![cluster.png](cluster.png)
Еще выводятся значения точек данных, принадлежащих каждому кластеру, чтобы выявить характеристики и структуру каждого кластера.
![characteristics.png](characteristics.png)