IIS_2023_1/zavrazhnova_svetlana_lab_4/README.md
2023-10-19 21:51:39 +04:00

24 lines
2.3 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Задание:
Использовать метод кластеризации linkage.
Задача: Группировка транзакций на основе их суммы, возраста и пола клиента с целью выявления схожих поведенческих характеристик и обнаружения возможных случаев мошенничества.
### Как запустить лабораторную работу:
ЛР запускается в файле zavrazhnova_svetlana_lab_4.py через Run, сначала появится окно с графиком, а затем в консоли должны появится вычисления.
### Технологии
Метод AgglomerativeClustering из библиотеки sklearn, который можно использовать для кластеризации данных, чтобы найти внутреннюю структуру или группы в данных, основываясь на их сходстве.
Библиотека scipy для выполнения иерархической кластеризации и построения dendrogram
### Что делает лабораторная:
Выполняет кластеризацию данных и анализ мошеннических операций в каждом кластере.
### Пример выходных значений:
Отрисовывается в отдельном окне dendrogram
![dendrogram.png](dendrogram.png)
В консоли затем выводятся значения признаков "transaction_amount", "age" и "cluster_label" для каждой точки данных
![signs.png](signs.png)
а также среднее значение метки мошенничества для каждого кластера и количество транзакций мошенничества в каждом кластере
![cluster.png](cluster.png)
Еще выводятся значения точек данных, принадлежащих каждому кластеру, чтобы выявить характеристики и структуру каждого кластера.
![characteristics.png](characteristics.png)