24 lines
2.3 KiB
Markdown
24 lines
2.3 KiB
Markdown
# Задание:
|
||
Использовать метод кластеризации linkage.
|
||
|
||
Задача: Группировка транзакций на основе их суммы, возраста и пола клиента с целью выявления схожих поведенческих характеристик и обнаружения возможных случаев мошенничества.
|
||
|
||
### Как запустить лабораторную работу:
|
||
ЛР запускается в файле zavrazhnova_svetlana_lab_4.py через Run, сначала появится окно с графиком, а затем в консоли должны появится вычисления.
|
||
|
||
### Технологии
|
||
Метод AgglomerativeClustering из библиотеки sklearn, который можно использовать для кластеризации данных, чтобы найти внутреннюю структуру или группы в данных, основываясь на их сходстве.
|
||
Библиотека scipy для выполнения иерархической кластеризации и построения dendrogram
|
||
|
||
### Что делает лабораторная:
|
||
Выполняет кластеризацию данных и анализ мошеннических операций в каждом кластере.
|
||
|
||
### Пример выходных значений:
|
||
Отрисовывается в отдельном окне dendrogram
|
||
![dendrogram.png](dendrogram.png)
|
||
В консоли затем выводятся значения признаков "transaction_amount", "age" и "cluster_label" для каждой точки данных
|
||
![signs.png](signs.png)
|
||
а также среднее значение метки мошенничества для каждого кластера и количество транзакций мошенничества в каждом кластере
|
||
![cluster.png](cluster.png)
|
||
Еще выводятся значения точек данных, принадлежащих каждому кластеру, чтобы выявить характеристики и структуру каждого кластера.
|
||
![characteristics.png](characteristics.png) |