24 lines
2.3 KiB
Markdown
24 lines
2.3 KiB
Markdown
|
# Задание:
|
|||
|
Использовать метод кластеризации linkage.
|
|||
|
|
|||
|
Задача: Группировка транзакций на основе их суммы, возраста и пола клиента с целью выявления схожих поведенческих характеристик и обнаружения возможных случаев мошенничества.
|
|||
|
|
|||
|
### Как запустить лабораторную работу:
|
|||
|
ЛР запускается в файле zavrazhnova_svetlana_lab_4.py через Run, сначала появится окно с графиком, а затем в консоли должны появится вычисления.
|
|||
|
|
|||
|
### Технологии
|
|||
|
Метод AgglomerativeClustering из библиотеки sklearn, который можно использовать для кластеризации данных, чтобы найти внутреннюю структуру или группы в данных, основываясь на их сходстве.
|
|||
|
Библиотека scipy для выполнения иерархической кластеризации и построения dendrogram
|
|||
|
|
|||
|
### Что делает лабораторная:
|
|||
|
Выполняет кластеризацию данных и анализ мошеннических операций в каждом кластере.
|
|||
|
|
|||
|
### Пример выходных значений:
|
|||
|
Отрисовывается в отдельном окне dendrogram
|
|||
|
![dendrogram.png](dendrogram.png)
|
|||
|
В консоли затем выводятся значения признаков "transaction_amount", "age" и "cluster_label" для каждой точки данных
|
|||
|
![signs.png](signs.png)
|
|||
|
а также среднее значение метки мошенничества для каждого кластера и количество транзакций мошенничества в каждом кластере
|
|||
|
![cluster.png](cluster.png)
|
|||
|
Еще выводятся значения точек данных, принадлежащих каждому кластеру, чтобы выявить характеристики и структуру каждого кластера.
|
|||
|
![characteristics.png](characteristics.png)
|