IIS_2023_1/zavrazhnova_svetlana_lab_4
2023-10-19 21:51:39 +04:00
..
characteristics.png zavrazhnova_svetlana_lab_4 is ready 2023-10-19 21:51:39 +04:00
cluster.png zavrazhnova_svetlana_lab_4 is ready 2023-10-19 21:51:39 +04:00
dendrogram.png zavrazhnova_svetlana_lab_4 is ready 2023-10-19 21:51:39 +04:00
fraud_dataset.csv zavrazhnova_svetlana_lab_4 is ready 2023-10-19 21:51:39 +04:00
README.md zavrazhnova_svetlana_lab_4 is ready 2023-10-19 21:51:39 +04:00
signs.png zavrazhnova_svetlana_lab_4 is ready 2023-10-19 21:51:39 +04:00
zavrazhnova_svetlana_lab_4.py zavrazhnova_svetlana_lab_4 is ready 2023-10-19 21:51:39 +04:00

Задание:

Использовать метод кластеризации linkage.

Задача: Группировка транзакций на основе их суммы, возраста и пола клиента с целью выявления схожих поведенческих характеристик и обнаружения возможных случаев мошенничества.

Как запустить лабораторную работу:

ЛР запускается в файле zavrazhnova_svetlana_lab_4.py через Run, сначала появится окно с графиком, а затем в консоли должны появится вычисления.

Технологии

Метод AgglomerativeClustering из библиотеки sklearn, который можно использовать для кластеризации данных, чтобы найти внутреннюю структуру или группы в данных, основываясь на их сходстве. Библиотека scipy для выполнения иерархической кластеризации и построения dendrogram

Что делает лабораторная:

Выполняет кластеризацию данных и анализ мошеннических операций в каждом кластере.

Пример выходных значений:

Отрисовывается в отдельном окне dendrogram dendrogram.png В консоли затем выводятся значения признаков "transaction_amount", "age" и "cluster_label" для каждой точки данных signs.png а также среднее значение метки мошенничества для каждого кластера и количество транзакций мошенничества в каждом кластере cluster.png Еще выводятся значения точек данных, принадлежащих каждому кластеру, чтобы выявить характеристики и структуру каждого кластера. characteristics.png