.. | ||
characteristics.png | ||
cluster.png | ||
dendrogram.png | ||
fraud_dataset.csv | ||
README.md | ||
signs.png | ||
zavrazhnova_svetlana_lab_4.py |
Задание:
Использовать метод кластеризации linkage.
Задача: Группировка транзакций на основе их суммы, возраста и пола клиента с целью выявления схожих поведенческих характеристик и обнаружения возможных случаев мошенничества.
Как запустить лабораторную работу:
ЛР запускается в файле zavrazhnova_svetlana_lab_4.py через Run, сначала появится окно с графиком, а затем в консоли должны появится вычисления.
Технологии
Метод AgglomerativeClustering из библиотеки sklearn, который можно использовать для кластеризации данных, чтобы найти внутреннюю структуру или группы в данных, основываясь на их сходстве. Библиотека scipy для выполнения иерархической кластеризации и построения dendrogram
Что делает лабораторная:
Выполняет кластеризацию данных и анализ мошеннических операций в каждом кластере.
Пример выходных значений:
Отрисовывается в отдельном окне dendrogram В консоли затем выводятся значения признаков "transaction_amount", "age" и "cluster_label" для каждой точки данных а также среднее значение метки мошенничества для каждого кластера и количество транзакций мошенничества в каждом кластере Еще выводятся значения точек данных, принадлежащих каждому кластеру, чтобы выявить характеристики и структуру каждого кластера.