IIS_2023_1/volkov_rafael_lab_4/readme.md
2023-12-05 12:28:13 +04:00

3.1 KiB
Raw Blame History

Общее задание: Использовать метод кластеризации к данным из курсовой работы, самостоятельно сформулировав задачу. Интерпретировать результаты и оценить, насколько хорошо он подходит для решения сформулированной вами задачи.

Задание по вариантам: модель linkage Датасет: Board Games Ссылки: https://www.kaggle.com/datasets/andrewmvd/board-games

Задача для кластарезации: Кластеризация игр на основе их характеристик: 'Year Published', 'Users Rated', 'Rating Average', 'BGG Rank', 'Owned Users', 'Complexity Average' Запуск через файл app.py

Технологии:

Flask: Фреймворк для создания веб-приложений на языке Python. Pandas: Библиотека для анализа и обработки данных. SciPy: Набор библиотек для научных вычислений в Python, включая функцию linkage для кластеризации. Seaborn и Matplotlib: Библиотеки для визуализации данных. Описание работы программы:

Загрузка данных: Программа загружает данные из файла 'bgg_dataset.csv', представленного в виде таблицы с различными параметрами игр (год выпуска, количество оценок пользователей, средний рейтинг и т.д.).

Обработка данных: Производится обработка данных, включая преобразование строк в числа, замену ',' на '.' и обработку пропущенных значений.

Кластеризация и построение дендрограммы: Применяется кластеризация методом linkage на основе выбранных параметров игр. Полученная матрица расстояний используется для построения дендрограммы с помощью библиотеки Seaborn.

Отображение в веб-приложении: Результат визуализации (дендрограмма) сохраняется в формате изображения и отображается в веб-приложении, созданном с использованием Flask.

Входные данные:

Файл 'bgg_dataset.csv' с данными об играх, включающими столбцы Year Published, Users Rated, Rating Average, BGG Rank, Owned Users, Complexity Average. Выходные данные:

Веб-страница с отображенной дендрограммой, представляющей кластеризацию игр на основе выбранных параметров.