IIS_2023_1/volkov_rafael_lab_4/readme.md
2023-12-05 12:28:13 +04:00

36 lines
3.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

Общее задание:
Использовать метод кластеризации к данным из курсовой работы, самостоятельно сформулировав задачу.
Интерпретировать результаты и оценить, насколько хорошо он подходит для решения сформулированной вами задачи.
Задание по вариантам:
модель linkage
Датасет: Board Games
Ссылки:
https://www.kaggle.com/datasets/andrewmvd/board-games
Задача для кластарезации:
Кластеризация игр на основе их характеристик: 'Year Published', 'Users Rated', 'Rating Average', 'BGG Rank', 'Owned Users', 'Complexity Average'
Запуск через файл app.py
Технологии:
Flask: Фреймворк для создания веб-приложений на языке Python.
Pandas: Библиотека для анализа и обработки данных.
SciPy: Набор библиотек для научных вычислений в Python, включая функцию linkage для кластеризации.
Seaborn и Matplotlib: Библиотеки для визуализации данных.
Описание работы программы:
Загрузка данных: Программа загружает данные из файла 'bgg_dataset.csv', представленного в виде таблицы с различными параметрами игр (год выпуска, количество оценок пользователей, средний рейтинг и т.д.).
Обработка данных: Производится обработка данных, включая преобразование строк в числа, замену ',' на '.' и обработку пропущенных значений.
Кластеризация и построение дендрограммы: Применяется кластеризация методом linkage на основе выбранных параметров игр. Полученная матрица расстояний используется для построения дендрограммы с помощью библиотеки Seaborn.
Отображение в веб-приложении: Результат визуализации (дендрограмма) сохраняется в формате изображения и отображается в веб-приложении, созданном с использованием Flask.
Входные данные:
Файл 'bgg_dataset.csv' с данными об играх, включающими столбцы Year Published, Users Rated, Rating Average, BGG Rank, Owned Users, Complexity Average.
Выходные данные:
Веб-страница с отображенной дендрограммой, представляющей кластеризацию игр на основе выбранных параметров.