36 lines
3.1 KiB
Markdown
36 lines
3.1 KiB
Markdown
|
Общее задание:
|
|||
|
Использовать метод кластеризации к данным из курсовой работы, самостоятельно сформулировав задачу.
|
|||
|
Интерпретировать результаты и оценить, насколько хорошо он подходит для решения сформулированной вами задачи.
|
|||
|
|
|||
|
Задание по вариантам:
|
|||
|
модель linkage
|
|||
|
Датасет: Board Games
|
|||
|
Ссылки:
|
|||
|
https://www.kaggle.com/datasets/andrewmvd/board-games
|
|||
|
|
|||
|
Задача для кластарезации:
|
|||
|
Кластеризация игр на основе их характеристик: 'Year Published', 'Users Rated', 'Rating Average', 'BGG Rank', 'Owned Users', 'Complexity Average'
|
|||
|
Запуск через файл app.py
|
|||
|
|
|||
|
Технологии:
|
|||
|
|
|||
|
Flask: Фреймворк для создания веб-приложений на языке Python.
|
|||
|
Pandas: Библиотека для анализа и обработки данных.
|
|||
|
SciPy: Набор библиотек для научных вычислений в Python, включая функцию linkage для кластеризации.
|
|||
|
Seaborn и Matplotlib: Библиотеки для визуализации данных.
|
|||
|
Описание работы программы:
|
|||
|
|
|||
|
Загрузка данных: Программа загружает данные из файла 'bgg_dataset.csv', представленного в виде таблицы с различными параметрами игр (год выпуска, количество оценок пользователей, средний рейтинг и т.д.).
|
|||
|
|
|||
|
Обработка данных: Производится обработка данных, включая преобразование строк в числа, замену ',' на '.' и обработку пропущенных значений.
|
|||
|
|
|||
|
Кластеризация и построение дендрограммы: Применяется кластеризация методом linkage на основе выбранных параметров игр. Полученная матрица расстояний используется для построения дендрограммы с помощью библиотеки Seaborn.
|
|||
|
|
|||
|
Отображение в веб-приложении: Результат визуализации (дендрограмма) сохраняется в формате изображения и отображается в веб-приложении, созданном с использованием Flask.
|
|||
|
|
|||
|
Входные данные:
|
|||
|
|
|||
|
Файл 'bgg_dataset.csv' с данными об играх, включающими столбцы Year Published, Users Rated, Rating Average, BGG Rank, Owned Users, Complexity Average.
|
|||
|
Выходные данные:
|
|||
|
|
|||
|
Веб-страница с отображенной дендрограммой, представляющей кластеризацию игр на основе выбранных параметров.
|