IIS_2023_1/madyshev_egor_lab_4
2023-10-09 10:22:50 +04:00
..
lab4_1.png madyshev_egor_lab_4 is ready 2023-10-09 10:22:50 +04:00
lab4_2.png madyshev_egor_lab_4 is ready 2023-10-09 10:22:50 +04:00
main.py madyshev_egor_lab_4 is ready 2023-10-09 10:22:50 +04:00
readme.md madyshev_egor_lab_4 is ready 2023-10-09 10:22:50 +04:00
StudentsPerformance.csv madyshev_egor_lab_4 is ready 2023-10-09 10:22:50 +04:00

Задание

Использовать метод кластеризации по варианту для данных из таблицы 1 по варианту (таблица 9), самостоятельно сформулировав задачу. Интерпретировать результаты и оценить, насколько хорошо он подходит для решения сформулированной вами задачи.

Задание по варианту

Задача для дерева решений. Предсказание уровня образования родителей по всем остальных данным.

Решение

Запуск программы

Алгоритм кластеризации: dendrogram

Используемые технологии

Программа использует следующие библиотеки:

  • numpy - библиотека для работы с массивами и матрицами.
  • matplotlib - библиотека для создания графиков и визуализации данных.
  • sklearn - библиотека для машинного обучения и анализа данных.

Что делает программа

Программа читает данные из csv файла. Подготавливает их для работы модели, приводя текстовые параметры к числам. И кластеризует учеников по результатам их экзаменов.

Тесты

Кластеризация первых 15

На примере первых пятнадцати учеников хорошо видна их кластеризация дендрограммой. Ученики легко бьются на группы по их успеваемости.
Благодаря этому можно выделить группы учеников в зависимости от их оценок. Достаточно выбрать необходимую ветвь.

Кластеризация первых 45 Хотя диаграмма на большее количество учеников и становиться более насыщенной. В ней всё равно достаточно просто выделить группы учеников по успеваемости.

Вывод: Кластеризация дендрограммой позволяет достаточно эффективно делить учащихся на группы по успеваемости, основываясь на оценках их экзаменов.