24 lines
2.7 KiB
Markdown
24 lines
2.7 KiB
Markdown
|
# Задание
|
|||
|
Использовать метод кластеризации по варианту для данных из таблицы 1 по варианту (таблица 9), самостоятельно сформулировав задачу. Интерпретировать результаты и оценить, насколько хорошо он подходит для решения сформулированной вами задачи.
|
|||
|
## Задание по варианту
|
|||
|
Задача для дерева решений. Предсказание уровня образования родителей по всем остальных данным.
|
|||
|
## Решение
|
|||
|
### Запуск программы
|
|||
|
Алгоритм кластеризации: dendrogram
|
|||
|
### Используемые технологии
|
|||
|
Программа использует следующие библиотеки:
|
|||
|
- numpy - библиотека для работы с массивами и матрицами.
|
|||
|
- matplotlib - библиотека для создания графиков и визуализации данных.
|
|||
|
- sklearn - библиотека для машинного обучения и анализа данных.
|
|||
|
### Что делает программа
|
|||
|
Программа читает данные из csv файла. Подготавливает их для работы модели, приводя текстовые параметры к числам. И кластеризует учеников по результатам их экзаменов.
|
|||
|
### Тесты
|
|||
|
![Кластеризация первых 15](lab4_1.png)
|
|||
|
|
|||
|
На примере первых пятнадцати учеников хорошо видна их кластеризация дендрограммой. Ученики легко бьются на группы по их успеваемости.
|
|||
|
Благодаря этому можно выделить группы учеников в зависимости от их оценок. Достаточно выбрать необходимую ветвь.
|
|||
|
|
|||
|
![Кластеризация первых 45](lab4_2.png)
|
|||
|
Хотя диаграмма на большее количество учеников и становиться более насыщенной. В ней всё равно достаточно просто выделить группы учеников по успеваемости.
|
|||
|
|
|||
|
Вывод: Кластеризация дендрограммой позволяет достаточно эффективно делить учащихся на группы по успеваемости, основываясь на оценках их экзаменов.
|