IIS_2023_1/senkin_alexander_lab_4/README.md

31 lines
2.4 KiB
Markdown
Raw Normal View History

2023-10-30 21:20:17 +04:00
Лабораторная №4
Вариант №4
Задание на лабораторную:
Использовать метод кластеризации DBSCAN, самостоятельно сформулировав задачу. Интерпретировать результаты и оценить, насколько хорошо он подходит для решения сформулированной задачи. Было решено делать кластеризацию по летальныи исходам и магнитуде торнадо.
Как запустить лабораторную работу:
Чтобы увидеть работу программы, нужно запустить исполняемый питон файл senkin_alexander_lab_4.py, после чего будет отрисован график, по которому можно сделать выводы.
Библиотеки:
Sklearn. Предоставляет инструменты и алгоритмы, которые упрощают задачи, связанные с машинным обучением.
Matplotlib - это библиотека для создания графиков и визуализации данных. Она используется для отображения данных на графиках.
Описание программы:
- Загружаем данные из csv файла
- Выбираем количество данных для обработки, например 10000
- Выделяем признаки, по которым будем проводить кластеризацию (fat - фатальные исходы, mag - магнитуды)
- Применяем кластеризацию
- Рисуем график
Программа рисует следующий график:
![img.png](img.png)
Смотря на график можно сделать вывод, что среди 10000 записей о происходящих торнадо, большинство приходятся на 4 магнитуду с чуть больше 0 летальных исходов, а торнадо с амплитудой 5 имеет только шумовые точки. Также мы видим много шума - фиолетовых точек, что говорит нам о том, что алгоритм не очень эффективен для решаемой задачи.