.. | ||
.gitignore | ||
img.png | ||
README.md | ||
senkin_alexander_lab_4.py | ||
us_tornado_dataset_1950_2021.csv |
Лабораторная №4
Вариант №4
Задание на лабораторную:
Использовать метод кластеризации DBSCAN, самостоятельно сформулировав задачу. Интерпретировать результаты и оценить, насколько хорошо он подходит для решения сформулированной задачи. Было решено делать кластеризацию по летальныи исходам и магнитуде торнадо.
Как запустить лабораторную работу:
Чтобы увидеть работу программы, нужно запустить исполняемый питон файл senkin_alexander_lab_4.py, после чего будет отрисован график, по которому можно сделать выводы.
Библиотеки:
Sklearn. Предоставляет инструменты и алгоритмы, которые упрощают задачи, связанные с машинным обучением.
Matplotlib - это библиотека для создания графиков и визуализации данных. Она используется для отображения данных на графиках.
Описание программы:
- Загружаем данные из csv файла
- Выбираем количество данных для обработки, например 10000
- Выделяем признаки, по которым будем проводить кластеризацию (fat - фатальные исходы, mag - магнитуды)
- Применяем кластеризацию
- Рисуем график
Программа рисует следующий график:
Смотря на график можно сделать вывод, что среди 10000 записей о происходящих торнадо, большинство приходятся на 4 магнитуду с чуть больше 0 летальных исходов, а торнадо с амплитудой 5 имеет только шумовые точки. Также мы видим много шума - фиолетовых точек, что говорит нам о том, что алгоритм не очень эффективен для решаемой задачи.