IIS_2023_1/senkin_alexander_lab_4/README.md

2.4 KiB
Raw Blame History

Лабораторная №4

Вариант №4

Задание на лабораторную:

Использовать метод кластеризации DBSCAN, самостоятельно сформулировав задачу. Интерпретировать результаты и оценить, насколько хорошо он подходит для решения сформулированной задачи. Было решено делать кластеризацию по летальныи исходам и магнитуде торнадо.

Как запустить лабораторную работу:

Чтобы увидеть работу программы, нужно запустить исполняемый питон файл senkin_alexander_lab_4.py, после чего будет отрисован график, по которому можно сделать выводы.

Библиотеки:

Sklearn. Предоставляет инструменты и алгоритмы, которые упрощают задачи, связанные с машинным обучением.

Matplotlib - это библиотека для создания графиков и визуализации данных. Она используется для отображения данных на графиках.

Описание программы:

  • Загружаем данные из csv файла
  • Выбираем количество данных для обработки, например 10000
  • Выделяем признаки, по которым будем проводить кластеризацию (fat - фатальные исходы, mag - магнитуды)
  • Применяем кластеризацию
  • Рисуем график

Программа рисует следующий график:

img.png

Смотря на график можно сделать вывод, что среди 10000 записей о происходящих торнадо, большинство приходятся на 4 магнитуду с чуть больше 0 летальных исходов, а торнадо с амплитудой 5 имеет только шумовые точки. Также мы видим много шума - фиолетовых точек, что говорит нам о том, что алгоритм не очень эффективен для решаемой задачи.