31 lines
2.4 KiB
Markdown
31 lines
2.4 KiB
Markdown
|
Лабораторная №4
|
|||
|
|
|||
|
Вариант №4
|
|||
|
|
|||
|
Задание на лабораторную:
|
|||
|
|
|||
|
Использовать метод кластеризации DBSCAN, самостоятельно сформулировав задачу. Интерпретировать результаты и оценить, насколько хорошо он подходит для решения сформулированной задачи. Было решено делать кластеризацию по летальныи исходам и магнитуде торнадо.
|
|||
|
|
|||
|
Как запустить лабораторную работу:
|
|||
|
|
|||
|
Чтобы увидеть работу программы, нужно запустить исполняемый питон файл senkin_alexander_lab_4.py, после чего будет отрисован график, по которому можно сделать выводы.
|
|||
|
|
|||
|
Библиотеки:
|
|||
|
|
|||
|
Sklearn. Предоставляет инструменты и алгоритмы, которые упрощают задачи, связанные с машинным обучением.
|
|||
|
|
|||
|
Matplotlib - это библиотека для создания графиков и визуализации данных. Она используется для отображения данных на графиках.
|
|||
|
|
|||
|
Описание программы:
|
|||
|
|
|||
|
- Загружаем данные из csv файла
|
|||
|
- Выбираем количество данных для обработки, например 10000
|
|||
|
- Выделяем признаки, по которым будем проводить кластеризацию (fat - фатальные исходы, mag - магнитуды)
|
|||
|
- Применяем кластеризацию
|
|||
|
- Рисуем график
|
|||
|
|
|||
|
Программа рисует следующий график:
|
|||
|
|
|||
|
![img.png](img.png)
|
|||
|
|
|||
|
Смотря на график можно сделать вывод, что среди 10000 записей о происходящих торнадо, большинство приходятся на 4 магнитуду с чуть больше 0 летальных исходов, а торнадо с амплитудой 5 имеет только шумовые точки. Также мы видим много шума - фиолетовых точек, что говорит нам о том, что алгоритм не очень эффективен для решаемой задачи.
|