31 lines
2.4 KiB
Markdown
31 lines
2.4 KiB
Markdown
Лабораторная №4
|
||
|
||
Вариант №4
|
||
|
||
Задание на лабораторную:
|
||
|
||
Использовать метод кластеризации DBSCAN, самостоятельно сформулировав задачу. Интерпретировать результаты и оценить, насколько хорошо он подходит для решения сформулированной задачи. Было решено делать кластеризацию по летальныи исходам и магнитуде торнадо.
|
||
|
||
Как запустить лабораторную работу:
|
||
|
||
Чтобы увидеть работу программы, нужно запустить исполняемый питон файл senkin_alexander_lab_4.py, после чего будет отрисован график, по которому можно сделать выводы.
|
||
|
||
Библиотеки:
|
||
|
||
Sklearn. Предоставляет инструменты и алгоритмы, которые упрощают задачи, связанные с машинным обучением.
|
||
|
||
Matplotlib - это библиотека для создания графиков и визуализации данных. Она используется для отображения данных на графиках.
|
||
|
||
Описание программы:
|
||
|
||
- Загружаем данные из csv файла
|
||
- Выбираем количество данных для обработки, например 10000
|
||
- Выделяем признаки, по которым будем проводить кластеризацию (fat - фатальные исходы, mag - магнитуды)
|
||
- Применяем кластеризацию
|
||
- Рисуем график
|
||
|
||
Программа рисует следующий график:
|
||
|
||
![img.png](img.png)
|
||
|
||
Смотря на график можно сделать вывод, что среди 10000 записей о происходящих торнадо, большинство приходятся на 4 магнитуду с чуть больше 0 летальных исходов, а торнадо с амплитудой 5 имеет только шумовые точки. Также мы видим много шума - фиолетовых точек, что говорит нам о том, что алгоритм не очень эффективен для решаемой задачи. |