33 lines
2.6 KiB
Markdown
33 lines
2.6 KiB
Markdown
|
Лабораторная работа №5
|
|||
|
|
|||
|
Вариант №4
|
|||
|
|
|||
|
Задание на лабораторную:
|
|||
|
|
|||
|
Использовать регрессию по варианту для данных из курсовой работы. Самостоятельно сформулировав задачу. Интерпретировать результаты и оценить, насколько хорошо он подходит для решения сформулированной задачи.
|
|||
|
|
|||
|
Как запустить лабораторную работу:
|
|||
|
|
|||
|
Чтобы увидеть работу программы, нужно запустить исполняемый питон файл senkin_alexander_lab_5.py
|
|||
|
|
|||
|
Библиотеки:
|
|||
|
|
|||
|
- NumPy - библиотека для работы с многомерными массивами.
|
|||
|
- Sklearn - библиотека с большим количеством алгоритмов машинного обучения.
|
|||
|
- Mathplotlib - библиотека для визуализации данных двумерной и трехмерной графикой.
|
|||
|
|
|||
|
Задача:
|
|||
|
|
|||
|
Было решено с помощью гребневой регрессии попытаться предсказать количество несчастных случаев(inj), от таких признаков как: магнитуда(mag) и фатальные исходы(fat)
|
|||
|
|
|||
|
Описание программы:
|
|||
|
|
|||
|
- Загружаем данные из csv файла
|
|||
|
- Разделяем данные на обучающее и тестовые
|
|||
|
- Переводим значения из столбца inj в диапозон от 0 до 1
|
|||
|
- Обучаем модель, находим R^2 (среднеквадратическая ошибка) и коэффициент детерминации
|
|||
|
- Рисуем график
|
|||
|
- ![img.png](img.png)
|
|||
|
- Анализируем график и делаем выводы, что Средняя квадратическая ошибка очень маленькая, что говорит нам что мы хорошо подобрали данные, и модель достаточно точно предсказывает, но имеем не очень большой коэффициент детерминации, который говорит нам о том, что модель не очень хорошо понимает зависимости наших данных.
|
|||
|
- Можно сделать вывод, что гребневую регрессию на таких данных использовать можно, но стоит поискать модели получше.
|