From e1bba9b13c114cd782956902dcee2ac61c4ca0d5 Mon Sep 17 00:00:00 2001 From: a-shdv Date: Fri, 3 Nov 2023 19:48:45 +0400 Subject: [PATCH] Update README.md --- shadaev_anton_lab_3/README.md | 15 +++++++++++++++ 1 file changed, 15 insertions(+) diff --git a/shadaev_anton_lab_3/README.md b/shadaev_anton_lab_3/README.md index b387d4c..544dae5 100644 --- a/shadaev_anton_lab_3/README.md +++ b/shadaev_anton_lab_3/README.md @@ -11,6 +11,7 @@ Чтобы запустить 2-ю часть лабораторной работы, нужно запустить скрипт `shadaev_anton_lab_3/stroke_prediction.py` ### Стек технологий +* `Python`: v. 3.11 * `Sklearn` - библиотека, которая поддерживает различные методы регрессии и классификации, включая линейную регрессию, метод k-ближайших соседей, регрессию опорных векторов, деревья принятия решений, ансамбль методов, такие как random forest и градиентный бустинг * `Pandas` - библиотека, которая позволяет работать с двумерными и многомерными таблицами, строить сводные таблицы, выделять колонки, использовать фильтры по параметрам, выполнять группировку по параметрам, запускать функции (сложение, нахождение медианы, среднего, минимального, максимального значений), объединять таблицы и многое другое ### Описание кода @@ -63,12 +64,26 @@ ### Решение Часть 1. + ![img.png](public/img/img_0.png) Часть 2. + ![img_1.png](public/img/img_1.png) ### Вывод +Часть 1. + +Исходя из выводимых результатов, можно сделать вывод, что: + +* Признак 0: Значение `0.36399999535331234` указывает на то, что признак 0 (в данном случае 'PassengerId') имеет важность 36.4%. Это означает, что признак 'PassengerId' вносит меньший вклад в прогноз, по сравнению с другими признаками. + +* Признак 1: Значение `0.5373525457492807` указывает на то, что признак 1 (в данном случае 'Pclass') имеет важность 53.7%. Это означает, что признак 'Pclass' играет более значимую роль в прогнозе, по сравнению с признаком 'PassengerId'. + +* Признак 2: Значение `0.09864745889740695` указывает на то, что признак 2 (в данном случае 'Cabin') имеет важность 9.9%. Это означает, что признак 'Cabin' вносит наименьший вклад в прогноз, по сравнению с другими признаками. + +Часть 2. + Исходя из выводимых результатов, можно сделать вывод, что: * Значения в массиве `[0.25588112 0.40781287 0.24234788 0.09395812]` соответствуют признакам `hypertension`, `heart_disease`, `ever_married` и `gender` соответственно. Значение `0.40781287` указано для `heart_disease`, что означает, что этот признак является наиболее важным для прогнозирования результата. Признак `hypertension` следует за ним с важностью `0.25588112`, `ever_married` - `0.24234788`, и `gender` - `0.09395812`. Это означает, что `heart_disease` влияет на прогноз больше всего, `hypertension` и `ever_married` влияют на прогноз в средней степени, а `gender` влияет на прогноз меньше всего.