Update README.md
This commit is contained in:
parent
aa543e057e
commit
e1bba9b13c
@ -11,6 +11,7 @@
|
||||
Чтобы запустить 2-ю часть лабораторной работы, нужно запустить скрипт `shadaev_anton_lab_3/stroke_prediction.py`
|
||||
|
||||
### Стек технологий
|
||||
* `Python`: v. 3.11
|
||||
* `Sklearn` - библиотека, которая поддерживает различные методы регрессии и классификации, включая линейную регрессию, метод k-ближайших соседей, регрессию опорных векторов, деревья принятия решений, ансамбль методов, такие как random forest и градиентный бустинг
|
||||
* `Pandas` - библиотека, которая позволяет работать с двумерными и многомерными таблицами, строить сводные таблицы, выделять колонки, использовать фильтры по параметрам, выполнять группировку по параметрам, запускать функции (сложение, нахождение медианы, среднего, минимального, максимального значений), объединять таблицы и многое другое
|
||||
### Описание кода
|
||||
@ -63,12 +64,26 @@
|
||||
|
||||
### Решение
|
||||
<u>Часть 1.</u>
|
||||
|
||||
![img.png](public/img/img_0.png)
|
||||
|
||||
<u>Часть 2.</u>
|
||||
|
||||
![img_1.png](public/img/img_1.png)
|
||||
|
||||
### Вывод
|
||||
<u>Часть 1.</u>
|
||||
|
||||
Исходя из выводимых результатов, можно сделать вывод, что:
|
||||
|
||||
* Признак 0: Значение `0.36399999535331234` указывает на то, что признак 0 (в данном случае 'PassengerId') имеет важность 36.4%. Это означает, что признак 'PassengerId' вносит меньший вклад в прогноз, по сравнению с другими признаками.
|
||||
|
||||
* Признак 1: Значение `0.5373525457492807` указывает на то, что признак 1 (в данном случае 'Pclass') имеет важность 53.7%. Это означает, что признак 'Pclass' играет более значимую роль в прогнозе, по сравнению с признаком 'PassengerId'.
|
||||
|
||||
* Признак 2: Значение `0.09864745889740695` указывает на то, что признак 2 (в данном случае 'Cabin') имеет важность 9.9%. Это означает, что признак 'Cabin' вносит наименьший вклад в прогноз, по сравнению с другими признаками.
|
||||
|
||||
<u>Часть 2.</u>
|
||||
|
||||
Исходя из выводимых результатов, можно сделать вывод, что:
|
||||
|
||||
* Значения в массиве `[0.25588112 0.40781287 0.24234788 0.09395812]` соответствуют признакам `hypertension`, `heart_disease`, `ever_married` и `gender` соответственно. Значение `0.40781287` указано для `heart_disease`, что означает, что этот признак является наиболее важным для прогнозирования результата. Признак `hypertension` следует за ним с важностью `0.25588112`, `ever_married` - `0.24234788`, и `gender` - `0.09395812`. Это означает, что `heart_disease` влияет на прогноз больше всего, `hypertension` и `ever_married` влияют на прогноз в средней степени, а `gender` влияет на прогноз меньше всего.
|
||||
|
Loading…
Reference in New Issue
Block a user