39 lines
3.8 KiB
Markdown
39 lines
3.8 KiB
Markdown
|
## Задание (вариант 7)
|
|||
|
Нужно выполнить регрессию. Пробовала разные виды регрессий, но они давали плохие результаты на моих данных, потому что
|
|||
|
данные не имеет четкой линейной зависимости. Поэтому было решено использовать регрессию Пуассона.
|
|||
|
|
|||
|
Регрессия Пуассона используется для моделирования зависимости между наблюдаемой счётной переменной и набором предикторов.
|
|||
|
|
|||
|
Мои данные представляют собой описание картин по номерам.
|
|||
|
|
|||
|
Столбцы, которые я буду использовать:
|
|||
|
* Средняя оценка
|
|||
|
* Жанр
|
|||
|
* Размер
|
|||
|
* Стоимость
|
|||
|
|
|||
|
Я хочу посмотреть как влияют кол-во заказов по стоимости на другие значения.
|
|||
|
|
|||
|
Как я это представляю:
|
|||
|
![Alt text](photo_2023-11-18_15-37-12.jpg "Optional Title")
|
|||
|
|
|||
|
## Решение задачи регрессии
|
|||
|
Для реализации использую библиотеку statsmodels. На вход подаю среднюю оценку, жанр и размер. На выходе получаю табличку с итогом регрессии.
|
|||
|
|
|||
|
![Alt text](screenlab5.png "Optional Title")
|
|||
|
|
|||
|
Где:
|
|||
|
* coef - коэффициенты регрессии, т.е., насколько каждый параметр влияет на зависимую переменную.
|
|||
|
* std err - стандартная ошибка оценок коэффициентов. Она показывает разброс значений оценок коэффициентов вокруг их среднего значения. Чем меньше значение, тем более точно оценка коэффициента.
|
|||
|
* z - значение статистики z, которая вычисляется как коэффициент деленный на его стандартную ошибку. Это показывает, насколько отклонение коэффициента от нуля значимо.
|
|||
|
* P>|z| - уровень значимости для коэффициента. Это вероятность того, что наблюдаемое значение коэффициента может быть получено случайно. Если значение близко к нулю (обычно меньше 0.05), это указывает на статистическую значимость коэффициента.
|
|||
|
* [0.025 0.975] - 95%-ые доверительные интервалы для коэффициентов. Они показывают диапазон, в пределах которого находится 95% оценок для истинного значения коэффициента.
|
|||
|
|
|||
|
Исходя из результатов можно сделать вывод:
|
|||
|
* Const - В каждой стоимости без учетов других данных будет в среднем 5 заказов.
|
|||
|
* Средняя оценка - Значение коэффициента показывает, что каждое увеличение средней оценки на единицу приводит к увеличению заказов в этой стоимости картины на приблизительно 0.1108 единиц.
|
|||
|
* Размер - Каждое увеличение размера картины повышает количество заказов в этой стоимости примерно на 0.0413 единицы.
|
|||
|
* Жанр никак не влияет на количество заказов.
|
|||
|
|
|||
|
|