IIS_2023_1/gordeeva_anna_lab_5
2023-11-18 15:39:33 +04:00
..
data.csv itog 2023-11-18 15:39:33 +04:00
laba5.py itog 2023-11-18 15:39:33 +04:00
photo_2023-11-18_15-37-12.jpg itog 2023-11-18 15:39:33 +04:00
README.md itog 2023-11-18 15:39:33 +04:00
screenlab5.png itog 2023-11-18 15:39:33 +04:00

Задание (вариант 7)

Нужно выполнить регрессию. Пробовала разные виды регрессий, но они давали плохие результаты на моих данных, потому что данные не имеет четкой линейной зависимости. Поэтому было решено использовать регрессию Пуассона.

Регрессия Пуассона используется для моделирования зависимости между наблюдаемой счётной переменной и набором предикторов.

Мои данные представляют собой описание картин по номерам.

Столбцы, которые я буду использовать:

  • Средняя оценка
  • Жанр
  • Размер
  • Стоимость

Я хочу посмотреть как влияют кол-во заказов по стоимости на другие значения.

Как я это представляю: Alt text

Решение задачи регрессии

Для реализации использую библиотеку statsmodels. На вход подаю среднюю оценку, жанр и размер. На выходе получаю табличку с итогом регрессии.

Alt text

Где:

  • coef - коэффициенты регрессии, т.е., насколько каждый параметр влияет на зависимую переменную.
  • std err - стандартная ошибка оценок коэффициентов. Она показывает разброс значений оценок коэффициентов вокруг их среднего значения. Чем меньше значение, тем более точно оценка коэффициента.
  • z - значение статистики z, которая вычисляется как коэффициент деленный на его стандартную ошибку. Это показывает, насколько отклонение коэффициента от нуля значимо.
  • P>|z| - уровень значимости для коэффициента. Это вероятность того, что наблюдаемое значение коэффициента может быть получено случайно. Если значение близко к нулю (обычно меньше 0.05), это указывает на статистическую значимость коэффициента.
  • [0.025 0.975] - 95%-ые доверительные интервалы для коэффициентов. Они показывают диапазон, в пределах которого находится 95% оценок для истинного значения коэффициента.

Исходя из результатов можно сделать вывод:

  • Const - В каждой стоимости без учетов других данных будет в среднем 5 заказов.
  • Средняя оценка - Значение коэффициента показывает, что каждое увеличение средней оценки на единицу приводит к увеличению заказов в этой стоимости картины на приблизительно 0.1108 единиц.
  • Размер - Каждое увеличение размера картины повышает количество заказов в этой стоимости примерно на 0.0413 единицы.
  • Жанр никак не влияет на количество заказов.