diff --git a/lab2.ipynb b/lab2.ipynb index 5817cfb..1ebdfeb 100644 --- a/lab2.ipynb +++ b/lab2.ipynb @@ -2,7 +2,7 @@ "cells": [ { "cell_type": "code", - "execution_count": 212, + "execution_count": 228, "metadata": {}, "outputs": [ { @@ -275,7 +275,7 @@ "5 Dimensity 700 1 " ] }, - "execution_count": 212, + "execution_count": 228, "metadata": {}, "output_type": "execute_result" } @@ -294,7 +294,7 @@ }, { "cell_type": "code", - "execution_count": 213, + "execution_count": 229, "metadata": {}, "outputs": [ { @@ -532,7 +532,7 @@ "4 1 " ] }, - "execution_count": 213, + "execution_count": 229, "metadata": {}, "output_type": "execute_result" } @@ -549,7 +549,7 @@ }, { "cell_type": "code", - "execution_count": 214, + "execution_count": 230, "metadata": {}, "outputs": [ { @@ -797,7 +797,7 @@ "[5 rows x 21 columns]" ] }, - "execution_count": 214, + "execution_count": 230, "metadata": {}, "output_type": "execute_result" } @@ -812,9 +812,63 @@ "house.head()" ] }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "1. Продажа домов\n", + "\n", + " Цель: Определение рыночной стоимости домов для оптимизации ценовой политики.\n", + "\n", + " Эффект: Улучшение конкурентоспособности на рынке недвижимости и увеличение объема продаж за счет правильного ценообразования. Возможность точного прогнозирования цен и повышения удовлетворенности клиентов.\n", + "\n", + "2. Цены на автомобили\n", + "\n", + " Цель: Оценка цен на автомобили в зависимости от различных факторов (например, пробег, марка, модель, год выпуска).\n", + "\n", + " Эффект: Увеличение привлекательности предложения за счет адекватного ценообразования и минимизации убытков от продажи автомобилей. Позволяет более точно прогнозировать потребности клиентов и улучшить управление запасами.\n", + "\n", + "3. Цены на мобильные устройства\n", + "\n", + " Цель: Определение причин изменения цен на мобильные устройства и оценка влияния сезонных скидок на спрос.\n", + "\n", + " Эффект: Оптимизация маркетинговых стратегий и акций, что может привести к увеличению объемов продаж. Улучшение прогнозирования спроса и управление ассортиментом на основе ценовых изменений." + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "1. Продажа домов\n", + " \n", + " Цель технического проекта: Разработка системы оценки рыночной стоимости недвижимости на основе анализа данных о продажах.\n", + "\n", + " Вход: Набор данных о прошедших продажах домов (цена, площадь, местоположение, количество комнат, год постройки и т.д.).\n", + "\n", + " Целевой признак: Рыночная цена продажи домов.\n", + "\n", + "2. Цены на автомобили\n", + "\n", + " Цель технического проекта: Создание алгоритма, который предсказывает цены на автомобили с учетом различных характеристик и рыночных тенденций.\n", + "\n", + " Вход: Данные о характеристиках автомобилей (марка, модель, год выпуска, пробег, состояние) и цены на аналогичные автомобили.\n", + "\n", + " Целевой признак: Цена автомобиля.\n", + "\n", + "3. Цены на мобильные устройства\n", + "\n", + " Цель технического проекта: Разработка системы, анализирующей влияние маркетинговых акций на цены и спрос на мобильные устройства.\n", + "\n", + " Вход: Данные о ценах на мобильные устройства (с учетом скидок), история продаж, информация о маркетинговых акциях и сезонные колебания.\n", + "\n", + " Целевой признак: Объем продаж мобильных устройств." + ] + }, { "cell_type": "code", - "execution_count": 215, + "execution_count": 231, "metadata": {}, "outputs": [ { @@ -935,7 +989,7 @@ }, { "cell_type": "code", - "execution_count": 216, + "execution_count": 232, "metadata": {}, "outputs": [ { @@ -1015,7 +1069,7 @@ }, { "cell_type": "code", - "execution_count": 217, + "execution_count": 233, "metadata": {}, "outputs": [ { @@ -1106,7 +1160,7 @@ }, { "cell_type": "code", - "execution_count": 218, + "execution_count": 234, "metadata": {}, "outputs": [ { @@ -1367,7 +1421,7 @@ "1369 Octa Core Snapdragon 8 Gen2 2 " ] }, - "execution_count": 218, + "execution_count": 234, "metadata": {}, "output_type": "execute_result" } @@ -1393,7 +1447,7 @@ }, { "cell_type": "code", - "execution_count": 219, + "execution_count": 235, "metadata": {}, "outputs": [ { @@ -1525,7 +1579,7 @@ }, { "cell_type": "code", - "execution_count": 220, + "execution_count": 236, "metadata": {}, "outputs": [ { @@ -1570,7 +1624,7 @@ { "data": { "text/plain": [ - "(861, 3)" + "(856, 3)" ] }, "metadata": {}, @@ -1581,7 +1635,7 @@ "text/plain": [ "Class\n", "1 431\n", - "2 430\n", + "2 425\n", "Name: count, dtype: int64" ] }, @@ -1617,33 +1671,33 @@ " \n", " \n", " 0\n", - " 2\n", - " 58\n", - " 4.550000\n", + " 1\n", + " 89\n", + " 4.600000\n", " \n", " \n", " 1\n", - " 1\n", - " 90\n", - " 4.200000\n", + " 2\n", + " 95\n", + " 4.350000\n", " \n", " \n", " 2\n", " 2\n", - " 88\n", - " 4.350000\n", + " 84\n", + " 4.200000\n", " \n", " \n", " 3\n", - " 2\n", - " 85\n", - " 4.250000\n", + " 1\n", + " 92\n", + " 4.100000\n", " \n", " \n", " 4\n", " 2\n", - " 88\n", - " 4.550000\n", + " 69\n", + " 4.150000\n", " \n", " \n", " ...\n", @@ -1652,58 +1706,58 @@ " ...\n", " \n", " \n", - " 856\n", + " 851\n", " 2\n", - " 90\n", - " 4.150000\n", + " 53\n", + " 4.441967\n", " \n", " \n", - " 857\n", + " 852\n", " 2\n", - " 62\n", - " 4.549858\n", + " 56\n", + " 4.295098\n", " \n", " \n", - " 858\n", + " 853\n", " 2\n", - " 62\n", - " 4.394453\n", + " 60\n", + " 4.489467\n", " \n", " \n", - " 859\n", + " 854\n", " 2\n", - " 62\n", - " 4.530516\n", + " 60\n", + " 4.511445\n", " \n", " \n", - " 860\n", + " 855\n", " 2\n", - " 66\n", - " 4.337197\n", + " 72\n", + " 4.207826\n", " \n", " \n", "\n", - "

861 rows × 3 columns

\n", + "

856 rows × 3 columns

\n", "" ], "text/plain": [ " Class Spec_score Rating\n", - "0 2 58 4.550000\n", - "1 1 90 4.200000\n", - "2 2 88 4.350000\n", - "3 2 85 4.250000\n", - "4 2 88 4.550000\n", + "0 1 89 4.600000\n", + "1 2 95 4.350000\n", + "2 2 84 4.200000\n", + "3 1 92 4.100000\n", + "4 2 69 4.150000\n", ".. ... ... ...\n", - "856 2 90 4.150000\n", - "857 2 62 4.549858\n", - "858 2 62 4.394453\n", - "859 2 62 4.530516\n", - "860 2 66 4.337197\n", + "851 2 53 4.441967\n", + "852 2 56 4.295098\n", + "853 2 60 4.489467\n", + "854 2 60 4.511445\n", + "855 2 72 4.207826\n", "\n", - "[861 rows x 3 columns]" + "[856 rows x 3 columns]" ] }, - "execution_count": 220, + "execution_count": 236, "metadata": {}, "output_type": "execute_result" } @@ -1727,7 +1781,7 @@ }, { "cell_type": "code", - "execution_count": 221, + "execution_count": 237, "metadata": {}, "outputs": [ { @@ -1824,33 +1878,33 @@ " \n", " \n", " \n", - " 160\n", - " 85\n", - " 4.00\n", + " 786\n", + " 80\n", + " 4.30\n", " 1\n", " \n", " \n", - " 948\n", - " 82\n", - " 4.70\n", - " 1\n", - " \n", - " \n", - " 478\n", - " 75\n", - " 4.00\n", - " 1\n", - " \n", - " \n", - " 1311\n", - " 82\n", + " 670\n", + " 91\n", " 4.35\n", " 1\n", " \n", " \n", - " 20\n", + " 96\n", + " 72\n", + " 4.10\n", + " 1\n", + " \n", + " \n", + " 1207\n", + " 79\n", + " 4.75\n", + " 1\n", + " \n", + " \n", + " 1165\n", " 80\n", - " 4.20\n", + " 4.60\n", " 1\n", " \n", " \n", @@ -1860,33 +1914,33 @@ " ...\n", " \n", " \n", - " 230\n", - " 65\n", - " 4.50\n", - " 2\n", - " \n", - " \n", - " 465\n", + " 875\n", " 75\n", - " 4.75\n", - " 2\n", - " \n", - " \n", - " 1341\n", - " 66\n", " 4.25\n", " 2\n", " \n", " \n", - " 720\n", - " 63\n", + " 544\n", + " 87\n", + " 4.65\n", + " 2\n", + " \n", + " \n", + " 787\n", + " 84\n", + " 4.15\n", + " 2\n", + " \n", + " \n", + " 893\n", + " 83\n", " 4.00\n", " 2\n", " \n", " \n", - " 444\n", - " 89\n", - " 4.15\n", + " 519\n", + " 81\n", + " 4.30\n", " 2\n", " \n", " \n", @@ -1897,22 +1951,22 @@ "text/plain": [ " Spec_score Rating Class\n", "Id \n", - "160 85 4.00 1\n", - "948 82 4.70 1\n", - "478 75 4.00 1\n", - "1311 82 4.35 1\n", - "20 80 4.20 1\n", + "786 80 4.30 1\n", + "670 91 4.35 1\n", + "96 72 4.10 1\n", + "1207 79 4.75 1\n", + "1165 80 4.60 1\n", "... ... ... ...\n", - "230 65 4.50 2\n", - "465 75 4.75 2\n", - "1341 66 4.25 2\n", - "720 63 4.00 2\n", - "444 89 4.15 2\n", + "875 75 4.25 2\n", + "544 87 4.65 2\n", + "787 84 4.15 2\n", + "893 83 4.00 2\n", + "519 81 4.30 2\n", "\n", "[762 rows x 3 columns]" ] }, - "execution_count": 221, + "execution_count": 237, "metadata": {}, "output_type": "execute_result" } @@ -1944,7 +1998,7 @@ }, { "cell_type": "code", - "execution_count": 222, + "execution_count": 238, "metadata": {}, "outputs": [ { @@ -2076,7 +2130,7 @@ }, { "cell_type": "code", - "execution_count": 223, + "execution_count": 239, "metadata": {}, "outputs": [ { @@ -2121,7 +2175,7 @@ { "data": { "text/plain": [ - "(16727, 3)" + "(16720, 3)" ] }, "metadata": {}, @@ -2132,7 +2186,7 @@ "text/plain": [ "LeatherInterior1\n", "1 8369\n", - "0 8358\n", + "0 8351\n", "Name: count, dtype: int64" ] }, @@ -2168,33 +2222,33 @@ " \n", " \n", " 0\n", - " 1\n", - " 12\n", - " 2010\n", + " 0\n", + " 2\n", + " 2003\n", " \n", " \n", " 1\n", " 0\n", - " 7\n", - " 2016\n", + " 0\n", + " 2010\n", " \n", " \n", " 2\n", " 0\n", - " 8\n", - " 2014\n", + " 2\n", + " 1995\n", " \n", " \n", " 3\n", - " 0\n", - " 8\n", + " 1\n", + " 4\n", " 2010\n", " \n", " \n", " 4\n", " 1\n", " 4\n", - " 2014\n", + " 2015\n", " \n", " \n", " ...\n", @@ -2203,58 +2257,58 @@ " ...\n", " \n", " \n", - " 16722\n", + " 16715\n", " 0\n", - " 7\n", - " 2007\n", + " 12\n", + " 1999\n", " \n", " \n", - " 16723\n", + " 16716\n", " 0\n", - " 7\n", - " 2007\n", + " 12\n", + " 2000\n", " \n", " \n", - " 16724\n", + " 16717\n", " 0\n", - " 7\n", - " 2007\n", + " 11\n", + " 1998\n", " \n", " \n", - " 16725\n", + " 16718\n", " 0\n", - " 7\n", - " 2007\n", + " 12\n", + " 2000\n", " \n", " \n", - " 16726\n", + " 16719\n", " 0\n", - " 7\n", - " 2007\n", + " 11\n", + " 1998\n", " \n", " \n", "\n", - "

16727 rows × 3 columns

\n", + "

16720 rows × 3 columns

\n", "" ], "text/plain": [ " LeatherInterior1 Airbags ProdYear\n", - "0 1 12 2010\n", - "1 0 7 2016\n", - "2 0 8 2014\n", - "3 0 8 2010\n", - "4 1 4 2014\n", + "0 0 2 2003\n", + "1 0 0 2010\n", + "2 0 2 1995\n", + "3 1 4 2010\n", + "4 1 4 2015\n", "... ... ... ...\n", - "16722 0 7 2007\n", - "16723 0 7 2007\n", - "16724 0 7 2007\n", - "16725 0 7 2007\n", - "16726 0 7 2007\n", + "16715 0 12 1999\n", + "16716 0 12 2000\n", + "16717 0 11 1998\n", + "16718 0 12 2000\n", + "16719 0 11 1998\n", "\n", - "[16727 rows x 3 columns]" + "[16720 rows x 3 columns]" ] }, - "execution_count": 223, + "execution_count": 239, "metadata": {}, "output_type": "execute_result" } @@ -2278,7 +2332,7 @@ }, { "cell_type": "code", - "execution_count": 224, + "execution_count": 240, "metadata": {}, "outputs": [ { @@ -2369,33 +2423,33 @@ " \n", " \n", " \n", - " 328\n", - " 7\n", - " 2016\n", + " 1271\n", + " 2\n", + " 2003\n", " 0\n", " \n", " \n", - " 4693\n", - " 8\n", - " 2014\n", + " 9524\n", " 0\n", - " \n", - " \n", - " 16749\n", - " 8\n", " 2010\n", " 0\n", " \n", " \n", - " 8589\n", - " 7\n", - " 2015\n", + " 9985\n", + " 2\n", + " 1995\n", " 0\n", " \n", " \n", - " 9888\n", - " 4\n", - " 2006\n", + " 12285\n", + " 8\n", + " 2012\n", + " 0\n", + " \n", + " \n", + " 14259\n", + " 12\n", + " 2014\n", " 0\n", " \n", " \n", @@ -2405,35 +2459,35 @@ " ...\n", " \n", " \n", - " 9875\n", + " 1243\n", + " 6\n", + " 2006\n", + " 1\n", + " \n", + " \n", + " 10022\n", " 10\n", - " 2014\n", + " 2010\n", " 1\n", " \n", " \n", - " 16470\n", + " 18753\n", " 12\n", - " 2015\n", - " 1\n", - " \n", - " \n", - " 13630\n", - " 4\n", - " 2012\n", - " 1\n", - " \n", - " \n", - " 5414\n", - " 4\n", - " 2009\n", - " 1\n", - " \n", - " \n", - " 16124\n", - " 4\n", " 2018\n", " 1\n", " \n", + " \n", + " 14272\n", + " 4\n", + " 2013\n", + " 1\n", + " \n", + " \n", + " 16792\n", + " 4\n", + " 2010\n", + " 1\n", + " \n", " \n", "\n", "

6334 rows × 3 columns

\n", @@ -2441,22 +2495,22 @@ ], "text/plain": [ " Airbags ProdYear LeatherInterior1\n", - "328 7 2016 0\n", - "4693 8 2014 0\n", - "16749 8 2010 0\n", - "8589 7 2015 0\n", - "9888 4 2006 0\n", + "1271 2 2003 0\n", + "9524 0 2010 0\n", + "9985 2 1995 0\n", + "12285 8 2012 0\n", + "14259 12 2014 0\n", "... ... ... ...\n", - "9875 10 2014 1\n", - "16470 12 2015 1\n", - "13630 4 2012 1\n", - "5414 4 2009 1\n", - "16124 4 2018 1\n", + "1243 6 2006 1\n", + "10022 10 2010 1\n", + "18753 12 2018 1\n", + "14272 4 2013 1\n", + "16792 4 2010 1\n", "\n", "[6334 rows x 3 columns]" ] }, - "execution_count": 224, + "execution_count": 240, "metadata": {}, "output_type": "execute_result" } @@ -2488,7 +2542,7 @@ }, { "cell_type": "code", - "execution_count": 225, + "execution_count": 241, "metadata": {}, "outputs": [ { @@ -2636,7 +2690,7 @@ }, { "cell_type": "code", - "execution_count": 226, + "execution_count": 242, "metadata": {}, "outputs": [ { @@ -2685,7 +2739,7 @@ { "data": { "text/plain": [ - "(5324, 3)" + "(5332, 3)" ] }, "metadata": {}, @@ -2695,12 +2749,12 @@ "data": { "text/plain": [ "bedrooms\n", - "1 914\n", "3 911\n", - "6 903\n", - "2 903\n", - "5 880\n", - "4 813\n", + "6 907\n", + "1 907\n", + "5 892\n", + "2 887\n", + "4 828\n", "Name: count, dtype: int64" ] }, @@ -2736,33 +2790,33 @@ " \n", " \n", " 0\n", - " 4\n", - " 2210\n", - " 7665\n", + " 2\n", + " 620\n", + " 4760\n", " \n", " \n", " 1\n", - " 3\n", - " 3060\n", - " 13554\n", + " 2\n", + " 1760\n", + " 2275\n", " \n", " \n", " 2\n", - " 5\n", - " 2700\n", - " 3650\n", + " 6\n", + " 3840\n", + " 14040\n", " \n", " \n", " 3\n", " 4\n", - " 1850\n", - " 7850\n", + " 2230\n", + " 6791\n", " \n", " \n", " 4\n", - " 3\n", - " 1400\n", - " 1581\n", + " 4\n", + " 1850\n", + " 5040\n", " \n", " \n", " ...\n", @@ -2771,58 +2825,58 @@ " ...\n", " \n", " \n", - " 5319\n", + " 5327\n", " 6\n", - " 3751\n", - " 14147\n", + " 3272\n", + " 5227\n", " \n", " \n", - " 5320\n", + " 5328\n", " 6\n", - " 3790\n", - " 14101\n", + " 3007\n", + " 4422\n", " \n", " \n", - " 5321\n", + " 5329\n", " 6\n", - " 3588\n", - " 13941\n", + " 3147\n", + " 4818\n", " \n", " \n", - " 5322\n", + " 5330\n", " 6\n", - " 3515\n", - " 13913\n", + " 3021\n", + " 4954\n", " \n", " \n", - " 5323\n", + " 5331\n", " 6\n", - " 3833\n", - " 14047\n", + " 3010\n", + " 5088\n", " \n", " \n", "\n", - "

5324 rows × 3 columns

\n", + "

5332 rows × 3 columns

\n", "" ], "text/plain": [ " bedrooms sqft_living sqft_lot\n", - "0 4 2210 7665\n", - "1 3 3060 13554\n", - "2 5 2700 3650\n", - "3 4 1850 7850\n", - "4 3 1400 1581\n", + "0 2 620 4760\n", + "1 2 1760 2275\n", + "2 6 3840 14040\n", + "3 4 2230 6791\n", + "4 4 1850 5040\n", "... ... ... ...\n", - "5319 6 3751 14147\n", - "5320 6 3790 14101\n", - "5321 6 3588 13941\n", - "5322 6 3515 13913\n", - "5323 6 3833 14047\n", + "5327 6 3272 5227\n", + "5328 6 3007 4422\n", + "5329 6 3147 4818\n", + "5330 6 3021 4954\n", + "5331 6 3010 5088\n", "\n", - "[5324 rows x 3 columns]" + "[5332 rows x 3 columns]" ] }, - "execution_count": 226, + "execution_count": 242, "metadata": {}, "output_type": "execute_result" } @@ -2846,7 +2900,7 @@ }, { "cell_type": "code", - "execution_count": 227, + "execution_count": 243, "metadata": {}, "outputs": [ { @@ -2945,15 +2999,9 @@ " \n", " \n", " \n", - " 1146\n", - " 670\n", - " 43377\n", - " 1\n", - " \n", - " \n", - " 2026\n", - " 900\n", - " 4368\n", + " 1729\n", + " 680\n", + " 1638\n", " 1\n", " \n", " \n", @@ -2963,15 +3011,21 @@ " 1\n", " \n", " \n", - " 3103\n", - " 570\n", - " 4080\n", + " 1649\n", + " 3000\n", + " 204732\n", " 1\n", " \n", " \n", - " 350\n", - " 560\n", - " 12120\n", + " 2151\n", + " 1010\n", + " 5750\n", + " 1\n", + " \n", + " \n", + " 154\n", + " 700\n", + " 5100\n", " 1\n", " \n", " \n", @@ -2981,33 +3035,33 @@ " ...\n", " \n", " \n", - " 1877\n", - " 3010\n", - " 4360\n", + " 2069\n", + " 2410\n", + " 6000\n", " 6\n", " \n", " \n", - " 832\n", - " 2450\n", - " 25600\n", + " 1192\n", + " 2560\n", + " 8320\n", " 6\n", " \n", " \n", - " 1302\n", - " 3010\n", - " 17864\n", + " 2065\n", + " 3240\n", + " 5750\n", " 6\n", " \n", " \n", - " 1311\n", - " 7390\n", - " 24829\n", + " 2492\n", + " 2400\n", + " 9373\n", " 6\n", " \n", " \n", - " 2901\n", - " 2390\n", - " 8660\n", + " 232\n", + " 2940\n", + " 7350\n", " 6\n", " \n", " \n", @@ -3017,22 +3071,22 @@ ], "text/plain": [ " sqft_living sqft_lot bedrooms\n", - "1146 670 43377 1\n", - "2026 900 4368 1\n", + "1729 680 1638 1\n", "1453 660 2600 1\n", - "3103 570 4080 1\n", - "350 560 12120 1\n", + "1649 3000 204732 1\n", + "2151 1010 5750 1\n", + "154 700 5100 1\n", "... ... ... ...\n", - "1877 3010 4360 6\n", - "832 2450 25600 6\n", - "1302 3010 17864 6\n", - "1311 7390 24829 6\n", - "2901 2390 8660 6\n", + "2069 2410 6000 6\n", + "1192 2560 8320 6\n", + "2065 3240 5750 6\n", + "2492 2400 9373 6\n", + "232 2940 7350 6\n", "\n", "[108 rows x 3 columns]" ] }, - "execution_count": 227, + "execution_count": 243, "metadata": {}, "output_type": "execute_result" }