laboratory_3

This commit is contained in:
nikbel2004@outlook.com 2024-10-15 03:13:12 +04:00
parent d8650ea667
commit 9c6d363ab4

View File

@ -6,7 +6,7 @@
"source": [
"# Приступаем к работе...\n",
"\n",
"*Вариант задания:* Продажи домов в округе Кинг (вариант - 6) \n",
"*Вариант задания:* Продажи домов в округе Кинг \n",
"Определим бизнес-цели и цели технического проекта \n",
"\n",
"### Бизнес-цели: \n",
@ -23,7 +23,7 @@
"\n",
"2. Оптимизация затрат на ремонт перед продажей \n",
"\n",
"**Формулировка:** Разработать модель, которая поможет продавцам домов и агентствам недвижимости определить, какие улучшения или реновации дадуи наибольший прирост стоимости дома при минимальных затратах. Это поможет избежать ненужных расходов и максимизировать прибыль от продажи. \n",
"**Формулировка:** Разработать модель, которая поможет продавцам домов и агентствам недвижимости определить, какие улучшения или реновации дадут наибольший прирост стоимости дома при минимальных затратах. Это поможет избежать ненужных расходов и максимизировать прибыль от продажи. \n",
"**Цель:** Снизить затраты на ремонт перед продажей, рекомендовать только те улучшения, которые максимально увеличат стоимость недвижимости, и сократить время на принятие решений по реновациям. \n",
"\n",
"**Ключевые показатели успеха (KPI):** \n",
@ -40,7 +40,7 @@
"\n",
"2. **Разработка модели для рекомендаций по реновациям.** \n",
"*Сбор и подготовка данных:* Сбор данных о типах и стоимости реноваций, а также их влияние на конечную стоимость дома. Очистка и устранение неточных или неполных данных о ремонтах. Преобразование категориальных признаков (реновации, например, обновление крыши, замена окон) в числовой формат для представления этих данных с применением One-Hot-Encoding. Разбиение данных на обучающую и тестовую выборки для обучения модели. \n",
"*Разработка и обучение модели:* Использование модели регрессий (линейная регрессия, случайный лес) для предсказания и моделирования влияния конкрентых реноваций на увеличение стоимости недвижимости. Оценка метрики (CPA - Cost Per Acquisition) оценка затрат на реновацию одной продажи и (ROI - Return on Investment) рассчёт возврата на инвестиции от реновации дома, прирост стоимости после реновации. Обучение модели с целью прогнозирования изменений, которве могут принести наибоьшую пользу для стоимости домов и реноваций. \n",
"*Разработка и обучение модели:* Использование модели регрессий (линейная регрессия, случайный лес) для предсказания и моделирования влияния конкретных реноваций на увеличение стоимости недвижимости. Оценка метрики (CPA - Cost Per Acquisition) оценка затрат на реновацию одной продажи и (ROI - Return on Investment) расчёт возврата на инвестиции от реновации дома, прирост стоимости после реновации. Обучение модели с целью прогнозирования изменений, которые могут принести наибольшую пользу для стоимости домов и реноваций. \n",
"*Развёртывание модели:* Создание интерфейса, где пользователи смогут вводить информацию о текущем состоянии дома и получать рекомендации по реновациям с расчётом ROI. Создать рекомендационную систему для продавцов недвижимости, которая будет предлагать набор реноваций.\n"
]
},
@ -927,7 +927,7 @@
"metadata": {},
"outputs": [],
"source": [
"# Ручной синтех признаков\n",
"# Ручной синтез признаков\n",
"train_data_encoded['price_per_sqft'] = df['price'] / df['sqft_living']\n",
"val_data_encoded['price_per_sqft'] = df['price'] / df['sqft_living']\n",
"test_data_encoded['price_per_sqft'] = df['price'] / df['sqft_living']\n",