{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "## **Лабораторная работа №4**\n", "\n", "### **Определение бизнес-целей для решения задач регрессии и классификации**\n", "\n", "**Вариант задания:** Набор данных о ценах на акции Walmart.\n", "\n", "**Бизнес-цели:**\n", "\n", "1. **Регрессия:** Предсказание цены закрытия акции (Close) на основе исторических данных.\n", "\n", "2. **Классификация:** Определение направления изменения цены (повышение или понижение) на следующий день, что можно выразить в бинарной метке (например, 1 — цена повысилась, 0 — снизилась). Метка будет рассчитываться как разница между Close сегодняшнего и завтрашнего дня.\n", "\n", "**Столбцы датасета и их пояснение:**\n", "\n", "*Date* - Дата, на которую относятся данные. Эта характеристика указывает конкретный день, в который происходила торговля акциями Walmart.\n", "\n", "*Open* - Цена открытия. Стоимость акций Walmart в начале торгового дня. Это важный показатель, который показывает, по какой цене начались торги в конкретный день, и часто используется для сравнения с ценой закрытия для определения дневного тренда.\n", "\n", "*High* - Максимальная цена за день. Наибольшая цена, достигнутая акциями Walmart в течение торгового дня. Эта характеристика указывает, какой была самая высокая стоимость акций за день.\n", "\n", "*Low* - Минимальная цена за день. Наименьшая цена, по которой торговались акции Walmart в течение дня.\n", "\n", "*Close* - Цена закрытия. Стоимость акций Walmart в конце торгового дня. Цена закрытия — один из основных показателей, используемых для анализа акций, так как она отображает итоговую стоимость акций за день и часто используется для расчета дневных изменений и трендов на длительных временных периодах.\n", "\n", "*Adj Close* - Скорректированная цена закрытия. Цена закрытия, скорректированная с учетом всех корпоративных действий.\n", "\n", "*Volume* - Объем торгов. Количество акций Walmart, проданных и купленных в течение дня. " ] }, { "cell_type": "code", "execution_count": 9, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ " Date Open High Low Close Adj Close Volume\n", "0 1/3/2000 22.791668 23.000000 21.833332 22.270832 14.469358 25109700\n", "1 1/4/2000 21.833332 21.937500 21.395832 21.437500 13.927947 20235300\n", "2 1/5/2000 21.291668 21.458332 20.729168 21.000000 13.643703 21056100\n", "3 1/6/2000 21.000000 21.520832 20.895832 21.229168 13.792585 19633500\n", "4 1/7/2000 21.500000 22.979168 21.500000 22.833332 14.834813 23930700\n", "Index(['Date', 'Open', 'High', 'Low', 'Close', 'Adj Close', 'Volume'], dtype='object')\n" ] }, { "data": { "text/html": [ "
\n", " | Date | \n", "Open | \n", "High | \n", "Low | \n", "Close | \n", "Adj Close | \n", "Volume | \n", "
---|---|---|---|---|---|---|---|
0 | \n", "1/3/2000 | \n", "22.791668 | \n", "23.000000 | \n", "21.833332 | \n", "22.270832 | \n", "14.469358 | \n", "25109700 | \n", "
1 | \n", "1/4/2000 | \n", "21.833332 | \n", "21.937500 | \n", "21.395832 | \n", "21.437500 | \n", "13.927947 | \n", "20235300 | \n", "
2 | \n", "1/5/2000 | \n", "21.291668 | \n", "21.458332 | \n", "20.729168 | \n", "21.000000 | \n", "13.643703 | \n", "21056100 | \n", "
3 | \n", "1/6/2000 | \n", "21.000000 | \n", "21.520832 | \n", "20.895832 | \n", "21.229168 | \n", "13.792585 | \n", "19633500 | \n", "
4 | \n", "1/7/2000 | \n", "21.500000 | \n", "22.979168 | \n", "21.500000 | \n", "22.833332 | \n", "14.834813 | \n", "23930700 | \n", "
5 | \n", "1/10/2000 | \n", "22.416668 | \n", "22.500000 | \n", "21.875000 | \n", "22.416668 | \n", "14.564112 | \n", "20142900 | \n", "
6 | \n", "1/11/2000 | \n", "22.354168 | \n", "22.583332 | \n", "21.875000 | \n", "22.083332 | \n", "14.347544 | \n", "14829900 | \n", "
7 | \n", "1/12/2000 | \n", "22.062500 | \n", "22.250000 | \n", "21.687500 | \n", "21.687500 | \n", "14.090372 | \n", "12255000 | \n", "
8 | \n", "1/13/2000 | \n", "22.000000 | \n", "22.041668 | \n", "21.666668 | \n", "21.708332 | \n", "14.103909 | \n", "15063000 | \n", "
9 | \n", "1/14/2000 | \n", "21.333332 | \n", "21.979168 | \n", "21.333332 | \n", "21.500000 | \n", "13.968553 | \n", "18936600 | \n", "
10 | \n", "1/18/2000 | \n", "21.062500 | \n", "22.145832 | \n", "21.020832 | \n", "21.854168 | \n", "14.198661 | \n", "19326600 | \n", "
11 | \n", "1/19/2000 | \n", "21.750000 | \n", "21.937500 | \n", "21.333332 | \n", "21.354168 | \n", "13.873807 | \n", "14459700 | \n", "
12 | \n", "1/20/2000 | \n", "21.479168 | \n", "21.500000 | \n", "20.833332 | \n", "21.125000 | \n", "13.724912 | \n", "17214300 | \n", "
13 | \n", "1/21/2000 | \n", "21.312500 | \n", "21.312500 | \n", "20.687500 | \n", "20.812500 | \n", "13.521886 | \n", "20857500 | \n", "
14 | \n", "1/24/2000 | \n", "21.145832 | \n", "21.145832 | \n", "19.166668 | \n", "19.791668 | \n", "12.858650 | \n", "23399700 | \n", "