AIM-PIbd-31-Yaruskin-S-A/lab_1/laba1.ipynb
2024-09-14 08:27:12 +04:00

154 KiB
Raw Permalink Blame History

In [8]:
import numpy as np
import pandas as pd 
import matplotlib.pyplot as plt

df = pd.read_csv("..//static//csv//Stores.csv", index_col="Store ID ")

print(df.columns, "\n")

df["Gr"] = df["Store_Sales"].apply(lambda x: "Award" if x > 70000 else "Normal")

award_data = list(df[df["Gr"] == "Award"]["Store_Area"])
normal_data = list(df[df["Gr"] == "Normal"]["Store_Area"])

colors = ['red', 'blue']
names = ["Award","Normal"]

plt.hist([award_data, normal_data], bins=15, edgecolor="black", color=colors,label=names)
plt.legend()
plt.xlabel("Площадь")
plt.ylabel("Частота")
plt.show()
Index(['Store_Area', 'Items_Available', 'Daily_Customer_Count', 'Store_Sales'], dtype='object') 

No description has been provided for this image

Гистограмма "Распределение Store_Area"

Данная гистограмма позваляет оценить связь между площадью магазина и его продажами. Award - магазины с более высокой выручкой, Normal - все остальные. Если бы большинство магазинов из категории "Award" находилось в правой части графика, то это означала, что прибыль напрямую магазина зависит от его площади. Исходя из полученного графика, видно, что такой явной корреляции нет.

In [9]:
plt.figure(figsize=(10, 6))

# Диаграмма рассеяния между площадью магазина и продажами
plt.scatter(df['Items_Available'], df['Store_Sales'])
plt.xlabel('Товар')
plt.ylabel('Продажи')
plt.title('Продажи по кол-во товара')
plt.show()
No description has been provided for this image

Диаграмма рассеяния

Данная диаграмма отображает зависимость между количеством товара в магазине и его продажами. На диаграмме точки не выстраиваются в ряд, что позволяет сделать вывод о том, что между количеством товара и продажами нет явной связи.

In [10]:
# Построение графика областей для продаж по площади магазина
plt.figure(figsize=(10, 6))

df_sorted = df.sort_values('Daily_Customer_Count')

df_filter = df_sorted.iloc[300:350]

plt.fill_between(df_filter['Daily_Customer_Count'], df_filter['Store_Sales'], color='skyblue')
plt.plot(df_filter['Daily_Customer_Count'], df_filter['Store_Sales'], marker='o', color='Slateblue')
plt.xlabel('Кол-во клиетов')
plt.ylabel('Продажи')
plt.title('График областей: Продажи по количеству людей')
plt.grid(True)
plt.show()
No description has been provided for this image

График областей

Данная диаграмма отображает зависимость между количеством клиентов и продажами. Для посторение данной диаграммы используется срез данных. Как итог, как и в прошлых диаграммах кол-во людей на прямую не влияет на продажи магазина.