AIM-PIbd-32-Kamcharova-K-A/lab_1/lab1.ipynb
2024-09-27 19:38:19 +04:00

179 KiB
Raw Blame History

Hello

Блок комментов

Толстый - ** ** Курсив - * * Зачеркнутый - ~~ ~~ Выводок колонок: print(df.columns)

df.info() - информация о всех колонках в таблице (сколько записей в каждой колонке, какой тип данных в записи)

.transpose() - транспонировать матрицу df.drop() - возвращает таблицу с убраннами столбцами () axis = ось (0 или index - значит строки/1 или coloumns - столбцы)

In [17]:
## Начало начал
import pandas as pd
import matplotlib.pyplot as plt
from datetime import date

df = pd.read_csv(".//static//csv//Stores.csv")
print(df.columns)

srez = df.sort_values("Store_Sales").head(5)

# Диаграмма цен:
plt.figure(figsize=(8, 8))
plt.pie(
    srez["Store_Sales"],
    labels=srez["Store ID "],  # type: ignore
    autopct="%1.1f%%",

)
plt.show()
#Диаграмма-сравнение топ 5 магазинов по распродажам в процентной доли рынка от топ 5
Index(['Store ID ', 'Store_Area', 'Items_Available', 'Daily_Customer_Count',
       'Store_Sales'],
      dtype='object')
No description has been provided for this image
In [58]:
df.plot.scatter(x="Store_Sales", y="Daily_Customer_Count")
#Распределение распродаж в зависимости от кол-ва посетителей
Out[58]:
<Axes: xlabel='Store_Sales', ylabel='Store_Area'>
No description has been provided for this image
In [57]:
from sqlite3 import Date


# year_groups = pd.cut(dates, everyFiveYears, right=False)  # type: ignore

# group_counts = year_groups.value_counts().sort_index()  # type: ignore


# plt.figure(figsize=(10, 6))
# plt.show()


plot = srez.plot.line(x="Store_Sales", y="Daily_Customer_Count")




plot = df.plot.line(x="Store_Area", y="Items_Available")
#Зависимость количества поситителей от количества распродаж 
#Зависимость размера магазина от его ассортимента
No description has been provided for this image
No description has been provided for this image