AIM-PIbd-32-Gerimovich-I-M/lab_1/lab1.ipynb
2024-09-28 10:08:48 +04:00

243 KiB

начало

выгрузка данных из csv файла в датафрейм

In [3]:
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib
import matplotlib.ticker as ticker

df = pd.read_csv(".//static//csv//kc_house_data.csv")
print(df.columns)
Index(['id', 'date', 'price', 'bedrooms', 'bathrooms', 'sqft_living',
       'sqft_lot', 'floors', 'waterfront', 'view', 'condition', 'grade',
       'sqft_above', 'sqft_basement', 'yr_built', 'yr_renovated', 'zipcode',
       'lat', 'long', 'sqft_living15', 'sqft_lot15'],
      dtype='object')
In [4]:
df.groupby('bedrooms')['price'].mean().plot(kind='bar')
plt.title('Средняя цена жилья по количеству спален')
plt.xlabel('Количество спален')
plt.ylabel('Средняя цена')
plt.show()
No description has been provided for this image
In [23]:
plt.scatter(df['long'], df['lat'], c=df['price'], cmap='viridis', alpha=0.5)
plt.colorbar(label='Цена')
plt.title('Распределение цен на жилье на карте')
plt.xlabel('Долгота')
plt.ylabel('Широта')
plt.show()
No description has been provided for this image
In [10]:
df.groupby('yr_built')['price'].mean().plot(kind='line')
plt.title('Средняя цена жилья по годам постройки')
plt.xlabel('Год постройки')
plt.ylabel('Средняя цена')
plt.show()
No description has been provided for this image