99 KiB
99 KiB
In [1]:
import pandas as pd
df = pd.read_csv("../data/kc_house_data.csv", index_col="id")
cleared_dff = df.drop([ "yr_renovated", "waterfront", "sqft_living15", "sqft_lot15", "long", "lat"], axis=1)
print(cleared_dff.head())
График 1 (Точечная диаграмма)¶
Отношение площади жилого пространства недвижимости на повышение цены
In [2]:
import matplotlib.pyplot as plt
data = df[["price", "sqft_living"]].copy()
data = data[0:1000]
plt.scatter(data["sqft_living"], data["price"], marker="^")
plt.xlabel("Жилплощадь")
plt.ylabel("Цена")
plt.show()
На графике выше приведена информация о первой тысяче домов. График отображает зависимость цен недвижимости от жилой площади, исходя из графика можно сделать вывод, что чем больше площадь тем выше цена.
График 2 (Гистограмма)¶
Влияние количества этажей на продажу недвижимости
In [3]:
data = df["floors"]
plt.hist(data, color="orange")
plt.xlabel('Кол-во этажей')
plt.ylabel('Частота покупки')
plt.show()
Данная диаграмма отображает частоту продаж домой, в зависимости от этажей, исходя из диаграммы можно сделать вывод, что одноэтажные дома покупают чаще чем другие, на втором месте по продажам двухэтажные
График 3 (Круговая диаграмма)¶
Круговая диограмма количества спален
In [43]:
explode = (0,0,0,0,0.1,0.2)
plt.figure(figsize=(8, 8))
df["bedrooms"][0:500].value_counts().plot.pie(autopct='%1.1f%%', startangle=90, pctdistance=1.25, labeldistance=.8, explode=explode)
plt.ylabel('')
Out[43]:
Данная диаграмма отображает количество спален в доме, исходя из графика можно сделать вывод, какое количество спален самое популярное среди покупателей