AIM-PIbd-31-Yakovlev-M-G/lab_1/lab_1.ipynb

99 KiB
Raw Blame History

In [1]:
import pandas as pd

df = pd.read_csv("../data/kc_house_data.csv", index_col="id")

cleared_dff = df.drop([ "yr_renovated", "waterfront", "sqft_living15", "sqft_lot15", "long", "lat"], axis=1)

print(cleared_dff.head())
                       date     price  bedrooms  bathrooms  sqft_living  \
id                                                                        
7129300520  20141013T000000  221900.0         3       1.00         1180   
6414100192  20141209T000000  538000.0         3       2.25         2570   
5631500400  20150225T000000  180000.0         2       1.00          770   
2487200875  20141209T000000  604000.0         4       3.00         1960   
1954400510  20150218T000000  510000.0         3       2.00         1680   

            sqft_lot  floors  view  condition  grade  sqft_above  \
id                                                                 
7129300520      5650     1.0     0          3      7        1180   
6414100192      7242     2.0     0          3      7        2170   
5631500400     10000     1.0     0          3      6         770   
2487200875      5000     1.0     0          5      7        1050   
1954400510      8080     1.0     0          3      8        1680   

            sqft_basement  yr_built  zipcode  
id                                            
7129300520              0      1955    98178  
6414100192            400      1951    98125  
5631500400              0      1933    98028  
2487200875            910      1965    98136  
1954400510              0      1987    98074  

График 1 (Точечная диаграмма)

Отношение площади жилого пространства недвижимости на повышение цены

In [2]:
import matplotlib.pyplot as plt
data = df[["price", "sqft_living"]].copy()
data = data[0:1000]
plt.scatter(data["sqft_living"], data["price"], marker="^")
plt.xlabel("Жилплощадь")
plt.ylabel("Цена")
plt.show()
No description has been provided for this image

На графике выше приведена информация о первой тысяче домов. График отображает зависимость цен недвижимости от жилой площади, исходя из графика можно сделать вывод, что чем больше площадь тем выше цена.

График 2 (Гистограмма)

Влияние количества этажей на продажу недвижимости

In [3]:
data = df["floors"]
plt.hist(data, color="orange")
plt.xlabel('Кол-во этажей')
plt.ylabel('Частота покупки')
plt.show()
No description has been provided for this image

Данная диаграмма отображает частоту продаж домой, в зависимости от этажей, исходя из диаграммы можно сделать вывод, что одноэтажные дома покупают чаще чем другие, на втором месте по продажам двухэтажные

График 3 (Круговая диаграмма)

Круговая диограмма количества спален

In [43]:
explode = (0,0,0,0,0.1,0.2)
plt.figure(figsize=(8, 8))
df["bedrooms"][0:500].value_counts().plot.pie(autopct='%1.1f%%', startangle=90, pctdistance=1.25, labeldistance=.8, explode=explode)
plt.ylabel('')
Out[43]:
Text(0, 0.5, '')
No description has been provided for this image

Данная диаграмма отображает количество спален в доме, исходя из графика можно сделать вывод, какое количество спален самое популярное среди покупателей