414 KiB
414 KiB
In [ ]:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
In [70]:
print(df.info())
print(df.describe())
In [71]:
print(df.columns)
In [72]:
print(df.iloc[0])
print(df['country'])
In [73]:
grouped = df.groupby('country').agg({'index price': 'mean'})
print(grouped)
In [74]:
sorted_df = df.sort_values(by='stock index', ascending=True)
print(sorted_df)
In [75]:
df_dropped = df.drop(columns=['USTreasury'])
df_dropped = df_dropped.drop(index=[0, 1])
In [76]:
df['real_index_price'] = df['index price'] / (1 + df['inflationrate'])
In [77]:
df_cleaned = df.dropna()
In [78]:
df_filled = df.fillna(value=0)
In [79]:
plt.figure(figsize=(10,6))
for country in df['country'].unique():
plt.plot(df[df['country'] == country]['year'], df[df['country'] == country]['index price'], label=country)
plt.title('Индексные цены по годам')
plt.xlabel('Год')
plt.ylabel('Индексная цена')
plt.legend()
plt.show()
In [80]:
df.groupby('country')['index price'].mean().plot(kind='bar')
plt.title('Средние индексные цены по странам')
plt.ylabel('Средняя индексная цена')
plt.show()
In [81]:
df['index price'].hist(bins=30)
plt.title('Гистограмма индексных цен')
plt.xlabel('Индексная цена')
plt.ylabel('Частота')
plt.show()
In [82]:
df.boxplot(column='index price')
plt.title('Ящик с усами для индексных цен')
plt.ylabel('Индексная цена')
plt.show()
In [83]:
df.plot.area(x='year', y='percapitaincome', alpha=0.5)
plt.title('Диаграмма с областями для ВВП на душу населения')
plt.xlabel('Год')
plt.ylabel('ВВП на душу населения')
plt.show()
In [84]:
plt.scatter(df['oil prices'], df['index price'])
plt.title('Диаграмма рассеяния: Цены на нефть vs Индексная цена')
plt.xlabel('Цены на нефть')
plt.ylabel('Индексная цена')
plt.show()
In [85]:
df['country'].value_counts().plot.pie(autopct='%1.1f%%', startangle=90)
plt.title('Распределение стран по индексной цене')
plt.ylabel('')
plt.show()