219 KiB
219 KiB
Начало лабораторной¶
Выгрузка данных из cvs файла в датафрейм
In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.read_csv(".//static//csv//world-population-by-country-2020.csv")
print(df.columns)
Данная диаграмма отображает топ 10 стран с самым молодым населением, что позволяет сделать вывод о том, что в Африке плохо с медициной
In [2]:
srez = df.sort_values("Med. Age").head(10)
# Диаграмма цен:
plt.figure(figsize=(8, 8))
plt.pie(
srez["Med. Age"],
labels=srez["Country (or dependency)"],
autopct="%1.1f%%",
)
plt.show()
Данная диаграмма отображает среднее количество детей, которое женщина рожает за свою жизнь, что позволяет сделать вывод о том, что в среднем человечетво умножает себя
In [3]:
plt.figure(figsize=(18, 4))
srez = df.sort_values("Fert. Rate")
sns.boxplot(x = srez["Fert. Rate"])
plt.title('Box Plot для Fert. Rate')
plt.xlabel('Fert. Rate')
plt.show()
Данная диаграмма отображает население по странам, что позволяет сделать вывод о том, что среднестатистический человек - азиат
In [4]:
srez = df
srez['Population 2020'] = srez['Population 2020'].replace({'$': '', ',': ''}, regex=True)
srez['Population 2020']=srez['Population 2020'].astype(float)
avg_price_by_manufacturer = srez.groupby('Country (or dependency)')['Population 2020'].mean().sort_values(ascending=False).head(100)
plt.figure(figsize=(16, 6))
avg_price_by_manufacturer.plot(kind='bar', color='salmon')
plt.xlabel('Страна')
plt.ylabel('Население')
plt.grid(True)
plt.show()