AIM-PIbd-32-Nikiforova-M-V/lab_1/lab1.ipynb
2024-10-11 17:10:41 +04:00

219 KiB
Raw Blame History

Начало лабораторной

Выгрузка данных из cvs файла в датафрейм

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.read_csv(".//static//csv//world-population-by-country-2020.csv")
print(df.columns)
Index(['no', 'Country (or dependency)', 'Population 2020', 'Yearly Change',
       'Net Change', 'Density  (P/Km²)', 'Land Area (Km²)', 'Migrants (net)',
       'Fert. Rate', 'Med. Age', 'Urban Pop %', 'World Share'],
      dtype='object')

Данная диаграмма отображает топ 10 стран с самым молодым населением, что позволяет сделать вывод о том, что в Африке плохо с медициной

In [2]:
srez = df.sort_values("Med. Age").head(10)
# Диаграмма цен:
plt.figure(figsize=(8, 8))
plt.pie(
    srez["Med. Age"],
    labels=srez["Country (or dependency)"],
    autopct="%1.1f%%",

)
plt.show()
No description has been provided for this image

Данная диаграмма отображает среднее количество детей, которое женщина рожает за свою жизнь, что позволяет сделать вывод о том, что в среднем человечетво умножает себя

In [3]:
plt.figure(figsize=(18, 4))
srez = df.sort_values("Fert. Rate")
sns.boxplot(x = srez["Fert. Rate"])
plt.title('Box Plot для Fert. Rate')
plt.xlabel('Fert. Rate')
plt.show()
No description has been provided for this image

Данная диаграмма отображает население по странам, что позволяет сделать вывод о том, что среднестатистический человек - азиат

In [4]:
srez = df
srez['Population 2020'] = srez['Population 2020'].replace({'$': '', ',': ''}, regex=True)
srez['Population 2020']=srez['Population 2020'].astype(float)
avg_price_by_manufacturer = srez.groupby('Country (or dependency)')['Population 2020'].mean().sort_values(ascending=False).head(100)
plt.figure(figsize=(16, 6))
avg_price_by_manufacturer.plot(kind='bar', color='salmon')
plt.xlabel('Страна')
plt.ylabel('Население')
plt.grid(True)
plt.show()
No description has been provided for this image