224 KiB
224 KiB
Начало лабораторной¶
Выгрузка данных их csv файла в датафрейм
In [1]:
import pandas as pd
df = pd.read_csv("..//static//csv//Forbes Billionaires.csv")
print(df.columns)
In [20]:
plt.figure(figsize=(10, 6))
plt.hist(df['Age'], bins=10, color='orange', edgecolor='black')
plt.title('Распределение возраста миллиардеров')
plt.xlabel('Возраст')
plt.ylabel('Количество миллиардеров')
plt.grid(True)
plt.show()
Данная диаграмма показывает распределение возраста миллиардеров. Это помогает понять, в каком возрасте чаще всего становятся миллиардерами.
In [21]:
df_top100 = df.head(100)
# Группировка по стране и подсчет количества миллиардеров в каждой стране
country_counts = df_top100['Country'].value_counts()
plt.figure(figsize=(10, 6))
country_counts.plot(kind='bar', color='skyblue')
plt.title('Количество миллиардеров по странам (первые 100 строк)')
plt.xlabel('Страна')
plt.ylabel('Количество миллиардеров')
plt.xticks(rotation=45)
plt.show()
Столбчатая диаграмма показывает количество миллиардеров в каждой стране для первых 100 строк датасета. Это позволяет наглядно увидеть, в каких странах больше всего миллиардеров в этом срезе данных. Данная диаграмма отображает количество миллиардеров в каждой стране для первых 100 строк датасета, что позволяет наглядно увидеть, в каких странах больше всего миллиардеров в этом срезе данных."
In [19]:
industry_counts = df['Industry'].value_counts()
plt.figure(figsize=(8, 8))
plt.pie(industry_counts, labels=industry_counts.index, autopct='%1.1f%%', startangle=140)
plt.title('Распределение миллиардеров по отраслям')
plt.show()
Данная диаграмма отображает процентное соотношение миллиардеров по отраслям.