131 KiB
131 KiB
Начало лабораторной работы
In [12]:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv("..\\static\\csv\\Forbes Billionaires.csv", index_col="Rank ")
print(df)
In [16]:
plt.figure(figsize=(10, 6))
plt.hist(df['Age'], bins=10, edgecolor='black')
plt.title('Распределение возраста')
plt.xlabel('Возраст')
plt.ylabel('Количество')
plt.show()
Данная диаграмма отображает распределение возраста среди участников датасета, что позволяет сделать вывод о том, что большинство участников находятся в возрастной группе 30-50 лет.
In [19]:
subset_df = df.iloc[0:30]
country_counts = subset_df['Country'].value_counts()
plt.figure(figsize=(10, 6))
plt.pie(country_counts, labels=country_counts.index, autopct='%1.1f%%', startangle=140)
plt.title('Распределение по странам')
plt.show()
Данная диаграмма отображает распределение участников по странам (срез данных от 1 до 30 строки), что позволяет сделать вывод о том, что большинство участников происходят из США
In [27]:
industry_counts = df['Industry'].value_counts()
plt.figure(figsize=(10, 6))
plt.bar(industry_counts.index, industry_counts.values, color='skyblue')
plt.title('Распределение по отраслям')
plt.xlabel('Отрасль')
plt.ylabel('Количество')
plt.show()
Данная диаграмма отображает распределение участников по отраслям