AIM-PIbd-32-Safiulova-K-N/lab_1/lab_1.ipynb
2024-09-14 10:40:12 +04:00

224 KiB

Начало лабораторной

Выгрузка данных их csv файла в датафрейм

In [1]:
import pandas as pd 
df = pd.read_csv("..//static//csv//Forbes Billionaires.csv")
print(df.columns)
Index(['Rank ', 'Name', 'Networth', 'Age', 'Country', 'Source', 'Industry'], dtype='object')
In [20]:
plt.figure(figsize=(10, 6))
plt.hist(df['Age'], bins=10, color='orange', edgecolor='black')
plt.title('Распределение возраста миллиардеров')
plt.xlabel('Возраст')
plt.ylabel('Количество миллиардеров')
plt.grid(True)
plt.show()
No description has been provided for this image

Данная диаграмма показывает распределение возраста миллиардеров. Это помогает понять, в каком возрасте чаще всего становятся миллиардерами.

In [21]:
df_top100 = df.head(100)

# Группировка по стране и подсчет количества миллиардеров в каждой стране
country_counts = df_top100['Country'].value_counts()

plt.figure(figsize=(10, 6))
country_counts.plot(kind='bar', color='skyblue')
plt.title('Количество миллиардеров по странам (первые 100 строк)')
plt.xlabel('Страна')
plt.ylabel('Количество миллиардеров')
plt.xticks(rotation=45)
plt.show()
No description has been provided for this image

Столбчатая диаграмма показывает количество миллиардеров в каждой стране для первых 100 строк датасета. Это позволяет наглядно увидеть, в каких странах больше всего миллиардеров в этом срезе данных. Данная диаграмма отображает количество миллиардеров в каждой стране для первых 100 строк датасета, что позволяет наглядно увидеть, в каких странах больше всего миллиардеров в этом срезе данных."

In [19]:
industry_counts = df['Industry'].value_counts()

plt.figure(figsize=(8, 8))
plt.pie(industry_counts, labels=industry_counts.index, autopct='%1.1f%%', startangle=140)
plt.title('Распределение миллиардеров по отраслям')
plt.show()
No description has been provided for this image

Данная диаграмма отображает процентное соотношение миллиардеров по отраслям.