AIM_PIbd-31_LyovUshkinaA.A/lab_1/lab1.ipynb

312 KiB
Raw Permalink Blame History

In [ ]:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv("C://Users//annal//aim//static//csv//Forbes_Billionaires.csv")
print(df.columns)
Index(['Rank ', 'Name', 'Networth', 'Age', 'Country', 'Source', 'Industry'], dtype='object')

Диаграмма №1 - круговая

Эта диаграмма показывает, в каких областях достигли успеха миллиардеры. Благодаря этой диаграмме, можно выяснить, в какой области больше всего(или меньше всего) миллиардеров. По этой диаграмме видно, что в сфере финансов и инвестиций наибольший процент миллиардеров, в то время как наименьшего успеха люди достигли в сфере азартных игр и казино

In [15]:
ind_counts = df['Industry'].value_counts()
plt.figure(figsize=(16, 16))
plt.pie(ind_counts, labels=ind_counts.index, autopct='%1.1f%%', startangle=140, colors=plt.cm.Paired.colors)
plt.title('Распределение миллиардеров по областям')
Out[15]:
Text(0.5, 1.0, 'Распределение миллиардеров по областям')
No description has been provided for this image

Диаграмма №2 - Столбчатая диаграмма

Эта диаграмма показывает топ-20 стран с самыми богатыми миллиардерами, а так же количеством миллиардеров в каждой стране.Эта диаграмма позволяет определить лидера среди стран по количеству богатейших людей мира. Итак, диаграмма показывает, что в США наибольшее число миллиардеров среди 20 лучших стран.

In [26]:
country_counts = df['Country'].value_counts()
top50 = country_counts.head(20)
country_bars = top50.plot(kind='bar', color = 'green')
country_bars.set_ylabel('Колисчество миллиардеров')
country_bars.set_title('Топ-20 стран с богатейшими из миллиардеров')
country_bars.set_xlabel('Страна')
Out[26]:
Text(0.5, 0, 'Страна')
No description has been provided for this image

Диаграмма №3 - Диаграмма рассеяния

Данная диаграмма предназначена для поиска закономерности между возрастом и суммой состояния миллиардеров. На данной диаграмме видно, что сумма состояния увеличивается с возрастом, однако существуют единичные случаи, выбивающиеся из общей тенденции.

In [37]:
plt.figure(figsize=(11,11))
plt.scatter(df['Age'], df['Networth'])
plt.title('Зависимость суммы состояния от возраста')
plt.xlabel('Возраст')
plt.ylabel('Сумма состояния')
Out[37]:
Text(0, 0.5, 'Сумма состояния')
No description has been provided for this image