166 KiB
166 KiB
Лабораторная 1
Выгрузка данных из csv файла в датафрейм
In [6]:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv(".//static//scv//diabetes.csv")
print(df.columns)
Посмотрим краткое содержание датасета. Видим, что датасет состоит из 768 строк и 9 столбцов
In [7]:
df.info()
df.head()
Out[7]:
Группируем данные по возрасту и вычисляем среднее значение глюкозы для каждой возрастной группы
In [9]:
glucose_by_age = df.groupby(['Age'])['BloodPressure'].mean()
glucose_by_age.plot(kind='bar', figsize=(14, 8), width=0.6)
plt.title('Уровень глюкозы с возрастом')
plt.xlabel('Возраст')
plt.ylabel('Уровень глюкозы')
plt.xticks(rotation=0)
plt.show()
Данная диаграмма отображает среднее количество глюкозы для каждой возрастной группы, что позволяет сделать вывод о том, как уровень глюкозы изменяется с возрастом.
In [10]:
plt.figure(figsize=(10, 6))
plt.scatter(df['Age'], df['BloodPressure'], alpha=0.5)
plt.title('Уровень давления относительно возраста')
plt.xlabel('Возраст')
plt.ylabel('Уровень давления')
plt.grid(True)
plt.show()
Данная диаграмма отображает уровень давления относительно возраста, что позволяет сделать вывод о том, как уровень давления изменяется с возрастом.
In [12]:
subset_df = df.iloc[0:30]
insulin = subset_df.groupby('Age')['Insulin'].mean()
bmi = subset_df.groupby('Age')['BMI'].mean()
average_df = pd.DataFrame({
'Insulin': insulin,
'BMI': bmi
})
plt.figure(figsize=(10, 6))
average_df.plot.line()
plt.title('Среднее значение инсулина и индекса тела по возрасту')
plt.xlabel('Возраст')
plt.ylabel('Среднее значение')
plt.grid(True)
plt.show()
Данный график отображает среднее значение инсулина и индекса тела по возрасту, что позволяет сделать вывод о том, как эти показатели изменяются с возрастом.