AIM-PIbd-31-Afanasev-S-S/lab_1/lab1.ipynb
2024-09-14 00:17:30 +04:00

170 KiB
Raw Blame History

Начало лабораторной

Выгрузка данных из csv файла в датафрейм

In [5]:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv("C:/Users/TIGR228/Desktop/МИИ/Lab1/AIM-PIbd-31-Afanasev-S-S/static/csv/diabetes.csv")
print(df.columns)
Index(['Pregnancies', 'Glucose', 'BloodPressure', 'SkinThickness', 'Insulin',
       'BMI', 'DiabetesPedigreeFunction', 'Age', 'Outcome'],
      dtype='object')
In [18]:
# Группируем данные по возрасту и вычисляем среднее значение глюкозы для каждой возрастной группы
average_glucose_by_age = df.groupby('Age')['Glucose'].mean()
# Постройте гистограмму для среднего значения глюкозы относительно возраста
plt.figure(figsize=(10, 6))
average_glucose_by_age.plot(kind='bar', edgecolor='black')
plt.title('Среднее количество глюкозы относительно возраста')
plt.xlabel('Возраст')
plt.ylabel('Среднее количество глюкозы')
plt.grid(True)
plt.show()
No description has been provided for this image

Данная диаграмма отображает среднее количество глюкозы для каждой возрастной группы, что позволяет сделать вывод о том, как уровень глюкозы изменяется с возрастом.

In [21]:
# Постройте диаграмму рассеяния для столбцов "Age" и "Pregnancies"
plt.figure(figsize=(10, 6))
plt.scatter(df['Age'], df['Pregnancies'], alpha=0.5)
plt.title('Количество беременностей относительно возраста')
plt.xlabel('Возраст')
plt.ylabel('Количество беременностей')
plt.grid(True)
plt.show()
No description has been provided for this image

Данная диаграмма отображает количество беременностей относительно возраста, что позволяет сделать вывод о том, как частота беременностей изменяется с возрастом.

In [23]:
subset_df = df.iloc[0:30]
# Группируем данные по возрасту и вычисляем среднее значение инсулина и глюкозы для каждой возрастной группы
insulin = subset_df.groupby('Age')['Insulin'].mean()
glucose = subset_df.groupby('Age')['Glucose'].mean()

# Создаем DataFrame для средних значений
average_df = pd.DataFrame({
    'Insulin': insulin,
    'Glucose': glucose
})

# Постройте линейный график для средних значений инсулина и глюкозы
plt.figure(figsize=(10, 6))
average_df.plot.line()
plt.title('Среднее значение инсулина и глюкозы по возрасту')
plt.xlabel('Возраст')
plt.ylabel('Среднее значение')
plt.grid(True)
plt.show()
<Figure size 1000x600 with 0 Axes>
No description has been provided for this image

Данный график отображает среднее значение инсулина и глюкозы по возрасту, что позволяет сделать вывод о том, как эти показатели изменяются с возрастом.