IIS_2023_1/gusev_vladislav_lab_6
2023-10-27 12:00:37 +04:00
..
diamonds_prices.csv gusev_vladislav_lab_6 is ready 2023-10-27 12:00:37 +04:00
gusev_vladislav_lab_6.py gusev_vladislav_lab_6 is ready 2023-10-27 12:00:37 +04:00
img.png gusev_vladislav_lab_6 is ready 2023-10-27 12:00:37 +04:00
README.md gusev_vladislav_lab_6 is ready 2023-10-27 12:00:37 +04:00

Вариант 9

Задание на лабораторную работу:

Использовать нейронную сеть MLPClassifier для данных из курсовой работы, самостоятельно сформулировав задачу. Интерпретировать результаты и оценить, насколько хорошо она подходит для решения сформулированной вами задачи.

Как запустить лабораторную работу:

Выполняем файл gusev_vladislav_lab_6.py, решение будет в консоли.

Технологии

Sklearn - библиотека с большим количеством алгоритмов машинного обучения.

Задача

Мною было принято решение посмотреть, как зависит цена алмазов от их карат, глубины и размера верхней грани (table)

По коду

  1. Для начала загружаем данные из csv файла
  2. Разделяем данные на обучающее и тестовые
  3. Рескейлим данные
  4. Задаем MLPClassifier и обучаем. Предсказываем данные и оцениваем производительность
  5. Выводим в консоль

img.png

По консоли

Accuracy: Это процент правильных предсказаний модели на тестовом наборе данных. Например, если значение

Classification Report (Отчет о классификации): Этот отчет предоставляет детализированную информацию о производительности модели для каждой категории (класса). Включает следующие метрики:

Precision (Точность): Доля объектов, которые правильно классифицированы как принадлежащие к данному классу относительно всех объектов, которые модель классифицировала как этот класс. Точность измеряет, насколько модель избегает ложных положительных результатов.

Recall (Полнота): Доля объектов, которые правильно классифицированы как принадлежащие к данному классу относительно всех объектов этого класса в исходных данных. Полнота измеряет способность модели обнаруживать объекты данного класса.

F1-Score: Гармоническое среднее точности и полноты. Эта метрика объединяет точность и полноту в одну метрику и помогает балансировать их.

Support (Поддержка): Количество объектов в данном классе.

High, low и medium, это высокие, низкие и средние значения столбца Price.

Accuracy (Точность): Это процент правильных классификаций моделью

Macro Avg (Макро среднее): Это среднее значение метрик для каждого класса, вычисленное независимо для каждого класса и затем усредненное. Это не учитывает разницу в размере классов и рассматривает все классы как равнозначные.

Weighted Avg (Взвешенное среднее): Это взвешенное среднее метрик, учитывая размер каждого класса. Это может быть полезным, когда классы имеют различные размеры (например, один класс больше другого).

Вывод

  • Точность вышла крайне высокой, из чего можно сделать вывод, что модель отлично подходит для выбранной задачи