IIS_2023_1/gusev_vladislav_lab_6/README.md

47 lines
4.4 KiB
Markdown
Raw Normal View History

2023-10-27 12:00:37 +04:00
### Вариант 9
### Задание на лабораторную работу:
Использовать нейронную сеть MLPClassifier для данных из курсовой работы,
самостоятельно сформулировав задачу. Интерпретировать результаты и
оценить, насколько хорошо она подходит для решения сформулированной
вами задачи.
### Как запустить лабораторную работу:
Выполняем файл gusev_vladislav_lab_6.py, решение будет в консоли.
### Технологии
Sklearn - библиотека с большим количеством алгоритмов машинного обучения.
### Задача
Мною было принято решение посмотреть, как зависит цена алмазов от их
карат, глубины и размера верхней грани (table)
### По коду
1) Для начала загружаем данные из csv файла
2) Разделяем данные на обучающее и тестовые
3) Рескейлим данные
4) Задаем MLPClassifier и обучаем. Предсказываем данные и оцениваем производительность
5) Выводим в консоль
![img.png](img.png)
### По консоли
Accuracy: Это процент правильных предсказаний модели на тестовом наборе данных. Например, если значение
Classification Report (Отчет о классификации): Этот отчет предоставляет детализированную информацию о производительности модели для каждой категории (класса). Включает следующие метрики:
Precision (Точность): Доля объектов, которые правильно классифицированы как принадлежащие к данному классу относительно всех объектов, которые модель классифицировала как этот класс. Точность измеряет, насколько модель избегает ложных положительных результатов.
Recall (Полнота): Доля объектов, которые правильно классифицированы как принадлежащие к данному классу относительно всех объектов этого класса в исходных данных. Полнота измеряет способность модели обнаруживать объекты данного класса.
F1-Score: Гармоническое среднее точности и полноты. Эта метрика объединяет точность и полноту в одну метрику и помогает балансировать их.
Support (Поддержка): Количество объектов в данном классе.
High, low и medium, это высокие, низкие и средние значения столбца Price.
Accuracy (Точность): Это процент правильных классификаций моделью
Macro Avg (Макро среднее): Это среднее значение метрик для каждого класса, вычисленное независимо для каждого класса и затем усредненное. Это не учитывает разницу в размере классов и рассматривает все классы как равнозначные.
Weighted Avg (Взвешенное среднее): Это взвешенное среднее метрик, учитывая размер каждого класса. Это может быть полезным, когда классы имеют различные размеры (например, один класс больше другого).
### Вывод
- Точность вышла крайне высокой, из чего можно сделать вывод, что модель отлично подходит для
выбранной задачи