IIS_2023_1/gusev_vladislav_lab_6/README.md
2023-10-27 12:00:37 +04:00

47 lines
4.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

### Вариант 9
### Задание на лабораторную работу:
Использовать нейронную сеть MLPClassifier для данных из курсовой работы,
самостоятельно сформулировав задачу. Интерпретировать результаты и
оценить, насколько хорошо она подходит для решения сформулированной
вами задачи.
### Как запустить лабораторную работу:
Выполняем файл gusev_vladislav_lab_6.py, решение будет в консоли.
### Технологии
Sklearn - библиотека с большим количеством алгоритмов машинного обучения.
### Задача
Мною было принято решение посмотреть, как зависит цена алмазов от их
карат, глубины и размера верхней грани (table)
### По коду
1) Для начала загружаем данные из csv файла
2) Разделяем данные на обучающее и тестовые
3) Рескейлим данные
4) Задаем MLPClassifier и обучаем. Предсказываем данные и оцениваем производительность
5) Выводим в консоль
![img.png](img.png)
### По консоли
Accuracy: Это процент правильных предсказаний модели на тестовом наборе данных. Например, если значение
Classification Report (Отчет о классификации): Этот отчет предоставляет детализированную информацию о производительности модели для каждой категории (класса). Включает следующие метрики:
Precision (Точность): Доля объектов, которые правильно классифицированы как принадлежащие к данному классу относительно всех объектов, которые модель классифицировала как этот класс. Точность измеряет, насколько модель избегает ложных положительных результатов.
Recall (Полнота): Доля объектов, которые правильно классифицированы как принадлежащие к данному классу относительно всех объектов этого класса в исходных данных. Полнота измеряет способность модели обнаруживать объекты данного класса.
F1-Score: Гармоническое среднее точности и полноты. Эта метрика объединяет точность и полноту в одну метрику и помогает балансировать их.
Support (Поддержка): Количество объектов в данном классе.
High, low и medium, это высокие, низкие и средние значения столбца Price.
Accuracy (Точность): Это процент правильных классификаций моделью
Macro Avg (Макро среднее): Это среднее значение метрик для каждого класса, вычисленное независимо для каждого класса и затем усредненное. Это не учитывает разницу в размере классов и рассматривает все классы как равнозначные.
Weighted Avg (Взвешенное среднее): Это взвешенное среднее метрик, учитывая размер каждого класса. Это может быть полезным, когда классы имеют различные размеры (например, один класс больше другого).
### Вывод
- Точность вышла крайне высокой, из чего можно сделать вывод, что модель отлично подходит для
выбранной задачи