.. | ||
diamonds_prices.csv | ||
gusev_vladislav_lab_6.py | ||
img.png | ||
README.md |
Вариант 9
Задание на лабораторную работу:
Использовать нейронную сеть MLPClassifier для данных из курсовой работы, самостоятельно сформулировав задачу. Интерпретировать результаты и оценить, насколько хорошо она подходит для решения сформулированной вами задачи.
Как запустить лабораторную работу:
Выполняем файл gusev_vladislav_lab_6.py, решение будет в консоли.
Технологии
Sklearn - библиотека с большим количеством алгоритмов машинного обучения.
Задача
Мною было принято решение посмотреть, как зависит цена алмазов от их карат, глубины и размера верхней грани (table)
По коду
- Для начала загружаем данные из csv файла
- Разделяем данные на обучающее и тестовые
- Рескейлим данные
- Задаем MLPClassifier и обучаем. Предсказываем данные и оцениваем производительность
- Выводим в консоль
По консоли
Accuracy: Это процент правильных предсказаний модели на тестовом наборе данных. Например, если значение
Classification Report (Отчет о классификации): Этот отчет предоставляет детализированную информацию о производительности модели для каждой категории (класса). Включает следующие метрики:
Precision (Точность): Доля объектов, которые правильно классифицированы как принадлежащие к данному классу относительно всех объектов, которые модель классифицировала как этот класс. Точность измеряет, насколько модель избегает ложных положительных результатов.
Recall (Полнота): Доля объектов, которые правильно классифицированы как принадлежащие к данному классу относительно всех объектов этого класса в исходных данных. Полнота измеряет способность модели обнаруживать объекты данного класса.
F1-Score: Гармоническое среднее точности и полноты. Эта метрика объединяет точность и полноту в одну метрику и помогает балансировать их.
Support (Поддержка): Количество объектов в данном классе.
High, low и medium, это высокие, низкие и средние значения столбца Price.
Accuracy (Точность): Это процент правильных классификаций моделью
Macro Avg (Макро среднее): Это среднее значение метрик для каждого класса, вычисленное независимо для каждого класса и затем усредненное. Это не учитывает разницу в размере классов и рассматривает все классы как равнозначные.
Weighted Avg (Взвешенное среднее): Это взвешенное среднее метрик, учитывая размер каждого класса. Это может быть полезным, когда классы имеют различные размеры (например, один класс больше другого).
Вывод
- Точность вышла крайне высокой, из чего можно сделать вывод, что модель отлично подходит для выбранной задачи