IIS_2023_1/verina_daria_lab_6/README.md
2023-11-23 02:58:17 +04:00

3.4 KiB
Raw Blame History

Задание

Использовать нейронную сеть MLPClassifier для данных из файла person_types.csv, для задачи: предсказать пол человека на основе имеющихся данных.

Как запустить лабораторную работу:

ЛР запускается в файле main.py через Run, а затем в консоли должны появится вычисления, а также появится диаграмма

Технологии

Библиотека sklearn.neuralnetwork содержит реализацию MLP (Multilayer Perceptron) - это алгоритм искусственного нейронного сети для классификации и регрессии. Классификатор MLPClassifier является реализацией многослойного перцептрона для задач классификации. Библиотеки numpy, pandas, matplotlib

Что делает программа:

Создает и обучает модель нейронной сети с помощью MLPClassifier. Оценивает точность модели с помощью функции. Строит матрицу ошибок и выводит отчет о классификации

Результат:

console.png

diagram.png Accuracy: 0.7: Это означает, что модель правильно предсказала пол (Мужчина/Женщина) для 70% примеров в тестовом наборе данных.

Матрица ошибок (Confusion Matrix):

  • True Positive (TP): 5 примеров правильно предсказаны как Мужчина.
  • True Negative (TN): 9 примеров правильно предсказаны как Женщина.
  • False Positive (FP): 4 примера предсказаны как Мужчина, но на самом деле Женщина.
  • False Negative (FN): 2 примера предсказаны как Женщина, но на самом деле Мужчина.

Отчет по классификации

  • Precision (Точность): Точность - это соотношение правильно предсказанных положительных наблюдений ко всем предсказанным положительным. Для Женщин это 0.82, а для Мужчин 0.56.
  • Recall (Полнота): Полнота - это соотношение правильно предсказанных положительных наблюдений ко всем наблюдениям в фактическом классе. Для Женщин это 0.69, а для Мужчин 0.71.
  • F1-Score: Взвешенное среднее точности и полноты. Для Женщин это 0.75, а для Мужчин 0.63.

Вывод

В целом модель показывает приемлемую производительность, но есть место для улучшений, особенно в правильном предсказании примеров Мужчин. Возможно, корректировка гиперпараметров или попробовать другие модели может улучшить результаты.