IIS_2023_1/arzamaskina_milana_lab_6/README.md

82 lines
5.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Лабораторная работа №6
## Нейронная сеть
#### ПИбд-41 Арзамаскина Милана
#### Вариант №2
## Задание:
Использовать нейронную сеть для данных из таблицы 1 по варианту,
самостоятельно сформулировав задачу.
Интерпретировать результаты и оценить, насколько хорошо она подходит для решения сформулированной вами задачи.
Задача по варианту №2: с помощью нейронной сети MLPRegressor.
#### Формулировка задачи:
Задача: посмотреть, как зависит количество выбросов промышленным производством,
от таких признаков как: выбросы от сжигания и газа.
Зависит ли количество выбросов промышленным производством от сжигания (огня) и газа,
так как производства могут применять сжигание с целью избавления от промышленных выбросов.
## Данные:
Этот набор данных обеспечивает углубленный анализ глобальных выбросов CO2 на уровне страны, позволяя лучше понять,
какой вклад каждая страна вносит в глобальное совокупное воздействие человека на климат.
Он содержит информацию об общих выбросах, а также от добычи и сжигания угля, нефти, газа, цемента и других источников.
Данные также дают разбивку выбросов CO2 на душу населения по странам, показывая,
какие страны лидируют по уровням загрязнения, и определяют потенциальные области,
где следует сосредоточить усилия по сокращению выбросов.
Этот набор данных необходим всем, кто хочет получить информацию о своем воздействии на окружающую среду
или провести исследование тенденций международного развития.
Данные организованы с использованием следующих столбцов:
+ Country: название страны
+ ISO 3166-1 alpha-3: трехбуквенный код страны
+ Year: год данных исследования
+ Total: общее количество CO2, выброшенное страной в этом году
+ Coal: количество CO2, выброшенное углем в этом году
+ Oil: количество выбросов нефти
+ Gas: количество выбросов газа
+ Cement: количество выбросов цемента
+ Flaring: выбросы от сжигания
+ Other: другие формы, такие как промышленные процессы
+ Per Capita: столбец «на душу населения»
### Какие технологии использовались:
Используемые библиотеки:
* pandas
* matplotlib
* sklearn
### Как запустить:
* установить python, sklearn, pandas, matplotlib
* запустить проект (стартовая точка - main.py)
### Что делает программа:
* Загружает набор данных из файла 'CO2.csv', который содержит информацию о выбросах странами CO2 в год от различной промышленной деятельности.
* Очищает набор данных путём удаления строк с нулевыми значениями и глобальными значениями по всем странам (строки 'Global') из набора.
* Выбирает набор признаков (features) из данных, которые будут использоваться.
* Определяет целевую переменную (task) является 'other'.
* Делит данные на обучающий и тестовый наборы для обеих задач с использованием функции train_test_split. Тестовый набор составляет 10% от исходных данных.
* Решает задачу регрессии с помощью нейронной сети MLPRegressor.
* Предсказывает значения целевой переменной на тестовых наборах.
* Выводит коэффициент детерминации для оценки соответствия модели данным.
#### Результаты работы программы:
![Result](img.png)
![Result](img_1.png)
### Вывод:
Точность работы модели на выбранных данных достаточно низкая, модель не справилась со своей задачей, возможно,
другие методы могут выдать лучшие результаты, либо необходима модификация модели.