IIS_2023_1/arzamaskina_milana_lab_6/README.md

# Лабораторная работа №6

## Нейронная сеть

#### ПИбд-41 Арзамаскина Милана
#### Вариант №2

## Задание:

Использовать  нейронную  сеть для  данных  из  таблицы  1  по  варианту,
самостоятельно  сформулировав  задачу.
Интерпретировать  результаты  и оценить,  насколько  хорошо  она подходит  для  решения сформулированной вами задачи.

Задача по варианту №2: с помощью нейронной сети MLPRegressor.

#### Формулировка задачи: 
Задача: посмотреть, как зависит количество выбросов промышленным производством,
от таких признаков как: выбросы от сжигания и газа.

Зависит ли количество выбросов промышленным производством от сжигания (огня) и газа,
так как производства могут применять сжигание с целью избавления от промышленных выбросов.

## Данные:

Этот набор данных обеспечивает углубленный анализ глобальных выбросов CO2 на уровне страны, позволяя лучше понять, 
какой вклад каждая страна вносит в глобальное совокупное воздействие человека на климат. 
Он содержит информацию об общих выбросах, а также от добычи и сжигания угля, нефти, газа, цемента и других источников. 
Данные также дают разбивку выбросов CO2 на душу населения по странам, показывая, 
какие страны лидируют по уровням загрязнения, и определяют потенциальные области, 
где следует сосредоточить усилия по сокращению выбросов. 
Этот набор данных необходим всем, кто хочет получить информацию о своем воздействии на окружающую среду 
или провести исследование тенденций международного развития.

Данные организованы с использованием следующих столбцов: 

+ Country: название страны
+ ISO 3166-1 alpha-3: трехбуквенный код страны
+ Year: год данных исследования
+ Total: общее количество CO2, выброшенное страной в этом году
+ Coal: количество CO2, выброшенное углем в этом году
+ Oil: количество выбросов нефти
+ Gas: количество выбросов газа
+ Cement: количество выбросов цемента
+ Flaring: выбросы от сжигания
+ Other: другие формы, такие как промышленные процессы
+ Per Capita: столбец «на душу населения» 


### Какие технологии использовались:

Используемые библиотеки:
* pandas
* matplotlib
* sklearn

### Как запустить:

* установить python, sklearn, pandas, matplotlib
* запустить проект (стартовая точка - main.py)

### Что делает программа:

* Загружает набор данных из файла 'CO2.csv', который содержит информацию о выбросах странами CO2 в год от различной промышленной деятельности.
* Очищает набор данных путём удаления строк с нулевыми значениями и глобальными значениями по всем странам (строки 'Global') из набора.
* Выбирает набор признаков (features) из данных, которые будут использоваться.
* Определяет целевую переменную (task) является 'other'.
* Делит данные на обучающий и тестовый наборы для обеих задач с использованием функции train_test_split. Тестовый набор составляет 10% от исходных данных.
* Решает задачу регрессии с помощью нейронной сети MLPRegressor.
* Предсказывает значения целевой переменной на тестовых наборах.
* Выводит коэффициент детерминации для оценки соответствия модели данным.


#### Результаты работы программы:

![Result](img.png)
![Result](img_1.png)


### Вывод:

Точность работы модели на выбранных данных достаточно низкая, модель не справилась со своей задачей, возможно, 
другие методы могут выдать лучшие результаты, либо необходима модификация модели.