{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Начало лабораторной, ухх...\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### Бизнес-цели:\n", "\n", "1. Повышение безопасности планеты от потенциальных угроз космических объектов.\n", "2. Оптимизация исследования космических объектов для использования в коммерческих или исследовательских миссиях." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### Цели технического проекта:\n", "\n", "Для 1-й бизнес-цели: \n", "* сбор и подготовка данных: очистка данных от пропусков, выбросов и дубликатов. Преобразование категориальных переменных в числовые. Разделение данных на обучающую и тестовую выборки. \n", "* разработка и обучение модели: исследование различных алгоритмов машинного обучения (линейная регрессия, деревья решений, случайный лес и т.д.). Обучение моделей на обучающей выборке. Оценка качества моделей на тестовой выборке с помощью метрик RMSE, MAE и др.\n", "* развертывание модели: \n", " * Создать веб-приложение или API, которое принимает параметры объекта и прогнозирует, опасен ли он для Земли.\n", " * Модель может использоваться в системах мониторинга космических объектов для предоставления оперативных оценок и предупреждений.\n", " * Включение автоматической системы оповещения для НАСА и других космических агентств с обновлениями по объектам, представляющим угрозу.\n", "\n", "Для 2-й бизнес-цели:\n", "* сбор и подготовка данных: очистка данных от пропусков, выбросов и дубликатов. Преобразование категориальных переменных в числовые. Разделение данных на обучающую и тестовую выборки. \n", "* разработка и обучение модели: исследование различных алгоритмов машинного обучения (линейная регрессия, деревья решений, случайный лес и т.д.). Обучение моделей на обучающей выборке. Оценка качества моделей на тестовой выборке с помощью метрик RMSE, MAE и др.\n", "* развертывание модели:\n", " * Разработка модели, которая позволяет астрономам и специалистам по космосу загружать данные о новых объектах и получать предсказания о расстоянии их ближайшего сближения с Землей.\n", " * Создание системы мониторинга с графическим интерфейсом, отображающим траектории движения объектов и предполагаемые даты и расстояния их ближайших подходов.\n", " * Реализация системы оповещений на основе пороговых значений расстояний для идентификации особо опасных сближений." ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Index(['id', 'name', 'est_diameter_min', 'est_diameter_max',\n", " 'relative_velocity', 'miss_distance', 'orbiting_body', 'sentry_object',\n", " 'absolute_magnitude', 'hazardous'],\n", " dtype='object')\n" ] }, { "data": { "text/html": [ "
\n", " | id | \n", "name | \n", "est_diameter_min | \n", "est_diameter_max | \n", "relative_velocity | \n", "miss_distance | \n", "orbiting_body | \n", "sentry_object | \n", "absolute_magnitude | \n", "hazardous | \n", "
---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "2162635 | \n", "162635 (2000 SS164) | \n", "1.198271 | \n", "2.679415 | \n", "13569.249224 | \n", "5.483974e+07 | \n", "Earth | \n", "False | \n", "16.73 | \n", "False | \n", "
1 | \n", "2277475 | \n", "277475 (2005 WK4) | \n", "0.265800 | \n", "0.594347 | \n", "73588.726663 | \n", "6.143813e+07 | \n", "Earth | \n", "False | \n", "20.00 | \n", "True | \n", "
2 | \n", "2512244 | \n", "512244 (2015 YE18) | \n", "0.722030 | \n", "1.614507 | \n", "114258.692129 | \n", "4.979872e+07 | \n", "Earth | \n", "False | \n", "17.83 | \n", "False | \n", "
3 | \n", "3596030 | \n", "(2012 BV13) | \n", "0.096506 | \n", "0.215794 | \n", "24764.303138 | \n", "2.543497e+07 | \n", "Earth | \n", "False | \n", "22.20 | \n", "False | \n", "
4 | \n", "3667127 | \n", "(2014 GE35) | \n", "0.255009 | \n", "0.570217 | \n", "42737.733765 | \n", "4.627557e+07 | \n", "Earth | \n", "False | \n", "20.09 | \n", "True | \n", "