{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Лабораторная работа №3\n", "\n", "### Набор данных \"Наблюдения НЛО в США\"" ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "# Для набора данных \"Наблюдения НЛО в США\" можно выделить несколько бизнес-целей и соответствующие технические задачи. Давайте рассмотрим этот процесс поэтапно.\n", "# \n", "# 1. Определение бизнес-целей\n", "# Бизнес-цель 1: Прогнозирование местоположения и частоты наблюдений НЛО.\n", "# Задача заключается в анализе географического распределения и времени наблюдений НЛО, чтобы определить, в каких местах и когда чаще всего происходят наблюдения.\n", "# Бизнес-цель 2: Анализ факторов, влияющих на восприятие НЛО (например, форма, продолжительность, описание).\n", "# Цель — понять, какие признаки, такие как форма НЛО, длительность наблюдения, могут быть связаны с более подробными или более эмоционально окрашенными отчетами.\n", "# 2. Цели технического проекта для каждой бизнес-цели\n", "# Цель для бизнес-цели 1: Создать модель, которая предскажет вероятное местоположение и время наблюдений на основе данных о предыдущих наблюдениях.\n", "# Технические задачи:\n", "# Прогнозирование местоположения и времени (классификация или регрессия).\n", "# Кластеризация по географическому положению.\n", "# Анализ временных рядов для выявления сезонных колебаний.\n", "# Цель для бизнес-цели 2: Анализировать текстовые описания наблюдений НЛО для выявления ключевых паттернов и факторов.\n", "# Технические задачи:\n", "# Анализ текста с использованием методов обработки естественного языка (NLP).\n", "# Классификация описаний по типам объектов или возможным объяснениям (например, возможный самолет или атмосферное явление)." ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Index(['summary', 'city', 'state', 'date_time', 'shape', 'duration', 'stats',\n", " 'report_link', 'text', 'posted', 'city_latitude', 'city_longitude'],\n", " dtype='object')\n" ] } ], "source": [ "import pandas as pd\n", "import matplotlib.pyplot as plt\n", "import matplotlib.ticker as ticker\n", "import seaborn as sns\n", "\n", "# Загрузка данных\n", "df = pd.read_csv(\"../../datasets/nuforc_reports.csv\")\n", "\n", "# Срез данных, первые 15000 строк\n", "df = df.iloc[:15000]\n", "\n", "# Вывод\n", "print(df.columns)" ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", " | summary | \n", "city | \n", "state | \n", "date_time | \n", "shape | \n", "duration | \n", "stats | \n", "report_link | \n", "text | \n", "posted | \n", "city_latitude | \n", "city_longitude | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "Viewed some red lights in the sky appearing to... | \n", "Visalia | \n", "CA | \n", "2021-12-15T21:45:00 | \n", "light | \n", "2 minutes | \n", "Occurred : 12/15/2021 21:45 (Entered as : 12/... | \n", "http://www.nuforc.org/webreports/165/S165881.html | \n", "Viewed some red lights in the sky appearing to... | \n", "2021-12-19T00:00:00 | \n", "36.356650 | \n", "-119.347937 | \n", "
1 | \n", "Look like 1 or 3 crafts from North traveling s... | \n", "Cincinnati | \n", "OH | \n", "2021-12-16T09:45:00 | \n", "triangle | \n", "14 seconds | \n", "Occurred : 12/16/2021 09:45 (Entered as : 12/... | \n", "http://www.nuforc.org/webreports/165/S165888.html | \n", "Look like 1 or 3 crafts from North traveling s... | \n", "2021-12-19T00:00:00 | \n", "39.174503 | \n", "-84.481363 | \n", "
2 | \n", "seen dark rectangle moving slowly thru the sky... | \n", "Tecopa | \n", "CA | \n", "2021-12-10T00:00:00 | \n", "rectangle | \n", "Several minutes | \n", "Occurred : 12/10/2021 00:00 (Entered as : 12/... | \n", "http://www.nuforc.org/webreports/165/S165810.html | \n", "seen dark rectangle moving slowly thru the sky... | \n", "2021-12-19T00:00:00 | \n", "NaN | \n", "NaN | \n", "
3 | \n", "One red light moving switly west to east, beco... | \n", "Knoxville | \n", "TN | \n", "2021-12-10T19:30:00 | \n", "triangle | \n", "20-30 seconds | \n", "Occurred : 12/10/2021 19:30 (Entered as : 12/... | \n", "http://www.nuforc.org/webreports/165/S165825.html | \n", "One red light moving switly west to east, beco... | \n", "2021-12-19T00:00:00 | \n", "35.961561 | \n", "-83.980115 | \n", "
4 | \n", "Bright, circular Fresnel-lens shaped light sev... | \n", "Alexandria | \n", "VA | \n", "2021-12-07T08:00:00 | \n", "circle | \n", "NaN | \n", "Occurred : 12/7/2021 08:00 (Entered as : 12/0... | \n", "http://www.nuforc.org/webreports/165/S165754.html | \n", "Bright, circular Fresnel-lens shaped light sev... | \n", "2021-12-19T00:00:00 | \n", "38.798958 | \n", "-77.095133 | \n", "