lab_2 #2

Merged
Arutunyan-Dmitry merged 6 commits from lab_2 into main 2024-11-22 15:31:28 +04:00
Showing only changes of commit 7e0c9dd589 - Show all commits

View File

@ -32,15 +32,16 @@
"cell_type": "markdown", "cell_type": "markdown",
"metadata": {}, "metadata": {},
"source": [ "source": [
"<h4>Информация о первом датасете:</h4>\n", "<div style=\"margin: 40px;\">\n",
"<h4 >Информация о первом датасете:</h4>\n",
"\n", "\n",
"<p><b>О наборе данных</b><br/>\n", "<p style=\"margin: 40px;\"><b>О наборе данных</b><br/>\n",
"Контекст<br/>\n", "Контекст<br/>\n",
"В космическом пространстве существует бесконечное количество объектов. Некоторые из них находятся ближе, чем мы думаем. Хотя нам может казаться, что расстояние в 70 000 км не может причинить нам вред, в астрономическом масштабе это очень маленькое расстояние, которое может нарушить многие природные явления. Таким образом, эти объекты/астероиды могут причинить вред. Поэтому разумно знать, что нас окружает и что может причинить нам вред. Таким образом, этот набор данных содержит список сертифицированных НАСА астероидов, которые классифицируются как ближайшие к Земле объекты.</p>\n", "В космическом пространстве существует бесконечное количество объектов. Некоторые из них находятся ближе, чем мы думаем. Хотя нам может казаться, что расстояние в 70 000 км не может причинить нам вред, в астрономическом масштабе это очень маленькое расстояние, которое может нарушить многие природные явления. Таким образом, эти объекты/астероиды могут причинить вред. Поэтому разумно знать, что нас окружает и что может причинить нам вред. Таким образом, этот набор данных содержит список сертифицированных НАСА астероидов, которые классифицируются как ближайшие к Земле объекты.</p>\n",
"\n", "\n",
"<br/>\n", "<br/>\n",
"<h4>Информация о втором датасете:</h4>\n", "<h4>Информация о втором датасете:</h4>\n",
"<p><b>О наборе данных</b><br/>\n", "<p style=\"margin: 40px;\"><b>О наборе данных</b><br/>\n",
"Контекст<br/>\n", "Контекст<br/>\n",
"Оценки, полученные студентами<br/>\n", "Оценки, полученные студентами<br/>\n",
"Содержание<br/>\n", "Содержание<br/>\n",
@ -52,7 +53,7 @@
"<br/>\n", "<br/>\n",
"\n", "\n",
"<h4>Информация о третьем датасете:</h4>\n", "<h4>Информация о третьем датасете:</h4>\n",
"<p><b>О наборе данных</b><br/>\n", "<p style=\"margin: 40px;\"><b>О наборе данных</b><br/>\n",
"Этот набор данных был собран путём сбора данных с онлайн-сайтов.\n", "Этот набор данных был собран путём сбора данных с онлайн-сайтов.\n",
"Столбцы выглядят следующим образом.\n", "Столбцы выглядят следующим образом.\n",
"\n", "\n",
@ -91,25 +92,19 @@
"\n", "\n",
"Имя_процессора: в этом столбце описывается название процессора.\n", "Имя_процессора: в этом столбце описывается название процессора.\n",
"<br/>\n", "<br/>\n",
"\n" "</div>\n"
] ]
}, },
{ {
"cell_type": "markdown", "cell_type": "markdown",
"metadata": {}, "metadata": {},
"source": [ "source": [
"начинаем...\n", "<p style=\"margin: 40px;\">начинаем...<br>первое...<br>Проблемная область: Это данные о ближайших к Земле объектах (астероиды и кометы), которые могут угрожать нашей планете. Важно анализировать их траектории, размеры и скорость для предотвращения потенциальных катастроф.<br>Объекты наблюдения: Астероиды, кометы и другие объекты.<br>Атрибуты: 'id', 'name', 'est_diameter_min', 'est_diameter_max', 'relative_velocity', 'miss_distance', 'orbiting_body', 'sentry_object', 'absolute_magnitude', 'hazardous'<br>Связи между объектами: Нет явных связей между объектами, но можно изучать корреляции между размером, скоростью и расстоянием объекта.</p>"
"первое...\n",
"Проблемная область: Это данные о ближайших к Земле объектах (астероиды и кометы), которые могут угрожать нашей планете. Важно анализировать их траектории, размеры и скорость для предотвращения потенциальных катастроф.\n",
"\n",
"Объекты наблюдения: Астероиды, кометы и другие объекты.\n",
"Атрибуты: 'id', 'name', 'est_diameter_min', 'est_diameter_max', 'relative_velocity', 'miss_distance', 'orbiting_body', 'sentry_object', 'absolute_magnitude', 'hazardous'\n",
"Связи между объектами: Нет явных связей между объектами, но можно изучать корреляции между размером, скоростью и расстоянием объекта."
] ]
}, },
{ {
"cell_type": "code", "cell_type": "code",
"execution_count": 8, "execution_count": 1,
"metadata": {}, "metadata": {},
"outputs": [ "outputs": [
{ {
@ -133,18 +128,14 @@
"cell_type": "markdown", "cell_type": "markdown",
"metadata": {}, "metadata": {},
"source": [ "source": [
"Получение сведений о пропущенных данных\n", "<p style=\"margin: 40px;\">\n",
"\n", "Получение сведений о пропущенных данных <br>Типы пропущенных данных:<br>None - представление пустых данных в Python<br>NaN - представление пустых данных в Pandas<br>'' - пустая строка\n",
"Типы пропущенных данных:\n", "</p>"
"\n",
"None - представление пустых данных в Python\n",
"NaN - представление пустых данных в Pandas\n",
"'' - пустая строка"
] ]
}, },
{ {
"cell_type": "code", "cell_type": "code",
"execution_count": 12, "execution_count": 7,
"metadata": {}, "metadata": {},
"outputs": [ "outputs": [
{ {
@ -187,18 +178,33 @@
] ]
}, },
{ {
"cell_type": "code", "cell_type": "markdown",
"execution_count": null,
"metadata": {}, "metadata": {},
"outputs": [], "source": [
"source": [] "<p style=\"margin: 40px;\">Тут понятно, что пропущенных значений нет, поэтому заполнять пустые места не нужно <br>И еще на сайте видно, что колонки \"orbiting_body\" и \"sentry_object\" не имеют никаких значений кроме \"Земля\" и \"false\" соответственно. Значит удалим их</p>"
]
}, },
{ {
"cell_type": "code", "cell_type": "code",
"execution_count": null, "execution_count": 18,
"metadata": {}, "metadata": {},
"outputs": [], "outputs": [
"source": [] {
"name": "stdout",
"output_type": "stream",
"text": [
"Index(['id', 'name', 'est_diameter_min', 'est_diameter_max',\n",
" 'relative_velocity', 'miss_distance', 'absolute_magnitude',\n",
" 'hazardous'],\n",
" dtype='object')\n"
]
}
],
"source": [
"# data = data.drop(columns=['sentry_object'])\n",
"# data = data.drop(columns=['orbiting_body'])\n",
"print(data.columns)"
]
}, },
{ {
"cell_type": "code", "cell_type": "code",