lab_2 #2
@ -32,15 +32,16 @@
|
|||||||
"cell_type": "markdown",
|
"cell_type": "markdown",
|
||||||
"metadata": {},
|
"metadata": {},
|
||||||
"source": [
|
"source": [
|
||||||
"<h4>Информация о первом датасете:</h4>\n",
|
"<div style=\"margin: 40px;\">\n",
|
||||||
|
"<h4 >Информация о первом датасете:</h4>\n",
|
||||||
"\n",
|
"\n",
|
||||||
"<p><b>О наборе данных</b><br/>\n",
|
"<p style=\"margin: 40px;\"><b>О наборе данных</b><br/>\n",
|
||||||
"Контекст<br/>\n",
|
"Контекст<br/>\n",
|
||||||
"В космическом пространстве существует бесконечное количество объектов. Некоторые из них находятся ближе, чем мы думаем. Хотя нам может казаться, что расстояние в 70 000 км не может причинить нам вред, в астрономическом масштабе это очень маленькое расстояние, которое может нарушить многие природные явления. Таким образом, эти объекты/астероиды могут причинить вред. Поэтому разумно знать, что нас окружает и что может причинить нам вред. Таким образом, этот набор данных содержит список сертифицированных НАСА астероидов, которые классифицируются как ближайшие к Земле объекты.</p>\n",
|
"В космическом пространстве существует бесконечное количество объектов. Некоторые из них находятся ближе, чем мы думаем. Хотя нам может казаться, что расстояние в 70 000 км не может причинить нам вред, в астрономическом масштабе это очень маленькое расстояние, которое может нарушить многие природные явления. Таким образом, эти объекты/астероиды могут причинить вред. Поэтому разумно знать, что нас окружает и что может причинить нам вред. Таким образом, этот набор данных содержит список сертифицированных НАСА астероидов, которые классифицируются как ближайшие к Земле объекты.</p>\n",
|
||||||
"\n",
|
"\n",
|
||||||
"<br/>\n",
|
"<br/>\n",
|
||||||
"<h4>Информация о втором датасете:</h4>\n",
|
"<h4>Информация о втором датасете:</h4>\n",
|
||||||
"<p><b>О наборе данных</b><br/>\n",
|
"<p style=\"margin: 40px;\"><b>О наборе данных</b><br/>\n",
|
||||||
"Контекст<br/>\n",
|
"Контекст<br/>\n",
|
||||||
"Оценки, полученные студентами<br/>\n",
|
"Оценки, полученные студентами<br/>\n",
|
||||||
"Содержание<br/>\n",
|
"Содержание<br/>\n",
|
||||||
@ -52,7 +53,7 @@
|
|||||||
"<br/>\n",
|
"<br/>\n",
|
||||||
"\n",
|
"\n",
|
||||||
"<h4>Информация о третьем датасете:</h4>\n",
|
"<h4>Информация о третьем датасете:</h4>\n",
|
||||||
"<p><b>О наборе данных</b><br/>\n",
|
"<p style=\"margin: 40px;\"><b>О наборе данных</b><br/>\n",
|
||||||
"Этот набор данных был собран путём сбора данных с онлайн-сайтов.\n",
|
"Этот набор данных был собран путём сбора данных с онлайн-сайтов.\n",
|
||||||
"Столбцы выглядят следующим образом.\n",
|
"Столбцы выглядят следующим образом.\n",
|
||||||
"\n",
|
"\n",
|
||||||
@ -91,25 +92,19 @@
|
|||||||
"\n",
|
"\n",
|
||||||
"Имя_процессора: в этом столбце описывается название процессора.\n",
|
"Имя_процессора: в этом столбце описывается название процессора.\n",
|
||||||
"<br/>\n",
|
"<br/>\n",
|
||||||
"\n"
|
"</div>\n"
|
||||||
]
|
]
|
||||||
},
|
},
|
||||||
{
|
{
|
||||||
"cell_type": "markdown",
|
"cell_type": "markdown",
|
||||||
"metadata": {},
|
"metadata": {},
|
||||||
"source": [
|
"source": [
|
||||||
"начинаем...\n",
|
"<p style=\"margin: 40px;\">начинаем...<br>первое...<br>Проблемная область: Это данные о ближайших к Земле объектах (астероиды и кометы), которые могут угрожать нашей планете. Важно анализировать их траектории, размеры и скорость для предотвращения потенциальных катастроф.<br>Объекты наблюдения: Астероиды, кометы и другие объекты.<br>Атрибуты: 'id', 'name', 'est_diameter_min', 'est_diameter_max', 'relative_velocity', 'miss_distance', 'orbiting_body', 'sentry_object', 'absolute_magnitude', 'hazardous'<br>Связи между объектами: Нет явных связей между объектами, но можно изучать корреляции между размером, скоростью и расстоянием объекта.</p>"
|
||||||
"первое...\n",
|
|
||||||
"Проблемная область: Это данные о ближайших к Земле объектах (астероиды и кометы), которые могут угрожать нашей планете. Важно анализировать их траектории, размеры и скорость для предотвращения потенциальных катастроф.\n",
|
|
||||||
"\n",
|
|
||||||
"Объекты наблюдения: Астероиды, кометы и другие объекты.\n",
|
|
||||||
"Атрибуты: 'id', 'name', 'est_diameter_min', 'est_diameter_max', 'relative_velocity', 'miss_distance', 'orbiting_body', 'sentry_object', 'absolute_magnitude', 'hazardous'\n",
|
|
||||||
"Связи между объектами: Нет явных связей между объектами, но можно изучать корреляции между размером, скоростью и расстоянием объекта."
|
|
||||||
]
|
]
|
||||||
},
|
},
|
||||||
{
|
{
|
||||||
"cell_type": "code",
|
"cell_type": "code",
|
||||||
"execution_count": 8,
|
"execution_count": 1,
|
||||||
"metadata": {},
|
"metadata": {},
|
||||||
"outputs": [
|
"outputs": [
|
||||||
{
|
{
|
||||||
@ -133,18 +128,14 @@
|
|||||||
"cell_type": "markdown",
|
"cell_type": "markdown",
|
||||||
"metadata": {},
|
"metadata": {},
|
||||||
"source": [
|
"source": [
|
||||||
"Получение сведений о пропущенных данных\n",
|
"<p style=\"margin: 40px;\">\n",
|
||||||
"\n",
|
"Получение сведений о пропущенных данных <br>Типы пропущенных данных:<br>None - представление пустых данных в Python<br>NaN - представление пустых данных в Pandas<br>'' - пустая строка\n",
|
||||||
"Типы пропущенных данных:\n",
|
"</p>"
|
||||||
"\n",
|
|
||||||
"None - представление пустых данных в Python\n",
|
|
||||||
"NaN - представление пустых данных в Pandas\n",
|
|
||||||
"'' - пустая строка"
|
|
||||||
]
|
]
|
||||||
},
|
},
|
||||||
{
|
{
|
||||||
"cell_type": "code",
|
"cell_type": "code",
|
||||||
"execution_count": 12,
|
"execution_count": 7,
|
||||||
"metadata": {},
|
"metadata": {},
|
||||||
"outputs": [
|
"outputs": [
|
||||||
{
|
{
|
||||||
@ -187,18 +178,33 @@
|
|||||||
]
|
]
|
||||||
},
|
},
|
||||||
{
|
{
|
||||||
"cell_type": "code",
|
"cell_type": "markdown",
|
||||||
"execution_count": null,
|
|
||||||
"metadata": {},
|
"metadata": {},
|
||||||
"outputs": [],
|
"source": [
|
||||||
"source": []
|
"<p style=\"margin: 40px;\">Тут понятно, что пропущенных значений нет, поэтому заполнять пустые места не нужно <br>И еще на сайте видно, что колонки \"orbiting_body\" и \"sentry_object\" не имеют никаких значений кроме \"Земля\" и \"false\" соответственно. Значит удалим их</p>"
|
||||||
|
]
|
||||||
},
|
},
|
||||||
{
|
{
|
||||||
"cell_type": "code",
|
"cell_type": "code",
|
||||||
"execution_count": null,
|
"execution_count": 18,
|
||||||
"metadata": {},
|
"metadata": {},
|
||||||
"outputs": [],
|
"outputs": [
|
||||||
"source": []
|
{
|
||||||
|
"name": "stdout",
|
||||||
|
"output_type": "stream",
|
||||||
|
"text": [
|
||||||
|
"Index(['id', 'name', 'est_diameter_min', 'est_diameter_max',\n",
|
||||||
|
" 'relative_velocity', 'miss_distance', 'absolute_magnitude',\n",
|
||||||
|
" 'hazardous'],\n",
|
||||||
|
" dtype='object')\n"
|
||||||
|
]
|
||||||
|
}
|
||||||
|
],
|
||||||
|
"source": [
|
||||||
|
"# data = data.drop(columns=['sentry_object'])\n",
|
||||||
|
"# data = data.drop(columns=['orbiting_body'])\n",
|
||||||
|
"print(data.columns)"
|
||||||
|
]
|
||||||
},
|
},
|
||||||
{
|
{
|
||||||
"cell_type": "code",
|
"cell_type": "code",
|
||||||
|
Loading…
Reference in New Issue
Block a user