комит
This commit is contained in:
parent
cdbdc2fd39
commit
fa6ac0aa75
161
lab_2/lab2.ipynb
161
lab_2/lab2.ipynb
@ -4,7 +4,7 @@
|
|||||||
"cell_type": "markdown",
|
"cell_type": "markdown",
|
||||||
"metadata": {},
|
"metadata": {},
|
||||||
"source": [
|
"source": [
|
||||||
"Загрузка данных в DataFrame \"Список форбс\"\n",
|
"<b>Загрузка данных в DataFrame \"Список форбс\"</b>\n",
|
||||||
"\n",
|
"\n",
|
||||||
"О рейтинге\n",
|
"О рейтинге\n",
|
||||||
"The World's Billionaires (\"Миллиардеры мира\") - ежегодный рейтинг самых богатых миллиардеров мира, составляемый и публикуемый в марте американским деловым журналом Forbes. Общее состояние каждого человека, включенного в список, оценивается в долларах США на основе его документально подтвержденных активов, а также с учетом долгов и других факторов. Этот рейтинг представляет собой список самых богатых людей, зарегистрированных по документам, за исключением тех, чье благосостояние не может быть полностью установлено.\n",
|
"The World's Billionaires (\"Миллиардеры мира\") - ежегодный рейтинг самых богатых миллиардеров мира, составляемый и публикуемый в марте американским деловым журналом Forbes. Общее состояние каждого человека, включенного в список, оценивается в долларах США на основе его документально подтвержденных активов, а также с учетом долгов и других факторов. Этот рейтинг представляет собой список самых богатых людей, зарегистрированных по документам, за исключением тех, чье благосостояние не может быть полностью установлено.\n",
|
||||||
@ -23,7 +23,7 @@
|
|||||||
},
|
},
|
||||||
{
|
{
|
||||||
"cell_type": "code",
|
"cell_type": "code",
|
||||||
"execution_count": 3,
|
"execution_count": 8,
|
||||||
"metadata": {},
|
"metadata": {},
|
||||||
"outputs": [
|
"outputs": [
|
||||||
{
|
{
|
||||||
@ -31,17 +31,17 @@
|
|||||||
"output_type": "stream",
|
"output_type": "stream",
|
||||||
"text": [
|
"text": [
|
||||||
"<class 'pandas.core.frame.DataFrame'>\n",
|
"<class 'pandas.core.frame.DataFrame'>\n",
|
||||||
"Index: 2600 entries, Automotive to Food & Beverage \n",
|
"Index: 2600 entries, 1 to 2578\n",
|
||||||
"Data columns (total 6 columns):\n",
|
"Data columns (total 6 columns):\n",
|
||||||
" # Column Non-Null Count Dtype \n",
|
" # Column Non-Null Count Dtype \n",
|
||||||
"--- ------ -------------- ----- \n",
|
"--- ------ -------------- ----- \n",
|
||||||
" 0 Rank 2600 non-null int64 \n",
|
" 0 Name 2600 non-null object \n",
|
||||||
" 1 Name 2600 non-null object \n",
|
" 1 Networth 2600 non-null float64\n",
|
||||||
" 2 Networth 2600 non-null float64\n",
|
" 2 Age 2600 non-null int64 \n",
|
||||||
" 3 Age 2600 non-null int64 \n",
|
" 3 Country 2600 non-null object \n",
|
||||||
" 4 Country 2600 non-null object \n",
|
" 4 Source 2600 non-null object \n",
|
||||||
" 5 Source 2600 non-null object \n",
|
" 5 Industry 2600 non-null object \n",
|
||||||
"dtypes: float64(1), int64(2), object(3)\n",
|
"dtypes: float64(1), int64(1), object(4)\n",
|
||||||
"memory usage: 142.2+ KB\n",
|
"memory usage: 142.2+ KB\n",
|
||||||
"(2600, 6)\n"
|
"(2600, 6)\n"
|
||||||
]
|
]
|
||||||
@ -67,15 +67,15 @@
|
|||||||
" <thead>\n",
|
" <thead>\n",
|
||||||
" <tr style=\"text-align: right;\">\n",
|
" <tr style=\"text-align: right;\">\n",
|
||||||
" <th></th>\n",
|
" <th></th>\n",
|
||||||
" <th>Rank</th>\n",
|
|
||||||
" <th>Name</th>\n",
|
" <th>Name</th>\n",
|
||||||
" <th>Networth</th>\n",
|
" <th>Networth</th>\n",
|
||||||
" <th>Age</th>\n",
|
" <th>Age</th>\n",
|
||||||
" <th>Country</th>\n",
|
" <th>Country</th>\n",
|
||||||
" <th>Source</th>\n",
|
" <th>Source</th>\n",
|
||||||
|
" <th>Industry</th>\n",
|
||||||
" </tr>\n",
|
" </tr>\n",
|
||||||
" <tr>\n",
|
" <tr>\n",
|
||||||
" <th>Industry</th>\n",
|
" <th>Rank</th>\n",
|
||||||
" <th></th>\n",
|
" <th></th>\n",
|
||||||
" <th></th>\n",
|
" <th></th>\n",
|
||||||
" <th></th>\n",
|
" <th></th>\n",
|
||||||
@ -86,73 +86,73 @@
|
|||||||
" </thead>\n",
|
" </thead>\n",
|
||||||
" <tbody>\n",
|
" <tbody>\n",
|
||||||
" <tr>\n",
|
" <tr>\n",
|
||||||
" <th>Automotive</th>\n",
|
" <th>1</th>\n",
|
||||||
" <td>1</td>\n",
|
|
||||||
" <td>Elon Musk</td>\n",
|
" <td>Elon Musk</td>\n",
|
||||||
" <td>219.0</td>\n",
|
" <td>219.0</td>\n",
|
||||||
" <td>50</td>\n",
|
" <td>50</td>\n",
|
||||||
" <td>United States</td>\n",
|
" <td>United States</td>\n",
|
||||||
" <td>Tesla, SpaceX</td>\n",
|
" <td>Tesla, SpaceX</td>\n",
|
||||||
|
" <td>Automotive</td>\n",
|
||||||
" </tr>\n",
|
" </tr>\n",
|
||||||
" <tr>\n",
|
" <tr>\n",
|
||||||
" <th>Technology</th>\n",
|
" <th>2</th>\n",
|
||||||
" <td>2</td>\n",
|
|
||||||
" <td>Jeff Bezos</td>\n",
|
" <td>Jeff Bezos</td>\n",
|
||||||
" <td>171.0</td>\n",
|
" <td>171.0</td>\n",
|
||||||
" <td>58</td>\n",
|
" <td>58</td>\n",
|
||||||
" <td>United States</td>\n",
|
" <td>United States</td>\n",
|
||||||
" <td>Amazon</td>\n",
|
" <td>Amazon</td>\n",
|
||||||
|
" <td>Technology</td>\n",
|
||||||
" </tr>\n",
|
" </tr>\n",
|
||||||
" <tr>\n",
|
" <tr>\n",
|
||||||
" <th>Fashion & Retail</th>\n",
|
" <th>3</th>\n",
|
||||||
" <td>3</td>\n",
|
|
||||||
" <td>Bernard Arnault & family</td>\n",
|
" <td>Bernard Arnault & family</td>\n",
|
||||||
" <td>158.0</td>\n",
|
" <td>158.0</td>\n",
|
||||||
" <td>73</td>\n",
|
" <td>73</td>\n",
|
||||||
" <td>France</td>\n",
|
" <td>France</td>\n",
|
||||||
" <td>LVMH</td>\n",
|
" <td>LVMH</td>\n",
|
||||||
|
" <td>Fashion & Retail</td>\n",
|
||||||
" </tr>\n",
|
" </tr>\n",
|
||||||
" <tr>\n",
|
" <tr>\n",
|
||||||
" <th>Technology</th>\n",
|
" <th>4</th>\n",
|
||||||
" <td>4</td>\n",
|
|
||||||
" <td>Bill Gates</td>\n",
|
" <td>Bill Gates</td>\n",
|
||||||
" <td>129.0</td>\n",
|
" <td>129.0</td>\n",
|
||||||
" <td>66</td>\n",
|
" <td>66</td>\n",
|
||||||
" <td>United States</td>\n",
|
" <td>United States</td>\n",
|
||||||
" <td>Microsoft</td>\n",
|
" <td>Microsoft</td>\n",
|
||||||
|
" <td>Technology</td>\n",
|
||||||
" </tr>\n",
|
" </tr>\n",
|
||||||
" <tr>\n",
|
" <tr>\n",
|
||||||
" <th>Finance & Investments</th>\n",
|
" <th>5</th>\n",
|
||||||
" <td>5</td>\n",
|
|
||||||
" <td>Warren Buffett</td>\n",
|
" <td>Warren Buffett</td>\n",
|
||||||
" <td>118.0</td>\n",
|
" <td>118.0</td>\n",
|
||||||
" <td>91</td>\n",
|
" <td>91</td>\n",
|
||||||
" <td>United States</td>\n",
|
" <td>United States</td>\n",
|
||||||
" <td>Berkshire Hathaway</td>\n",
|
" <td>Berkshire Hathaway</td>\n",
|
||||||
|
" <td>Finance & Investments</td>\n",
|
||||||
" </tr>\n",
|
" </tr>\n",
|
||||||
" </tbody>\n",
|
" </tbody>\n",
|
||||||
"</table>\n",
|
"</table>\n",
|
||||||
"</div>"
|
"</div>"
|
||||||
],
|
],
|
||||||
"text/plain": [
|
"text/plain": [
|
||||||
" Rank Name Networth Age \\\n",
|
" Name Networth Age Country \\\n",
|
||||||
"Industry \n",
|
"Rank \n",
|
||||||
"Automotive 1 Elon Musk 219.0 50 \n",
|
"1 Elon Musk 219.0 50 United States \n",
|
||||||
"Technology 2 Jeff Bezos 171.0 58 \n",
|
"2 Jeff Bezos 171.0 58 United States \n",
|
||||||
"Fashion & Retail 3 Bernard Arnault & family 158.0 73 \n",
|
"3 Bernard Arnault & family 158.0 73 France \n",
|
||||||
"Technology 4 Bill Gates 129.0 66 \n",
|
"4 Bill Gates 129.0 66 United States \n",
|
||||||
"Finance & Investments 5 Warren Buffett 118.0 91 \n",
|
"5 Warren Buffett 118.0 91 United States \n",
|
||||||
"\n",
|
"\n",
|
||||||
" Country Source \n",
|
" Source Industry \n",
|
||||||
"Industry \n",
|
"Rank \n",
|
||||||
"Automotive United States Tesla, SpaceX \n",
|
"1 Tesla, SpaceX Automotive \n",
|
||||||
"Technology United States Amazon \n",
|
"2 Amazon Technology \n",
|
||||||
"Fashion & Retail France LVMH \n",
|
"3 LVMH Fashion & Retail \n",
|
||||||
"Technology United States Microsoft \n",
|
"4 Microsoft Technology \n",
|
||||||
"Finance & Investments United States Berkshire Hathaway "
|
"5 Berkshire Hathaway Finance & Investments "
|
||||||
]
|
]
|
||||||
},
|
},
|
||||||
"execution_count": 3,
|
"execution_count": 8,
|
||||||
"metadata": {},
|
"metadata": {},
|
||||||
"output_type": "execute_result"
|
"output_type": "execute_result"
|
||||||
}
|
}
|
||||||
@ -160,7 +160,7 @@
|
|||||||
"source": [
|
"source": [
|
||||||
"import pandas as pd\n",
|
"import pandas as pd\n",
|
||||||
"\n",
|
"\n",
|
||||||
"df = pd.read_csv(\"..//..//static//csv//Forbes Billionaires.csv\", index_col=\"Industry\")\n",
|
"df = pd.read_csv(\"..//..//static//csv//Forbes Billionaires.csv\", index_col=\"Rank\")\n",
|
||||||
"\n",
|
"\n",
|
||||||
"df.info()\n",
|
"df.info()\n",
|
||||||
"\n",
|
"\n",
|
||||||
@ -169,6 +169,52 @@
|
|||||||
"df.head()"
|
"df.head()"
|
||||||
]
|
]
|
||||||
},
|
},
|
||||||
|
{
|
||||||
|
"cell_type": "markdown",
|
||||||
|
"metadata": {},
|
||||||
|
"source": [
|
||||||
|
"<b>2. Проблемная область</b>\n",
|
||||||
|
"<br><br>\n",
|
||||||
|
"Анализ данных из списка миллиардеров Forbes позволяет не только понять текущее состояние богатства в мире, но и выявить более глубокие тенденции и паттерны, которые могут помочь в принятии бизнес-решений, понимании экономических процессов и определении направлений для дальнейших исследований. Эти данные могут быть основой для многочисленных статей, отчетов и аналитических исследований, что делает их ценными для широкого круга специалистов в различных областях."
|
||||||
|
]
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"cell_type": "markdown",
|
||||||
|
"metadata": {},
|
||||||
|
"source": [
|
||||||
|
"<b>3. Анализ содержимого</b>\n",
|
||||||
|
"<br><br>\n",
|
||||||
|
"\n",
|
||||||
|
"1. Объектами наблюдения являются миллиардеры.\n",
|
||||||
|
"2. В качестве атбирутов вредставлены: имя, величина богатства, возраст, страна, источник, индустрия\n",
|
||||||
|
"3. Связей между объектами нет"
|
||||||
|
]
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"cell_type": "markdown",
|
||||||
|
"metadata": {},
|
||||||
|
"source": [
|
||||||
|
"<b>4. Бизнес-цели</b>\n",
|
||||||
|
"<br><br>\n",
|
||||||
|
"1. Сравнив свой бизнес с другими успешными компаниями, основанными миллиардерами, можно извлечь ценные уроки о сильных сторонами и недостатках своей компании.\n",
|
||||||
|
"2. Анализируя, в каких секторах работают миллиардеры и какие компании они развивают, можно выявить растущие рынки и индустрии, в которые стоит инвестировать.\n"
|
||||||
|
]
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"cell_type": "markdown",
|
||||||
|
"metadata": {},
|
||||||
|
"source": [
|
||||||
|
"Привести примеры целей технического проекта для каждой выделенной ранее\n",
|
||||||
|
"бизнес-цели. Что поступает на вход, что является целевым признаком?\n"
|
||||||
|
]
|
||||||
|
},
|
||||||
|
{
|
||||||
|
"cell_type": "code",
|
||||||
|
"execution_count": null,
|
||||||
|
"metadata": {},
|
||||||
|
"outputs": [],
|
||||||
|
"source": []
|
||||||
|
},
|
||||||
{
|
{
|
||||||
"cell_type": "markdown",
|
"cell_type": "markdown",
|
||||||
"metadata": {},
|
"metadata": {},
|
||||||
@ -188,42 +234,29 @@
|
|||||||
},
|
},
|
||||||
{
|
{
|
||||||
"cell_type": "code",
|
"cell_type": "code",
|
||||||
"execution_count": 2,
|
"execution_count": 7,
|
||||||
"metadata": {},
|
"metadata": {},
|
||||||
"outputs": [
|
"outputs": [
|
||||||
{
|
{
|
||||||
"name": "stdout",
|
"name": "stdout",
|
||||||
"output_type": "stream",
|
"output_type": "stream",
|
||||||
"text": [
|
"text": [
|
||||||
"Survived 0\n",
|
"Name 0\n",
|
||||||
"Pclass 0\n",
|
"Networth 0\n",
|
||||||
"Name 0\n",
|
"Age 0\n",
|
||||||
"Sex 0\n",
|
"Country 0\n",
|
||||||
"Age 177\n",
|
"Source 0\n",
|
||||||
"SibSp 0\n",
|
"Industry 0\n",
|
||||||
"Parch 0\n",
|
|
||||||
"Ticket 0\n",
|
|
||||||
"Fare 0\n",
|
|
||||||
"Cabin 687\n",
|
|
||||||
"Embarked 2\n",
|
|
||||||
"dtype: int64\n",
|
"dtype: int64\n",
|
||||||
"\n",
|
"\n",
|
||||||
"Survived False\n",
|
|
||||||
"Pclass False\n",
|
|
||||||
"Name False\n",
|
"Name False\n",
|
||||||
"Sex False\n",
|
"Networth False\n",
|
||||||
"Age True\n",
|
"Age False\n",
|
||||||
"SibSp False\n",
|
"Country False\n",
|
||||||
"Parch False\n",
|
"Source False\n",
|
||||||
"Ticket False\n",
|
"Industry False\n",
|
||||||
"Fare False\n",
|
|
||||||
"Cabin True\n",
|
|
||||||
"Embarked True\n",
|
|
||||||
"dtype: bool\n",
|
"dtype: bool\n",
|
||||||
"\n",
|
"\n"
|
||||||
"Age процент пустых значений: %19.87\n",
|
|
||||||
"Cabin процент пустых значений: %77.10\n",
|
|
||||||
"Embarked процент пустых значений: %0.22\n"
|
|
||||||
]
|
]
|
||||||
}
|
}
|
||||||
],
|
],
|
||||||
|
Loading…
Reference in New Issue
Block a user