From a87330830b0f67bf099a515e098f98fbfef2db55 Mon Sep 17 00:00:00 2001
From: a-shdv
+Используя код из [1](пункт «Решение задачи ранжирования признаков», стр. 205), выполните ранжирование признаков с помощью указанных по варианту моделей. Отобразите получившиеся значения\оценки каждого признака каждым методом\моделью и среднюю оценку. Проведите анализ получившихся результатов. Какие четыре признака оказались самыми важными по среднему значению? (Названия\индексы признаков и будут ответом на задание).
+
+9.
+Задание
+
+
+
+
+В этом коде мы генерируем 500 наблюдений с 15 признаками. Затем создается словарь для хранения рангов признаков для каждого метода (Lasso, Random Forest, f_regression). + +Функция calculate_ranks() используется для вычисления рангов признаков для каждого метода. Для этого она обучает модель (Lasso или Random Forest) на данных и затем возвращает словарь, где ключами являются имена признаков, а значениями - коэффициенты признаков модели. + +Если используется метод f_regression, функция возвращает словарь с f-статистиками признаков. + +Затем функция create_normalized_rank_dict() используется для нормализации рангов признаков. Она принимает ранги и имена признаков, приводит ранги к абсолютному значению, нормализует их с использованием MinMaxScaler из sklearn.preprocessing и возвращает словарь, где ключами являются имена признаков, а значениями - нормализованные ранги. + +Наконец, код вычисляет среднее значение рангов для каждого признака, сортирует признаки по средним значениям рангов в порядке убывания и выводит признаки и их ранги. +
++
@nXX#UBKPd5oJrbqIo{hhwEsgI|6@FE0Iom-xT_h-7b7U
zh%z}7Xn7Mckj$*8ENUn1w*Av@6L2Nvbv(qf)wC9vmdCfxR;`6Yp-eB08xpO19Q1Ht
z1?lRJ0QFN`>~2!Zr-uo0@_41OIpt~H%Gg #GYX`~g8t6pL`P^5BQE%@JccXn?e(&%A6>trO+7iFwfl+D<&~ZLmX7tYi0nc<
zoZT-boxUFl8C3aG-%PVjFw-uwX|ePydwZf#M=~i7OxB##r{Z2AQM|7#h$kInDeh=3
zIuckVk>SvIvU#bFwE+<~o6LLk`OoNI?8qhf0USqqY5mlyQXMjpeRIEb33XY0rjx2f
zcdrPcw>T<+q*jX8-axksFx5Q|MbvT~$||_m6q>lF>EBS|am8uA@T?8}-pbM!4pX02
z4aillvY#gGi+gkbb5~1sA>UtpLimb2!SEl2B-5Kc{$JGAMZLlQ`QhD$;s1r#M+q@%
zw=#6M)tSw(#gJBS@7M7*PGw0*_rJ1(@7t7}hP*$HG_2k~&2ims{zN~jcp4EDcVDh@
zdSyNxy+#t$i*~QXtl9Lv$#4F9ZjqpDybak;u$|=TI~j8KL~`D|ALjYnh&NH* UdSL%y^5F-!4=33n=6tM&kfGedcq?MajTNald|9@&oZ uN|<+24gC!dpZ(#=#WFAd4>8U)D3ZK)$wq?~
zW}J5L5J`W(4Mjj(?RPPa;(8^Q`le`nwOmugl#GHLrO?~svhWp4!e^lhVw@t!(7@`Vpr;-FB*l
zk`XDz=wO?_WMK;R^T^=Or<&UNQ{L3J^Q+7!*Gd{)CY%ayzC2HDC!imAw=N}H3F7*C
z{)q%FKMoSe^iD$;BGR|K=r5FAC)w3L7EHgNh#f3!=OzvAoA
46Mn{?=^~l)V?QbkX~;`+tuiO
z|IqmkT2CD=qr+M^-YAO6zkWS8UZ6hT6T_gpb$xC
E~tM(ryziuP)`8k;d;9grB2UtQcjyZI`2v=m=H|r@Y5!wa>
zt_u~S&I%19y*Q_wOE_-m?v(GdC_PaoJZQYVxh!wMBs^de$P|^LoUdK>-WVV+6}I78
z8rOiloORixqR)^qntKN8@HohtWp23o0ufpZO3p7G?`O-+W6@g<@b}
z22`w6eug{pQj^8-$MDM{b_OKuerFhI+To^MGF%xl6Y{zJ0s1tCoQ2xNr}J5x<{na%
zSVsx6X}3T$32Y|PEhgTC&=N#fvF~VYTu<@TTB$zbvNxgy1lfWlML;&0%w3?<7y;o{
z2rXfqQ(8(2+nU?)dL@g8I-{vw)^W)&n@6}&I*#jck6Lq6j!)sSOa$fE!i6iL$bLr>N-IpKa|JyP2y_qZAF3?zX4$jd88^XREG)%-Eh|eyIc&iv`mqHhNq56a~
zITmf|DasQdKvs5fzK+|iy3u<_<<}9
Tho#7T+q3%^Y6)(z`nN0o72Tr
z_Y18l8-LyP-o^5z2Bqp+_ortW`F54>t^X~R$uyM07CFEVDLcZllZBjKzvTz|(LRvk
zljQ#kf*g6WIV=w}UmQR@8w)5HfRtvECVSo0oF-`Lw*H_7L8
zS3GlbqTEbPODm6kv|5iBBlYuVoZCs3^nR)a1k`&zU+(v^RXm}Wnhvt{n!5lO$d*7e
zaUW!00nfQ~rb*`oFpqGwPjR|tfs04gxSw)$u>?|Dy7&}oA|TCH@cnx%_-laaB;C9s
zKt@#Ahsu@aWVxT5mm%*>U#~P)Ky2pa_hZpS^6O@_$JIUB1#K9Uoqxo
20brrZ_$l!9@$%Z%U>wg5FD}+j4lzCqq+kPzG
zp?sTVYo}CLR8-BD6%Tnf+yj