Elastična mreža - pregled, geometrija in regularizacija

Elastična neto linearna regresija uporablja kazni iz tehnik laso in grebena za regulacijo regresijskih modelov. Tehnika združuje tako laso LASSO LASSO, okrajšava za operater najmanjšega absolutnega krčenja in izbire, je statistična formula, katere glavni namen je izbira in regularizacija funkcij ter metode regresije grebena, tako da se iz njihovih pomanjkljivosti učijo za izboljšanje regularizacije statističnih modelov.

Elastična mreža

Metoda elastične mreže izboljša lasove omejitve, tj. Kadar laso odvzame nekaj vzorcev za visoko dimenzionalne podatke, postopek elastične mreže omogoča vključitev števila spremenljivk "n" do nasičenja. V primeru, da so spremenljivke močno korelirane skupine, lasso navadno izbere eno spremenljivko med takimi skupinami, ostale pa v celoti prezre.

Da bi odpravili omejitve, ki jih najdemo v lasu, elastična mreža vključuje kvadratni izraz (|| β || 2) v kaznu, ki, kadar se uporablja ločeno, postane regresija grebena. Kvadratični izraz v kaznu funkcijo izgube povzdigne v konveksno. Elastična mreža se opira na najboljše iz obeh svetov - tj. Na laso in greben.

V postopku iskanja ocenjevalca metode elastične mreže sta dve fazi, ki vključujeta tehnike laso in regresije. Najprej poišče koeficiente grebenov grebena, nato pa izvede drugi korak z uporabo laso vrste krčenja koeficientov.

Ta metoda torej določa koeficiente pri dveh vrstah krčenja. Dvojno krčenje iz naivne različice elastične mreže povzroča nizko učinkovitost predvidljivosti in veliko pristranskost. Za popravek takšnih učinkov se koeficienti prilagodijo tako, da se pomnožijo z (1 + λ 2 ).

Kratek povzetek

  • Metoda elastične mreže hkrati izvaja spremenljivo izbiro in regularizacijo.
  • Tehnika elastične mreže je najprimernejša, kadar so dimenzijski podatki večji od števila uporabljenih vzorcev.
  • Skupine in izbira spremenljivk so ključne vloge tehnike elastične mreže.

Elastična geometrija mreže

Ko je elastična mreža narisana na kartezični ravnini, pade med greben in laso regresijske ploskve, saj gre za kombinacijo teh dveh regresijskih metod. Zaporedje elastične mreže kaže tudi singularnost na ogliščih, ki so pomembna za redkost. Ima tudi stroge konveksne robove, kjer je konveksnost odvisna od vrednosti α.

Konveksnost je odvisna tudi od učinka združevanja, odvisnega od korelacije. Korelacija Korelacija je statistično merilo razmerja med dvema spremenljivkama. Ukrep je najbolje uporabiti pri spremenljivkah, ki dokazujejo linearno razmerje med seboj. Primernost podatkov je mogoče vizualno predstaviti v razpršeni ploskvi. spremenljivk. Višja je korelacija spremenljivk, večji je učinek združevanja in s tem večje število spremenljivk, vključenih v vzorec.

Izbira spremenljivk

Gradnja modelov zahteva izbiro spremenljivk, da tvori podskupino napovedovalcev. Elastic net uporablja p >> n pristop problema, kar pomeni, da je število napovedovalnih števil večje od števila vzorcev, uporabljenih v modelu. Elastična mreža je primerna, kadar spremenljivke tvorijo skupine, ki vsebujejo zelo korelirane neodvisne spremenljivke. .

V postopek izdelave modelov je vključena spremenljiva izbira, ki pomaga povečati natančnost. Če je skupina spremenljivk močno korelirana in je ena od spremenljivk izbrana v vzorec, je celotna skupina samodejno vključena v vzorec.

Vključitev CATREG

CATREG je algoritem, ki omogoča transformacijo spremenljivk, tako linearno kot nelinearno. Algoritem uporablja funkcije korakov in zlitin pri pretvarjanju spremenljivk, ki niso monotone ali monotone pri nelinearnih transformacijah. CATREG lahko simultano transformira in regulira spremenljivke nemonotono, ne da bi bilo treba najprej spremenljivke razširiti v osnovne funkcije ali lažne spremenljivke.

Funkcije elastične neto izgube lahko označimo tudi kot omejeni tip običajne funkcije regresijske izgube najmanjših kvadratov. Algoritem CATREG je vključen v elastično mrežo, kar izboljša učinkovitost in enostavnost rezultatskega algoritma. Za primerjavo elastična mreža prekaša laso, ki sama po učinkovitosti in enostavnosti prekaša greben grebena.

Regulacija elastične mreže

Med postopkom regularizacije odsek l 1 kazni tvori redek model. Po drugi strani pa kvadratni odsek kazni naredi del 1 1 stabilnejši na poti do regularizacije, odpravi količinsko omejitev izbranih spremenljivk in spodbuja učinek združevanja.

Učinek združevanja pomaga spremenljivke zlahka prepoznati s pomočjo korelacije. To izboljša postopek vzorčenja. Prav tako poveča število izbranih spremenljivk, saj se pri vzorčenju ene spremenljivke v močno korelirani skupini vse druge spremenljivke v tej skupini samodejno dodajo v vzorec.

Učinkovite stopnje svobode

Učinkovite stopnje svobode merijo zapletenost modela. Stopnje svobode so pomembne med ocenjevanjem ali natančnim predvidevanjem vgradnje modela. Stopnje svobode so vključene tudi v učenje linearnih gladilcev. V vsakem načinu v zvezi s l 1 kazni, nelinearno narava modelov postavlja izziv v analizi.

Elastična mreža se lahko uporablja tudi v drugih aplikacijah, na primer pri redkih PCA, kjer dobi glavne sestavne dele, ki so spremenjeni z redkimi obremenitvami. Druga aplikacija je v elastični mreži jedra, kjer generiranje strojev jedra razreda poteka s podpornimi vektorji.

Dodatni viri

Finance ponujajo pooblaščenega bančnega in kreditnega analitika (CBCA) ™ Certifikat CBCA ™. Akreditacija pooblaščenega bančnega in kreditnega analitika (CBCA) ™ je globalni standard za kreditne analitike, ki zajema finance, računovodstvo, kreditno analizo, analizo denarnega toka, modeliranje zavez, posojila odplačila in še več. certifikacijski program za tiste, ki želijo svojo kariero dvigniti na višjo raven. Če želite še naprej učiti in razvijati svojo bazo znanja, si oglejte spodnja dodatna finančna sredstva:

  • Drevo odločitev Drevo odločanja Drevo odločanja je podporno orodje z drevesno strukturo, ki modelira verjetne rezultate, stroške virov, pripomočke in možne posledice.
  • Odvisna spremenljivka Odvisna spremenljivka Odvisna spremenljivka je tista, ki se bo spreminjala glede na vrednost druge spremenljivke, imenovane neodvisna spremenljivka.
  • Večkratna linearna regresija Večkratna linearna regresija Večkratna linearna regresija se nanaša na statistično tehniko, ki se uporablja za napovedovanje izida odvisne spremenljivke na podlagi vrednosti neodvisnih spremenljivk
  • Overfitting Overfitting Overfitting je izraz, ki se uporablja v statistiki in se nanaša na napako pri modeliranju, ki se pojavi, kadar funkcija preusmerjeno ustreza določenemu naboru podatkov

Zadnje objave

$config[zx-auto] not found$config[zx-overlay] not found