Kako pokrenuti multivarijacijsku regresiju u programu Excel

Prije nego što naučimo kako izvoditi multivarijantnu regresiju u Excelu , važno je osvježiti se za regresiju u cjelini i posebno za multivarijacijsku regresiju.

Jedno od obilježja ljudske inteligencije je naša sposobnost prepoznavanja obrazaca oko sebe. To je ono što nas tjera da prepoznamo kada se dvije ili više stvari čine povezanima i kada je jedna stvar vjerojatno uzrok ili posljedica druge.

Multivarijatna regresija u Excelu

Recimo, na primjer, da ste odlučili prikupljati podatke o prosječnim temperaturama i prosječnim kišama na određenom mjestu tijekom cijele godine, prikupljajući podatke svaki dan. Zatim podatke o temperaturi i prosječnoj količini kiše ucrtate na komad grafofolije. Možete prikazati prosječne vrijednosti temperature na osi x i prosječne brojke kiše na osi y. Svaka točka na ovoj raspršenoj plohi imat će koordinate: x koordinatu i y koordinatu. Te će ga koordinate smjestiti na posebno mjesto na grafikonu.

Dok crtate točke, možda ćete početi vidjeti uzorak. Može se činiti da se - s porastom prosječnih temperatura - povećava prosječna količina kiše na mjestu na kojem ste prikupljali podatke. Ta dva podatka koja ste prikupili tehnički su poznate kao varijable . U ovom je slučaju prosječna temperatura neovisna varijabla, dok je prosječna kiša ovisna varijabla.

Kad primijetite da su dvije varijable povezane, kažemo da su povezane. Korelacija može imati više oblika. Ako jedna varijabla raste, dok druga pada, to je negativna korelacija . Ako jedna varijabla raste zajedno s drugom, onda je to pozitivna korelacija . Ako se čini da u varijablama nema jasnog trenda, onda kažemo da nema korelacije.

Podaci i korelacije

Savršena pozitivna korelacija dobiva vrijednost +1, dok savršena negativna korelacija daje vrijednost -1. 0, koji se nalazi u sredini ove dvije vrijednosti, uopće ne predstavlja nikakvu korelaciju. Podaci stoga mogu poprimiti vrijednost korelacije bilo gdje u tom rasponu. Točna vrijednost te korelacije poznata je kao koeficijent korelacije, koji se izračunava pomoću posebne statističke formule koja postoji na vašem popisu funkcija programa Excel.

Imajte na umu da statističari vole razlikovati korelaciju i uzročnost. Samo zato što su dvije stvari povezane, ne znači da imaju uzročno-posljedičnu vezu. U našem primjeru gore, činjenica da porast prosječne temperature odgovara porastu prosječne kiše ne znači da jedno uzrokuje drugo. Moglo bi biti da treći skriveni faktor uzrokuje oboje.

U ovom je slučaju među meteorolozima dobro poznato da porast vlage dovodi do povećanja opažene temperature i padalina. Zbog toga je važno razumjeti razliku. Mapiranje korelacija pokazuje vam gdje postoje obrasci; reći da vam pokazuje što uzrokuje ono što bi premašilo njegov sažetak.

Možda se nećete osjećati sretno zbog raspršene parcele. Možda bi bilo lakše razumjeti liniju kroz podatke koja pokazuje kako izgleda veza. Ono što tražite je linija regresije ili linija koja najbolje odgovara podacima koje imate pred sobom. To uključuje upotrebu regresijske formule koja koristi koeficijent korelacije za pronalaženje najbolje linije regresije.

Jedna i više varijabli

Zabava tu ne prestaje. Gornje formule su za jednu neovisnu varijablu i jednu ovisnu varijablu. Međutim, kao što smo gore raspravljali, ponekad u jednadžbi može biti više neovisnih varijabli.

Na primjer, istaknuli smo da jednostavno crtanje prosječne temperature u odnosu na prosječnu količinu kiše ne daje cjelovitu sliku. Prosječna vlaga još je jedna neovisna varijabla koja utječe i na prosječnu temperaturu i na prosječne kiše. Ne bi li bilo izvrsno da postoji način na koji bismo mogli izračunati prosječnu kišu kao ovisnu varijablu u odnosu na dvije neovisne varijable koje su prosječna kiša i prosječna vlaga?

Ispostavilo se da je upravo u tome multivarijatna regresija. Omogućuje vam povezivanje jedne ovisne varijable s više neovisnih varijabli na kojima ste mjerili i prikupljali podatke.

Analiza multivarijacijske regresije

Multivarijatna regresija vrlo je moćan oblik analize podataka i događa se da je točniji kada se primjenjuje u stvarnom svijetu. Posebno u poslovnom svijetu, na situacije rijetko ikad utječe jedan faktor. Obično postoji mnogo čimbenika koji zajedno rade na stvaranju rezultata. Kada prikupljate podatke o određenim skupinama uvjeta, ova vrsta analize podataka omogućit će vam predviđanje podataka u povezanim uvjetima.

Snagom multivarijatne regresije bolje ćete moći razumjeti svoje tržište i kupce koji na njemu postoje.

Regresijska analiza u Excelu

Prije nego što požurite kupiti najnapredniji statistički softver na tržištu, bit će vam drago čuti da možete izvršiti regresijsku analizu u programu Excel.

Pokrenite Excel

Da biste započeli svoju multivarijantnu analizu u Excelu , pokrenite Microsoft Excel. Kliknite na karticu s oznakom „File” , a zatim kliknite na gumb s oznakom „Opcije”. Otvorit će se dijaloški okvir.

Kliknite opcije

Na lijevoj strani dijaloškog okvira nalazi se popis opcija. Kliknite opcije s oznakom " Dodaci". Moći ćete vidjeti programske dodatke. Na popisu neaktivnih dodataka trebali biste vidjeti stavku s oznakom Analysis ToolPak. Kliknite na nju, a zatim kliknite na padajući izbornik u ‘Excel Add-Ins.’ Kliknite gumb s oznakom "Idi" na dnu i pojavit će se drugi dijaloški okvir s oznakom "Dodaci" .

Označite okvir

Ispred opcije s oznakom "Analysis ToolPak " nalazi se potvrdni okvir. Kliknite na njega i zatim kliknite na gumb na desnoj strani dijaloškog okvira s oznakom „OK”. Ovo će uključiti opciju koju ste upravo provjerili.

Izvođenje regresije

Sada je vrijeme za izvođenje regresije. Vaši će stupci trebati naslove koje možete unijeti u red 1. Podaci idu pod naslov. Imajte stupac posebno za vašu ovisnu varijablu. To bi trebao biti prvi ili posljednji stupac. Nezavisne varijable mogu ispuniti ostale stupce i trebaju biti uzastopnim redoslijedom.

Kartica Podaci

Na vrpci kliknite karticu s podacima "Podaci". U grupi s oznakom "Analiza" kliknite stavku s oznakom "Analiza podataka". Pokazat će se dijaloški okvir.

Regresija

U alati za analizu u dijaloškom okviru, u potrazi za regresiju i kliknite na njega, a zatim kliknite na „OK”.

Zavisna varijabla

Sada u polje s oznakom "Input Y Range" upišite mjesto raspona ćelija koje imaju vašu zavisnu varijablu .

Neovisna varijabla

Sada upišite mjesto raspona ćelija koje imaju vašu neovisnu varijablu u polje s oznakom "Unos X raspona".

Označite okvir

Da biste bili sigurni da Excel zna da prvi redak nema ništa osim oznaka_, kliknite_ na potvrdni okvir "Oznake".

Kliknite Raspon izlaza

U odjeljku s oznakom Output Options nalazi se radio gumb s nazivom "Output Range". Kliknite na nju i unesite raspon za svoje podatke u prvu kako biste odredili gdje će se pojaviti izlaz regresijske analize. U slučaju da želite da se vaši rezultati prikažu na zasebnom radnom listu, kliknite radio gumb s oznakom "Radni list sloj". Ako ih želite u potpunosti u novoj datoteci, kliknite radio gumb s oznakom "Nova radna knjiga".

Ostaci

Postoji dio dijaloškog okvira Regresija s nazivom "Ostaci". Ovo su sažeci rezultata vaše analize koji rezultate razmatraju od slučaja do slučaja. Oni predviđanje uspoređuju sa stvarnim rezultatom. Standardizirani ostaci uzeti će standardno odstupanje vaših ostataka i ispraviti ga na 1.

Kliknite potvrdni okvir na opciji s oznakom "Plot" i vaši će se rezultati prikazati u grafikonu. Ako odaberete "Prikaz ostataka ", tada će se grafikovati samo ostaci. Ako odaberete "Line Fit Plot " , predviđanje će biti ucrtano u odnosu na stvarne rezultate. Kliknite na „OK” i vaš regresija će početi obradu. Rezultate možete pogledati kasnije na mjestu koje ste ranije odredili.