Minste kvadraters metode (OLS) refererer tilområdet for regresjonsanalyse. Den har mange applikasjoner, siden den tillater en omtrentlig representasjon av en gitt funksjon av andre enklere. OLS kan være ekstremt nyttig i behandlingen av observasjoner, og det brukes aktivt til å estimere noen mengder fra resultatene av målinger av andre som inneholder tilfeldige feil. Denne artikkelen viser deg hvordan du implementerer beregninger av minst kvadrater i Excel.
Anta at det er to eksponenter X og Y.Videre er Y avhengig av X. Siden OLS er av interesse for oss med tanke på regresjonsanalyse (i Excel implementeres metodene ved hjelp av innebygde funksjoner), så bør du umiddelbart gå videre til å vurdere et spesifikt problem.
Så la X være butikklokalet i en matbutikk, målt i kvadratmeter, og Y - den årlige omsetningen, målt i millioner rubler.
Det er nødvendig å lage en prognose for hvilken omsetning (Y)vil være i butikken hvis den har en eller annen butikkplass. Tydeligvis øker funksjonen Y = f (X) siden hypermarkedet selger flere varer enn boden.
La oss si at vi har en tabell bygget på data for n -butikker.
C | med1 | med2 | ... | medn |
og | og1 | og2 | ... | ogn |
Ifølge matematisk statistikk, resultatenevil være mer eller mindre korrekt hvis data om minst 5-6 objekter blir undersøkt. I tillegg kan du ikke bruke "unormale" resultater. Spesielt kan en liten elitebutikk ha en omsetning som er mange ganger større enn omsetningen til store butikker i klassen "masmarket".
Tabelldata kan plottes på det kartesiske planet som punkt M1 (x1, y1),… Mn (xn, yn). Nå vil løsningen på problemet bli redusert til valg av en tilnærmingsfunksjon y = f (x) med en graf som går så nært som mulig til punktene M1, M2, ..Mn.
Selvfølgelig kan du bruke det høye polynometgrad, men dette alternativet er ikke bare vanskelig å implementere, men også ganske enkelt feil, siden det ikke vil gjenspeile hovedtrenden som må oppdages. Den rimeligste løsningen er å finne den rette linjen y = ax + b, som best tilnærmer eksperimentelle data, eller rettere sagt koeffisientene a og b.
For enhver tilnærming er en vurdering av nøyaktigheten av spesiell betydning. Vi betegner med eog forskjell (avvik) mellom funksjonelle og eksperimentelle verdier for punkt xog, dvs. eog = yog - f (xog).
Åpenbart, for å estimere nøyaktigheten av tilnærmingensummen av avvik kan brukes, det vil si at når du velger en rett linje for en omtrentlig representasjon av avhengigheten til X på Y, bør det foretrekkes den med den minste verdien av summen eog på alle punkter vurdert. Imidlertid er ikke alt så enkelt, siden sammen med positive avvik vil negative praktisk talt være til stede.
Du kan løse problemet ved å bruke avviksmodulereller rutene deres. Den siste metoden er den mest brukte. Den brukes på mange områder, inkludert regresjonsanalyse (Excel implementerer den med to innebygde funksjoner), og har lenge bevist sin verdi.
Excel er kjent for å ha en innebygdautosum -funksjon som beregner verdiene til alle verdiene i det valgte området. Dermed hindrer ingenting oss i å beregne verdien av uttrykket (f12 + e22 + e32+ ... en2).
I matematisk notasjon ser det slik ut:
Siden beslutningen først ble tatt om å benytte en rett linje, har vi:
Dermed reduseres problemet med å finne den rette linjen som best beskriver den spesifikke avhengigheten av mengdene X og Y til å beregne minimum av en funksjon av to variabler:
Dette krever likhet med null de partielle derivatene med hensyn til de nye variablene a og b, og å løse et primitivt system bestående av to ligninger med 2 ukjente av formen:
Etter noen enkle transformasjoner, inkludert å dele med 2 og manipulere summene, får vi:
Ved å løse det, for eksempel etter Cramers metode, får vi et stasjonært punkt med noen koeffisienter a* og b*... Dette er minimum, det vil si for å forutsi hvilken omsetning butikken vil ha for et bestemt område, er den rette linjen y = a egnet*x + b*, som er en regresjonsmodell fordet aktuelle eksemplet. Selvfølgelig vil det ikke tillate deg å finne et eksakt resultat, men det vil hjelpe deg med å få en ide om hvorvidt det vil lønne seg å kjøpe en butikk på kreditt for et bestemt område.
Excel har en funksjon for å beregne verdienav OLS. Den har følgende form: "TREND" (kjente Y -verdier; kjente X -verdier; nye X -verdier; konst.). La oss bruke formelen for å beregne OLS i Excel i tabellen vår.
For å gjøre dette, i cellen der det skal væreresultatet av beregningen med metoden for minst kvadrater i Excel vises, skriv inn "=" -tegnet og velg "TREND" -funksjonen. Fyll ut de aktuelle feltene i vinduet som åpnes, og merk:
I tillegg inneholder formelen den boolske variabelen "Const". Hvis du angir 1 i det tilsvarende feltet, vil dette bety at beregninger bør utføres, forutsatt at b = 0.
Hvis du trenger å vite prognosen for mer enn én verdi av x, bør du ikke trykke "Enter" etter å ha angitt formelen, men du må skrive kombinasjonen "Shift" + "Control" + "Enter" på tastaturet ("Tast inn").
Regresjonsanalyse kan til og med være tilgjengeligtekanner. Excel -formelen for å forutsi verdien av en rekke ukjente variabler - "TREND" - kan brukes selv av de som aldri har hørt om metoden med minst kvadrater. Det er nok bare å kjenne noen av funksjonene i arbeidet hennes. Spesielt:
Regresjonsanalyse i Excel implementeres medbruker flere funksjoner. En av dem kalles "PROGNOS". Det ligner på "TREND", det vil si at det gir resultatet av beregninger ved bruk av metoden for minst kvadrater. Imidlertid bare for ett X, som Y -verdien er ukjent for.
Nå kjenner du formlene i Excel for dummies som lar deg forutsi fremtidig verdi av en gitt indikator i henhold til en lineær trend.