Methode der kleinsten Quadrate (LSM) bezieht sich aufBereich der Regressionsanalyse. Es hat viele Verwendungszwecke, da es eine ungefähre Darstellung einer bestimmten Funktion durch andere einfachere Funktionen ermöglicht. OLS kann bei der Verarbeitung von Beobachtungen äußerst nützlich sein und wird aktiv verwendet, um einige Werte aus den Ergebnissen von Messungen anderer zu schätzen, die zufällige Fehler enthalten. In diesem Artikel erfahren Sie, wie Sie Berechnungen der kleinsten Quadrate in Excel implementieren.
Angenommen, es gibt zwei Exponenten X und Y.Darüber hinaus hängt Y von X ab. Da MNCs aus der Sicht der Regressionsanalyse für uns von Interesse sind (in Excel werden die Methoden mithilfe integrierter Funktionen implementiert), lohnt es sich, sofort auf ein bestimmtes Problem einzugehen.
Also sei X die Verkaufsfläche des Lebensmittelgeschäfts, gemessen in Quadratmetern, und Y der Jahresumsatz, definiert in Millionen Rubel.
Es ist eine Prognose erforderlich, welcher Umsatz (Y)wird im Geschäft sein, wenn es eine oder andere Verkaufsfläche hat. Offensichtlich steigt die Funktion Y = f (X), da der Hypermarkt mehr Waren verkauft als der Stand.
Angenommen, wir haben eine Tabelle, die gemäß den Daten für n Geschäfte erstellt wurde.
Mit | mit dem1 | mit dem2 | ... | mit demHerr |
Und | und1 | und2 | ... | undHerr |
Laut mathematischer Statistik ergeben sich die Ergebnisseist mehr oder weniger korrekt, wenn die Daten von mindestens 5-6 Objekten untersucht werden. Außerdem können keine "abnormalen" Ergebnisse verwendet werden. Insbesondere in einer kleinen Elite-Boutique kann der Umsatz um ein Vielfaches höher sein als in großen Einzelhandelsgeschäften der „Masmarket“ -Klasse.
Die Tabellendaten können auf der kartesischen Ebene als Punkte M dargestellt werden1 (mit1y1), ... MHerr (mitHerryHerr) Die Lösung des Problems beschränkt sich nun auf die Auswahl der Näherungsfunktion y = f (x), bei der ein Graph so nah wie möglich an den Punkten M verläuft1, M2, ..MHerr.
Natürlich können Sie das Polynom high verwendenGrad, aber diese Option ist nicht nur schwierig zu implementieren, sondern einfach falsch, da sie nicht den Haupttrend widerspiegelt, der erkannt werden muss. Die vernünftigste Lösung besteht darin, die gerade Linie y = ax + b zu finden, die die experimentellen Daten und genauer die Koeffizienten a und b am besten approximiert.
In jeder Näherung ist die Schätzung seiner Genauigkeit von besonderer Bedeutung. Mit e bezeichnenund Differenz (Abweichung) zwischen funktionalen und experimentellen Werten für Punkt xundd.h.und = yund - f (xund).
Offensichtlich, um die Genauigkeit der Näherung zu schätzenDie Summe der Abweichungen kann verwendet werden, d. h., wenn die gerade Linie für eine ungefähre Darstellung der Abhängigkeit von X von Y gewählt wird, sollte diejenige mit dem kleinsten Wert der Summe e bevorzugt werdenund an allen betrachteten Stellen. Allerdings ist nicht alles so einfach, da neben positiven Abweichungen auch praktisch negative vorhanden sein werden.
Sie können das Problem mit den Abweichungsmodulen lösenoder ihre Quadrate. Die letztere Methode wurde am weitesten verbreitet. Es wird in vielen Bereichen verwendet, einschließlich der Regressionsanalyse (in Excel wird es mit zwei integrierten Funktionen implementiert) und hat sich seit langem als wirksam erwiesen.
Wie Sie wissen, gibt es in Excel eine integrierteAutosummenfunktion, mit der Sie die Werte aller Werte im ausgewählten Bereich berechnen können. Daher hindert uns nichts daran, den Wert des Ausdrucks zu berechnen (e12 + e22 + e32+ ... eHerr2).
In einer mathematischen Notation hat dies die Form:
Da die Entscheidung getroffen wurde, zunächst eine gerade Linie zu verwenden, haben wir:
Das Problem, die Linie zu finden, die die spezifische Abhängigkeit der Größen X und Y am besten beschreibt, besteht also darin, die Minimalfunktion zweier Variablen zu berechnen:
Dazu müssen wir partielle Ableitungen in Bezug auf die neuen Variablen a und b auf Null setzen und ein primitives System lösen, das aus zwei Gleichungen mit 2 Unbekannten der Form besteht:
Nach einigen einfachen Transformationen, einschließlich Teilen durch 2 und Manipulieren der Summen, erhalten wir:
Wenn wir es zum Beispiel mit der Cramer-Methode lösen, erhalten wir einen stationären Punkt mit bestimmten Koeffizienten a* und b*. Dies ist das Minimum, d. H. Um vorherzusagen, wie hoch der Umsatz des Geschäfts in einem bestimmten Bereich sein wird. Die gerade Linie y = a*x + b*Darstellen eines Regressionsmodells fürdas fragliche Beispiel. Natürlich können Sie das genaue Ergebnis nicht finden, aber es hilft Ihnen, eine Vorstellung davon zu bekommen, ob sich der Kauf auf das Guthaben des Geschäfts in einem bestimmten Bereich auszahlt.
"Excel" hat eine Funktion zur Berechnung des Wertesnach OLS. Es hat die folgende Form: "TREND" (bekannte Werte von Y; bekannte Werte von X; neue Werte von X; const.). Wir wenden die Formel zur Berechnung von OLS in Excel auf unsere Tabelle an.
Dazu in der Zelle, in der es sein sollDas Ergebnis der Berechnung nach der Methode der kleinsten Quadrate wird in Excel angezeigt. Geben Sie das Zeichen "=" ein und wählen Sie die Funktion "TREND". Füllen Sie im folgenden Fenster die entsprechenden Felder aus und markieren Sie Folgendes:
Zusätzlich enthält die Formel die logische Variable "Const". Wenn Sie in das entsprechende Feld 1 eingeben, bedeutet dies, dass Berechnungen durchgeführt werden sollen, vorausgesetzt, dass b = 0 ist.
Wenn Sie die Vorhersage für mehr als einen Wert von x kennen müssen, sollten Sie nach der Eingabe der Formel nicht auf "Enter" klicken, sondern die Kombination "Shift" + "Control" + "Enter" auf der Tastatur eingeben.
Möglicherweise ist sogar eine Regressionsanalyse verfügbar.Teekannen. Die Excel-Formel zur Vorhersage des Werts eines Arrays unbekannter Variablen - "TREND" - kann auch von Personen verwendet werden, die noch nie von der Methode der kleinsten Quadrate gehört haben. Kennen Sie nur einige Merkmale ihrer Arbeit. Insbesondere:
Регрессионный анализ в Excel реализуется с mit mehreren Funktionen. Eine davon heißt „PREDICTION“. Es ähnelt "TRENDS", das heißt, es erzeugt das Ergebnis von Berechnungen unter Verwendung der Methode der kleinsten Quadrate. Allerdings nur für ein X, für das der Wert von Y unbekannt ist.
Jetzt kennen Sie die Excel-Formeln für Dummies, mit denen Sie den zukünftigen Wert eines bestimmten Indikators anhand eines linearen Trends vorhersagen können.