/ / Regressionsanalyse in Excel

Regressionsanalyse in Excel

R Quadrat | Bedeutung F und P-Werte | Koeffizienten | Residuen

In diesem Beispiel lernen Sie, wie Sie a ausführen Regression Analyse in Excel und wie man die Zusammenfassungsausgabe interpretiert.

Nachfolgend finden Sie unsere Daten. Die große Frage ist: Gibt es eine Beziehung zwischen Quantity Sold (Output) und Price and Advertising (Input). Mit anderen Worten: Können wir die verkaufte Menge vorhersagen, wenn wir Preis und Werbung kennen?

Regressionsdaten in Excel

1. Klicken Sie auf der Registerkarte Daten in der Gruppe Analyse auf Datenanalyse.

Klicken Sie auf Datenanalyse

Hinweis: Sie können die Schaltfläche Datenanalyse nicht finden. Klicken Sie hier, um das Analyse-ToolPak-Add-In zu laden.

2. Wählen Sie Regression, und klicken Sie auf OK.

Wählen Sie Regression

3. Wählen Sie die Option Y Reichweite (A1: A8). Dies ist die Prädiktorvariable (auch abhängige Variable genannt).

4. Wählen Sie die Option X Bereich (B1: C8). Dies sind die erklärenden Variablen (auch als unabhängige Variablen bezeichnet). Diese Spalten müssen nebeneinander liegen.

5. Überprüfen Sie die Etiketten.

6. Klicken Sie in das Feld Ausgabebereich und wählen Sie Zelle A11 aus.

7. Überprüfen Sie Residuen.

8. Klicken Sie auf OK.

Regression Eingang und Ausgang

Excel erzeugt die folgende Zusammenfassung Ausgabe (auf 3 Dezimalstellen gerundet).

R Quadrat

R Quadrat ist gleich 0.962das passt sehr gut. 96% der Variation in Quantity Sold wird durch die unabhängigen Variablen Preis und Werbung erklärt. Je näher es an 1 liegt, desto besser passt die Regressionslinie (lesen) zu den Daten.

R Quadrat

Signifikanz F und P-Werte

Um zu überprüfen, ob Ihre Ergebnisse zuverlässig sind (statistisch signifikant), sehen Sie sich die Bedeutung F (0.001). Wenn dieser Wert kleiner als 0,05 ist, sind Sie in Ordnung. Wenn die Signifikanz F größer als 0,05 ist, ist es wahrscheinlich besser, diese Menge unabhängiger Variablen nicht mehr zu verwenden. Löschen Sie eine Variable mit einem hohen P-Wert (größer als 0,05) und führen Sie die Regression erneut durch, bis die Signifikanz F unter 0,05 fällt.

Die meisten oder alle P-Werte sollten unter 0,05 liegen. In unserem Beispiel ist dies der Fall. (0.000, 0.001 und 0.005).

Anova

Koeffizienten

Die Regressionslinie lautet: y = Menge Verkauft = 8536.214 -835.722 * Preis + 0.592 * Werbung. Mit anderen Worten, für jede Preissteigerung der Einheit sinkt die verkaufte Menge mit 835.722 Einheiten. Für jede Erhöhung der Werbefläche steigt die verkaufte Menge um 0,592 Einheiten. Dies ist eine wertvolle Information.

Sie können diese Koeffizienten auch für a verwendenPrognose. Beispiel: Wenn der Preis 4 Euro und die Werbung 3000 Euro entspricht, können Sie möglicherweise eine verkaufte Menge von 8536,214 -835,722 * 4 + 0,592 * 3000 = 6970 erzielen.

Residuen

Die Residuen zeigen Ihnen, wie weit entfernt das tatsächlicheDatenpunkte sind aus den vorhergesagten Datenpunkten (unter Verwendung der Gleichung). Zum Beispiel ist der erste Datenpunkt gleich 8500. Unter Verwendung der Gleichung ist der vorhergesagte Datenpunkt gleich 8536,214 -835,722 · 2 + 0,592 · 2800 = 8523,009, was einen Rest von 8500 - 8523,009 = ergibt -23.009.

Residuen

Sie können auch ein Streudiagramm dieser Residuen erstellen.

Streudiagramm

Lesen Sie auch: