Unternehmensstatistik und der Vorschlag für ein Regressionsmodell

Words: 2894
Topic: Statistik

Erläuterung des Fünf-Faktoren-Modells

Die nachstehende Tabelle 1 zeigt die Regressionsstatistiken, die die Art des Regressionsmodells (das Fünf-Faktoren-Modell) beschreiben.

Aus der Tabelle geht hervor, dass der Koeffizient der multiplen Korrelation (R) ein wichtiger Wert ist, der die Art und den Grad des Zusammenhangs zwischen den unabhängigen Variablen und der abhängigen Variable anzeigt. In diesem Fall weist das Fünf-Faktoren-Regressionsmodell eine hohe positive Korrelation (0,735) auf. Der Koeffizient der Mehrfachkorrelation hat einen Wert, der zwischen null und eins liegt. Ein Koeffizient der multiplen Korrelation von eins bedeutet, dass die unabhängigen Variablen eine abhängige Variable stark vorhersagen, während ein Koeffizient der multiplen Korrelation von null bedeutet, dass die unabhängigen Variablen die abhängige Variable nicht vorhersagen. Aus dieser Sicht bedeutet die hohe positive Korrelation, dass die Kombination von SFR, LT20, GT50, GRAD und FRR die Spenden der Alumni stark vorhersagt.

Die Tabelle enthält auch ein Bestimmtheitsmaß, das R-Quadrat (R2), das erklärt, wie die analysierten Daten zum multiplen Regressionsmodell passen. Das R-Quadrat ergibt sich aus dem Quadrat von R, dem Koeffizienten der multiplen Korrelation. In diesem Fall ergibt das Quadrat von 0,735 einen Wert von 0,54, der das Bestimmtheitsmaß darstellt. Das R-Quadrat nimmt einen Wert an, der von null bis eins reicht, wobei null für keine Erklärungskraft und eins für eine hohe Erklärungskraft steht. Zu Erklärungszwecken wird der R-Quadrat-Wert in eine Prozentzahl umgerechnet, um die Klarheit und Beschreibung der Erklärungskraft zu verbessern. Der R-Quadrat-Wert von 0,54 bedeutet, dass alle unabhängigen Variablen des Modells, d. h. SFR, LT20, GT50, GRAD und FRR, 54 % der Variation bei den Spenden ehemaliger Studierender erklären. Da die unabhängigen Variablen einen individuellen Beitrag zum Modell leisten, zeigt der kombinierte Beitrag, dass 54 % der Gesamtvariation in der abhängigen Variable auf die unabhängigen Variablen im Modell zurückzuführen sind. Konkret tragen SFR, LT20, GT50, GRAD und FRR zu 54 % der Variation bei den Alumni-Spenden bei, während 46 % unerklärt bleiben. Im Wesentlichen bedeutet die Erklärungskraft von 54 %, dass SFR, LT20, GT50, GRAD und FRR die Alumni-Spenden mäßig erklären.

Da das multiple Regressionsmodell unbedeutende Prädiktoren enthalten kann, die nicht zum Modell beitragen, muss das Bestimmtheitsmaß angepasst werden, um diese Prädiktoren zu bestrafen. Das bereinigte R-Quadrat beträgt 0,52, was bedeutet, dass die unabhängigen Variablen SFR, LT20, GT50, GRAD und FRR 52 % der Variation bei den Alumni-Spenden erklären. Wie R-Quadrat nimmt auch das bereinigte R-Quadrat Werte zwischen null und eins an. In dieser Betrachtung hat das bereinigte R-Quadrat eine mäßige Erklärungskraft, was bedeutet, dass SFR, LT20, GT50, GRAD und FRR das Spendenverhalten der Alumni mäßig erklären. Da die Differenz zwischen R-Quadrat und bereinigtem R-Quadrat 0,02 beträgt, deutet dies darauf hin, dass unbedeutende Prädiktoren nur 2 % der Variation bei den Alumni-Spenden erklären. Die Beiträge der nicht signifikanten Prädiktoren sind demnach so gering, dass ihr Ausschluss aus dem Modell gerechtfertigt ist. Das bereinigte R-Quadrat zeigt also, dass SFR, LT20, GT50, GRAD und FRR signifikante Prädiktoren für Alumni-Spenden sind und die Daten somit in das multiple Regressionsmodell passen.

In der Tabelle der Regressionsstatistiken ist der Standardfehler ein zentraler Wert für die Interpretation des multiplen Regressionsmodells. Der Standardfehler misst die Genauigkeit der Vorhersagen, nämlich R, R-Quadrat und bereinigtes R-Quadrat. Da die R-Vorhersage auf eine hohe positive Korrelation zwischen den unabhängigen Variablen und der abhängigen Variable hindeutet, ist das Vorhandensein von einflussreichen Ausreißern unbekannt. Darüber hinaus zeigen das R-Quadrat und das bereinigte R-Quadrat eine mäßige Erklärungskraft der unabhängigen Variablen an, aber sie weisen nicht auf das Vorhandensein von einflussreichen Ausreißern hin. Daher ist der Standardfehler von wesentlicher Bedeutung, da er die Variation der Datenpunkte im multiplen Regressionsmodell erklärt. In diesem Fall beträgt der Standardfehler 0,056, was zeigt, dass die durchschnittliche Variation der Datenpunkte im multiplen Regressionsmodell 5,6 % beträgt. Daher erklärt die durchschnittliche Variation 5,6 % der Variabilität der Datenpunkte in der multiplen Regressionslinie, was auf eine gute Anpassung hindeutet.

Um festzustellen, ob das multiple Regressionsmodell signifikant ist, ist die Interpretation der ANOVA-Tabelle (Tabelle 2) von wesentlicher Bedeutung, da sie den F-Quotienten darstellt. Aus der Tabelle ist ersichtlich, dass das multiple Regressionsmodell statistisch signifikant ist, F(4, 95) = 28,01, p < 0,05. Aus der ANOVA-Tabelle geht hervor, dass die unabhängigen Variablen SFR, LT20, GT50, GRAD und FRR statistisch signifikante Prädiktoren für die Spenden der Alumni sind. Dies bestätigt, dass das multiple Regressionsmodell eine gute Anpassung an die analysierten Daten darstellt. Im Wesentlichen sagt das multiple Regressionsmodell die Beziehungen zwischen SFR, LT20, GT50, GRAD und FRR und den Spenden der Alumni signifikant voraus.

Statistisch signifikanter Faktor

Die Analyse der einzelnen unabhängigen Variablen zeigt, dass sie unterschiedliche prädiktive Auswirkungen auf die abhängige Variable haben. Insbesondere variieren die Vorhersageeffekte von SFR, LT20, GT50, GRAD und FRR insofern, als eine davon ein signifikanter Prädiktor ist, während die anderen unbedeutende Prädiktoren sind.

Aus Tabelle 3 ist ersichtlich, dass LT20 eine unabhängige Variable ist, die einen signifikanten Zusammenhang mit den Alumni-Spenden, der abhängigen Variable, aufweist. Da der p-Wert von LT20 0,017 beträgt, ist er kleiner als das Signifikanzniveau von 0,05 und bedeutet somit, dass LT20 ein signifikanter Prädiktor für Alumni-Spenden ist. Aus der Tabelle geht hervor, dass LT20 einen positiven Koeffizienten hat, was bedeutet, dass seine Erhöhung einen Anstieg der Alumni-Spenden bewirkt. Genauer gesagt zeigt der Koeffizient an, dass eine Erhöhung von LT20 um eine Einheit zu einem Anstieg der Alumni-Spenden um 0,152 führt, wenn alle anderen unabhängigen Variablen konstant sind.

Bei der Interpretation der Daten sollten Variablen, die statistisch nicht signifikant sind, nicht außer Acht gelassen werden, da sie einen wesentlichen Beitrag zu dem auf dem multiplen Regressionsmodell basierenden Modell leisten. Die nicht signifikanten Variablen sind SFR, GT50, GRAD und FRR, da ihre p-Werte größer als 0,05 sind. Bei der Bewertung des Einflusses einzelner unabhängiger Variablen auf die abhängigen Variablen sind die p-Werte für die Bestimmung des Einflussgrades maßgeblich. Unabhängige Variablen mit p-Werten unter 0,05 sind signifikante Prädiktoren, während unabhängige Variablen mit p-Werten über 0,05 unbedeutende Prädiktoren sind. Trotz der Tatsache, dass diese Variablen unbedeutende Prädiktoren für Alumni-Spenden sind, sollte das multiple Regressionsmodell sie bei der Vorhersage von Alumni-Spenden nicht außer Acht lassen, da sie einen unbestimmten Beitrag zum Modell leisten. Da das multiple Regressionsmodell eine gute Anpassung an die Daten bietet, ist es statistisch sinnvoll, die nicht signifikanten Prädiktoren nicht zu berücksichtigen.

Interpretation des wichtigsten Einflussfaktors auf die Spenden von Alumni

Die multiple Regressionsanalyse zeigt, dass LT20 der signifikanteste Faktor ist, der die Spenden der Alumni beeinflusst. Die Signifikanz von LT20 ergibt sich aus dem p-Wert, der kleiner als 0,05 ist. LT20 und Alumni-Spenden stehen in einem positiven Verhältnis zueinander, was bedeutet, dass beide proportional zueinander steigen oder sinken. Die Interpretation der Beziehung ist, dass ein Anstieg von LT20 um eine Einheit zu einem Anstieg der Alumni-Spenden um 0,152 führt, wenn alle anderen unabhängigen Variablen konstant bleiben. Aufgrund der statistischen Signifikanz ist LT20 der einzige Faktor, der die Variation der Alumni-Spenden signifikant vorhersagt.

Die Darstellung des Verhältnisses zwischen LT20 und den Spenden der Ehemaligen erfordert die Verwendung der Koeffizienten in Tabelle 3. Eine lineare Regressionslinie hat die Gleichung y = a + bx, die für die Vorhersage der abhängigen Variablen und die Erstellung eines Streudiagramms geeignet ist. In der Gleichung ist y die abhängige Variable, die von der unabhängigen Variable x abhängt. Das multiple Regressionsmodell hat eine Regressionsgerade mit einer Steigung b und einem Achsenabschnitt a. In diesem Fall ist y eine Funktion mit einem Achsenabschnitt von -0,197, einer Steigung von 0,152 und LT20 als abhängige Variable. Die lineare Regressionsgleichung lautet im Wesentlichen wie folgt:-

Spenden von Absolventen = -0,1971 + 0,1524LT20

Die nachstehende Tabelle 4 zeigt die Ableitungen der Regressionsgleichung und die jeweiligen Werte von LT20 und Alumni-Spenden, die beim Zeichnen der Streuung anwendbar sind.

Tabelle 4.

Aus dem Streudiagramm ist ersichtlich, dass LT20 und Alumni-Spenden eine positive Korrelation aufweisen. Die Korrelation impliziert, dass die Alumni-Spenden mit steigendem LT20 ansteigen. Aus dieser Sicht stellt das Streudiagramm des Regressionsmodells LT20 als einen signifikanten Prädiktor für Alumni-Spenden dar.

Da LT20 ein statistisch signifikanter positiver Prädiktor für Alumni-Spenden ist, sollte die Hochschule diesen Wert effektiv nutzen. Tabelle 3 zeigt, dass eine Erhöhung von LT20 um eine Einheit zu einem signifikanten Anstieg der Alumni-Spenden um 0,1524 führt. Die Hochschule sollte sich also auf die Erhöhung von LT20 konzentrieren, um einen signifikanten Anstieg der Alumni-Spenden zu erreichen. Obwohl GRAD und FRR keine signifikanten Prädiktoren für Alumni-Spenden sind, sollte die Hochschule sie erhöhen, da sie zur Vorhersage der Alumni-Spenden beitragen. Aus den jeweiligen Gradienten geht hervor, dass eine Erhöhung der Faktoren GRAD und FRR um jeweils eine Einheit zu einem Anstieg der Alumni-Spenden um 0,128 bzw. 0,260 führt. Da einige Faktoren hingegen einen negativen Einfluss auf die Alumni-Spenden haben, sollte die Hochschule diese minimieren. Aus Tabelle 3 geht hervor, dass eine Erhöhung jedes dieser Faktoren, SFR und GT50, zu einem Rückgang der Alumni-Spenden um 0,001 bzw. 0,034 führt. Diese Zahlen bedeuten, dass die Hochschule die negativen Auswirkungen dieser Faktoren minimieren muss, um die Vorteile von LT20, das die Spenden der Alumni erhöht, zu optimieren. Insgesamt sollte die Hochschule die Spenden von Alumni erhöhen, indem sie LT20 erhöht, den Einfluss von GRAD und FRR optimiert und den Einfluss von SFR und GT50 minimiert.

Anwendung der Informationen und Empfehlungen

Um das Spendenaufkommen der Alumni langfristig zu erhöhen, sollte die Hochschule jede der unabhängigen Variablen nutzen, da sie einen gewissen Einfluss auf die Spenden der Alumni haben. Die Regressionsstatistik in Tabelle 1 liefert wertvolle Informationen über das multiple Regressionsmodell. Aus der Tabelle geht hervor, dass der Koeffizient der multiplen Korrelation sehr hoch ist, was bedeutet, dass die unabhängigen Variablen SFR, LT20, GT50, GRAD und FRR eine hohe multiple Korrelation mit den Alumni-Spenden aufweisen. Die Stärke der Mehrfachkorrelation ist eine zwingende Unterstützung für die Entscheidung, jede der unabhängigen Variablen zur Steigerung der Alumni-Spenden einzusetzen. Wäre der Koeffizient der multiplen Korrelation kleiner als 0,5 gewesen, hätte dies bedeutet, dass die Korrelation mäßig oder schwach ist und somit anfällig für den Einfluss von Nicht-Prädiktoren sein könnte. Daher ist der Koeffizient der multiplen Korrelation von 0,735 hoch genug, um die Entscheidung zu unterstützen, jede unabhängige Variable des Modells, die die Alumni-Spenden bestimmt, zu nutzen. Die Verwendung des Koeffizienten der multiplen Korrelation ist realistisch, da er ein starker Prädiktor für die Beziehungen zwischen den Variablen im multiplen Regressionsmodell ist.

Das R-Quadrat ist ein weiterer wichtiger Koeffizient in der Tabelle mit den Regressionsstatistiken, da er den Prozentsatz der Variation bei den Alumni-Spenden angibt, den die unabhängigen Variablen zusammen erklären. In diesem Fall erklären SFR, LT20, GT50, GRAD und FRR 54 % der Variation bei den Alumni-Spenden. Entscheidend ist, dass die Erklärungskraft der unabhängigen Variablen ausreicht, um die Entscheidung zu stützen, alle unabhängigen Variablen zu nutzen. In Anbetracht der Tatsache, dass das Vorhandensein unabhängiger Variablen, die keinen Beitrag zum Modell leisten, die Erklärungskraft dieser Variablen verringert, ist die Erklärungskraft von 54 % erheblich. In diesem Fall stützt die Erklärungskraft von 54 % die Entscheidung, alle unabhängigen Variablen für die langfristige Steigerung der Alumni-Spenden zu nutzen. Offensichtlich ist es realistisch, das Modell zur Erhöhung der Alumni-Spenden anzuwenden, da die Erklärungskraft von 54 % moderat ist und einen Einfluss auf die Alumni-Spenden hat.

Das bereinigte R-Quadrat ist ein wichtiger Koeffizient der Regressionsanalyse, mit dem die Auswirkungen von Nicht-Prädiktoren im Modell berücksichtigt werden. Das bereinigte R-Quadrat beträgt in diesem Fall 0,52, was darauf hindeutet, dass die Erklärungskraft der echten unabhängigen Variablen abzüglich der vorgetäuschten unabhängigen Variablen 52 % beträgt. Die Erklärungskraft von 52 % ist also gewichtig, denn sie erklärt mehr als die Hälfte der Schwankungen bei den Spenden der Alumni. Die Verwendung von 52 % als Erklärungskraft ist realistisch und unterstützt die Entscheidung, unabhängige Variablen zu nutzen. Die Differenz zwischen dem R-Quadrat und dem bereinigten R-Quadrat gibt wertvolle Informationen über das Vorhandensein von Rauschen in den unabhängigen Variablen. Wenn die Differenz groß ist, bedeutet dies, dass das Modell viele unabhängige Variablen enthält, die keinen Beitrag zum Modell leisten. Wenn die Differenz klein ist, bedeutet dies, dass das Modell keine oder nur eine minimale Anzahl von Variablen enthält, die nicht zum Modell beitragen. In diesem Fall bedeutet die Differenz von 0,02, dass die unabhängigen Variablen ein Rauschen von 2 % erklären, das die Spenden der Absolventen nicht vorhersagt. Die geringe Differenz zwischen R-Quadrat und bereinigtem R-Quadrat spricht also für die Entscheidung, alle unabhängigen Variablen zu nutzen, um die Spenden der Alumni zu optimieren.

Aus der Tabelle mit den Regressionsstatistiken geht hervor, dass der Standardfehler die Entscheidung unterstützt, alle unabhängigen Variablen zu nutzen. Der Standardfehler deutet darauf hin, dass das Modell bei der Vorhersage von Alumni-Spenden genau ist, denn er zeigt, dass es keine signifikanten Ausreißer gibt, die die Regressionsgleichung stören oder verzerren könnten. Im Wesentlichen zeigt der Standardfehler, dass die mittlere Variation der Datenpunkte im multiplen Regressionsmodell 0,056 beträgt, was bedeutet, dass die mittlere Variation 5,6 % der Variabilität der Datenpunkte erklärt. Der Standardfehler deutet darauf hin, dass Ausreißer keinen wesentlichen Einfluss auf das Modell haben und das Modell daher bei der Vorhersage von Spenden ehemaliger Studierender genau und präzise ist. In diesem Fall ist es empfehlenswert, das Modell für die Vorhersage von Alumni-Spenden unter Verwendung der unabhängigen Variablen zu verwenden, da der Standardfehler vernachlässigbar ist und keinen Einfluss auf das Modell hat.

Tabelle 1 zeigt, dass der multiple Korrelationskoeffizient hoch, das R-Quadrat moderat, das bereinigte R-Quadrat stabil und der Standardfehler vernachlässigbar ist und somit die Verwendung des Modells zur Vorhersage von Alumni-Spenden unterstützt. Grundsätzlich unterstützt die vorläufige multiple Regressionsanalyse die Entscheidung, alle unabhängigen Variablen zur Erhöhung der Alumni-Spenden einzusetzen. Die ANOVA-Tabelle liefert überzeugende Beweise, die die Entscheidung zur Nutzung unabhängiger Variablen unterstützen, da das multiple Regressionsmodell statistisch signifikant ist, F(4, 95) = 28,01, p < 0,001. Der p-Wert von weniger als 0,001 bedeutet, dass das Modell statistisch signifikant ist und praktisch keine Chance auf ein zufälliges Auftreten hat. Daher empfiehlt die Analyse der Hochschule die Verwendung des multiplen Regressionsmodells zur Vorhersage der Spenden von Ehemaligen, da die unabhängigen Variablen zusammen einen statistisch signifikanten Beitrag zum Modell leisten.

Da die einzelnen unabhängigen Variablen einen Beitrag zum Modell leisten, gibt die Regressionsanalyse für jede von ihnen Aufschluss über die Bedeutung ihres Beitrags. Tabelle 3, die die Koeffizienten der einzelnen Variablen enthält, zeigt, dass LT20 eine unabhängige Variable ist, die den größten Einfluss auf die Spenden der Alumni hat und statistisch signifikant ist. Der p-Wert von LT20 beträgt 0,017 und liegt damit unter dem Signifikanzniveau von 0,05, was ihn zu einem sehr bemerkenswerten Prädiktor für Alumni-Spenden macht. LT20 hat einen Koeffizienten von 0,1524, was eine positive Korrelation mit Alumni-Spenden bedeutet. Außerdem bedeutet der Koeffizient, dass für jede Einheit, um die LT20 ansteigt, die Spenden der Alumni um 0,1524 steigen, wenn alle anderen unabhängigen Variablen konstant sind. Das Streudiagramm veranschaulicht die Beziehung zwischen LT20 und Alumni-Spenden und unterstützt somit die Erhöhung von LT20 als robusten Prädiktor für Alumni-Spenden. Die Interpretation der Daten empfiehlt der Hochschule, sich auf die Erhöhung von LT20 zu konzentrieren, um die Spenden der Alumni zu steigern, da LT20 ein signifikanter Prädiktor für die Spenden der Alumni ist.

Die Hochschule sollte auch GRAD, FRR, SFR und GT50 bei der Erhöhung der Alumni-Spenden berücksichtigen, da sie einen wesentlichen Beitrag zum Modell leisten. GRAD und FRR sind zwei unabhängige Variablen, die eine positive Korrelation mit Alumni-Spenden aufweisen, aber sie sind statistisch signifikante Prädiktoren. Die Interpretation zeigt, dass eine Erhöhung von GRAD und FRR um eine Einheit zu einem Rückgang der Alumni-Spenden um 0,128 bzw. 0,260 führt. Im Gegensatz dazu sind SFR und GT50 zwei unabhängige Variablen, die einen negativen Einfluss auf die Alumni-Spenden haben. Die Interpretation zeigt, dass ein Anstieg der SFR und GT50 um eine Einheit zu einem Rückgang der Alumni-Spenden um 0,001 bzw. 0,034 führt. Die Korrelationswerte bedeuten, dass die Hochschule GRAD und FRR maximieren sollte, da sie eine positive Korrelation aufweisen, und SFR und GT50 minimieren sollte, da sie eine negative Korrelation mit Alumni-Spenden aufweisen. Diese Empfehlungen sind realistisch, da sie auf statistischen Zahlen und einem Regressionsmodell beruhen. Die Hochschule muss Variablen nutzen, die statistisch unbedeutend sind, weil sie zum Modell beitragen.

Da GRAD, FRR, SFR und GT50 statistisch signifikante Prädiktoren für Alumni-Spenden sind, leisten sie gemeinsam einen statistisch signifikanten Beitrag zum Modell. Die multiple Regressionsanalyse zeigt, dass R, R-Quadrat, bereinigtes R-Quadrat, Standardfehler und F-Statistik robuste Daten liefern, die die Einbeziehung und Verwendung aller unabhängigen Variablen bei der Vorhersage von Alumni-Spenden unterstützen. Diese Daten sind überzeugend, weil es keine zusätzlichen Informationen gibt, die eine schrittweise Regression, Rückwärtselimination und Vorwärtsselektion zeigen. Die zusätzlichen Informationen hätten die Eignung der verschiedenen Modelle aufgezeigt und somit schlüssige Beweise für das Optimierungsverfahren des Modells geliefert. Aus dieser Sicht sollte die Hochschule die unabhängigen Variablen nutzen, um die Spenden der Alumni zu erhöhen.