Box-Cox Powertransformation berechnen
Viele statistische Verfahren setzen normalverteilte Daten voraus. (Inwieweit normalverteilte Daten überhaupt und zu welchem Ausmaß wichtig sind, wird auch in zahlreichen Publikationen diskutiert, z.B. Lumley, Diehr, Emerson, & Chen, 2002; Salkind, 2010; Thode, 2002.) Wenn Daten nicht normalverteilt sind, sollte die Ursache dafür bestimmt werden und eventuell Gegenmaßnahmen ergriffen werden. Eine dieser möglichen Gegenmaßnahmen wäre die Daten mit der Box-Cox Powertransformation zu transformieren.
Was sind Transformationen?
Bei einer Transformation wird dieselbe mathematische Operation auf jeden Datensatz angewendet. Ziel ist es in der Regel, die Form der Daten zu verändern, beispielsweise damit die Verteilung der Daten symmetrischer und näher an einer Normalverteilung ist.
Man unterscheidet zwischen linearen und nicht-linearen Transformationen. Bei linearen Transformationen werden die Daten lediglich mit einem Faktor multipliziert oder es wird ein Term addiert. Diese Transformationen verändern allerdings nicht das Aussehen der Verteilung der Daten. Dafür müssen nicht-lineare Transformationen angewendet werden.
Die Box-Cox Powertransformation
Die Mathematiker George Box und David Cox entwickelten ein Verfahren, dass den passenden Exponenten λ findet, damit die Daten näher an einer Normalverteilung liegen. Der Wert von λ entspricht dem Exponenten, mit dem die Daten potenziert werden müssen. Das Verfahren sucht nach dem besten Exponenten in einem Bereich von -3 bis +3. Nachdem der Exponent gefunden wurde, müssen die Daten in SPSS noch entsprechend transformiert werden.
Funktioniert die Box-Cox Transformation immer?
Die Box-Cox Transformation ist keine Garantie für normalverteilte Daten. Um genau zu sein, versucht die Box-Cox Transformation nicht einmal, die Daten normal zu verteilen – das ist lediglich ein Nebeneffekt. Die Box-Cox Transformation sucht nach der kleinsten Standardabweichung. Die Daten mit kleinster Standardabweichung haben eine hohe Wahrscheinlichkeit symmetrischer und damit näher an einer Normalverteilung zu liegen, allerdings ist dies nicht sicher.
Box-Cox Transformation online berechnen
Einfach eine Variable aus SPSS (wie in der Einleitung unten beschrieben) in das Textfeld kopieren und λ berechnen lassen. Die Anzahl der Fälle ist auf 10.000 beschränkt. Alle Fälle darüberhinaus werden nicht berücksichtigt. Das Ergebnis wird direkt darunter eingeblendet.
Datenauswahl von SPSS
- In der Datenansicht zuerst eine Variable mit einem Klick auf den Variablennamen auswählen, sodass die gesamte Variable gelb markiert ist.
- Mit Bearbeiten > Kopieren werden die Daten in die Zwischenablage kopiert.
- Daten dann in das Textfeld einfügen und Berechnung durchführen.
Box-Cox Transformation berechnen
Nachdem wir die Box-Cox-Transformation berechnet haben, müssen wir sie noch anwenden. Dazu berechnen wir eine neue Variable:
- Um eine neue Variable zu berechnen, gehen wir zu Transformieren > Variable berechnen…
- Es öffnet sich das Dialogfenster unten
- Unter Zielvariable geben wir den Namen der neuen neuen Variable ein, die berechnet wird. Bei Numerischer Ausdruck geben wir die Formel zur Berechnung ein, die der Rechner ermittelt hat.
- In der Formel steht noch der Platzhalter
VARIABLE
, manchmal mehr als einmal. Wir müssen ihn noch gegen den Namen der Variable austauschen, die wir transformieren wollen. - Mit einem Klick auf wenden wir die Transformation an und berechnen die neue Variable.
Diesen Rechner zitieren
@misc{statistikguru, title = {StatistikGuru}, subtitle = {Box-Cox Powertransformation berechnen}, year = {2016}, month = {aug}, url = {https://statistikguru.de/rechner/box-cox.html}, author = {Hemmerich, Wanja A.}, urldate = {2023-06-09} }
Literaturverzeichnis
- Lumley, T., Diehr, P., Emerson, S., & Chen, L. (2002). The importance of the normality assumption in large public health data sets. Annual review of public health, 23, 151–169. doi:10.
1146/ annurev. publhealth. 23. 100901. 140546 - Salkind, N. J. (2010). Encyclopedia of Research Design (Vol. 2). Los Angeles: Sage.
- Thode, H. C. (2002). Testing for normality. Statistics, textbooks and monographs: v. 164. New York: CRC Press.