Rechner

Box-Cox Powertransformation berechnen

Viele statistische Verfahren setzen normalverteilte Daten voraus. (Inwieweit normalverteilte Daten überhaupt und zu welchem Ausmaß wichtig sind, wird auch in zahlreichen Publikationen diskutiert, z.B. Lumley, Diehr, Emerson, & Chen, 2002; Salkind, 2010; Thode, 2002.) Wenn Daten nicht normalverteilt sind, sollte die Ursache dafür bestimmt werden und eventuell Gegenmaßnahmen ergriffen werden. Eine dieser möglichen Gegenmaßnahmen wäre die Daten mit der Box-Cox Powertransformation zu transformieren.

Was sind Transformationen?

Bei einer Transformation wird dieselbe mathematische Operation auf jeden Datensatz angewendet. Ziel ist es in der Regel, die Form der Daten zu verändern, beispielsweise damit die Verteilung der Daten symmetrischer und näher an einer Normalverteilung ist.

Man unterscheidet zwischen linearen und nicht-linearen Transformationen. Bei linearen Transformationen werden die Daten lediglich mit einem Faktor multipliziert oder es wird ein Term addiert. Diese Transformationen verändern allerdings nicht das Aussehen der Verteilung der Daten. Dafür müssen nicht-lineare Transformationen angewendet werden.

Die Box-Cox Powertransformation

Die Mathematiker George Box und David Cox entwickelten ein Verfahren, dass den passenden Exponenten λ findet, damit die Daten näher an einer Normalverteilung liegen. Der Wert von λ entspricht dem Exponenten, mit dem die Daten potenziert werden müssen. Das Verfahren sucht nach dem besten Exponenten in einem Bereich von -3 bis +3. Nachdem der Exponent gefunden wurde, müssen die Daten in SPSS noch entsprechend transformiert werden.

Funktioniert die Box-Cox Transformation immer?

Die Box-Cox Transformation ist keine Garantie für normalverteilte Daten. Um genau zu sein, versucht die Box-Cox Transformation nicht einmal, die Daten normal zu verteilen – das ist lediglich ein Nebeneffekt. Die Box-Cox Transformation sucht nach der kleinsten Standardabweichung. Die Daten mit kleinster Standardabweichung haben eine hohe Wahrscheinlichkeit symmetrischer und damit näher an einer Normalverteilung zu liegen, allerdings ist dies nicht sicher.

Box-Cox Transformation online berechnen

Einfach eine Variable aus SPSS (wie in der Einleitung unten beschrieben) in das Textfeld kopieren und λ berechnen lassen. Die Anzahl der Fälle ist auf 10.000 beschränkt. Alle Fälle darüberhinaus werden nicht berücksichtigt. Das Ergebnis wird direkt darunter eingeblendet.

Box-Cox Powertransformation berechnen

Datenauswahl von SPSS

  1. In der Datenansicht zuerst eine Variable mit einem Klick auf den Variablennamen auswählen, sodass die gesamte Variable gelb markiert ist.

    Box-Cox Variable selektieren


  2. Mit Bearbeiten > Kopieren werden die Daten in die Zwischenablage kopiert.

    Box-Cox Variable kopieren


  3. Daten dann in das Textfeld einfügen und Berechnung durchführen.

    Box-Cox Daten einfügen


Box-Cox Transformation berechnen

Nachdem wir die Box-Cox-Transformation berechnet haben, müssen wir sie noch anwenden. Dazu berechnen wir eine neue Variable:

  1. Um eine neue Variable zu berechnen, gehen wir zu Transformieren > Variable berechnen…

    Variable berechnen


  2. Es öffnet sich das Dialogfenster unten


  3. Unter Zielvariable geben wir den Namen der neuen neuen Variable ein, die berechnet wird. Bei Numerischer Ausdruck geben wir die Formel zur Berechnung ein, die der Rechner ermittelt hat.

    Variable berechnen (Gleichung eingefügt)


  4. In der Formel steht noch der Platzhalter VARIABLE, manchmal mehr als einmal. Wir müssen ihn noch gegen den Namen der Variable austauschen, die wir transformieren wollen.

    Variable berechnen (fertig ausgefüllt)


  5. Mit einem Klick auf OK wenden wir die Transformation an und berechnen die neue Variable.


Diesen Rechner zitieren

Hemmerich, W. (2016). StatistikGuru: Box-Cox Powertransformation berechnen. Retrieved from https://statistikguru.de/rechner/box-cox.html
@misc{statistikguru,
    title    = {StatistikGuru},
    subtitle = {Box-Cox Powertransformation berechnen},
    year     = {2016},
    month    = {aug},
    url      = {https://statistikguru.de/rechner/box-cox.html},
    author   = {Hemmerich, Wanja A.},
    urldate  = {2023-06-09}
}

Literaturverzeichnis

  1. Lumley, T., Diehr, P., Emerson, S., & Chen, L. (2002). The importance of the normality assumption in large public health data sets. Annual review of public health, 23, 151–169. doi:10.1146/annurev.publhealth.23.100901.140546
  2. Salkind, N. J. (2010). Encyclopedia of Research Design (Vol. 2). Los Angeles: Sage.
  3. Thode, H. C. (2002). Testing for normality. Statistics, textbooks and monographs: v. 164. New York: CRC Press.