Rechner

Johnson Transformation berechnen

Viele statistische Verfahren setzen normalverteilte Daten voraus. (Inwieweit normalverteilte Daten überhaupt und zu welchem Ausmaß wichtig sind, wird auch in zahlreichen Publikationen diskutiert, z.B. Lumley, Diehr, Emerson, & Chen, 2002; Salkind, 2010; Thode, 2002.) Wenn Daten nicht normalverteilt sind, sollte die Ursache dafür bestimmt werden und eventuell Gegenmaßnahmen ergriffen werden. Eine dieser möglichen Gegenmaßnahmen wäre die Daten mit der Johnson Transformation zu transformieren.

Was sind Transformationen?

Bei einer Transformation wird dieselbe mathematische Operation auf jeden Datensatz angewendet. Ziel ist es in der Regel, die Form der Daten zu verändern, beispielsweise damit die Verteilung der Daten symmetrischer und näher an einer Normalverteilung ist.

Man unterscheidet zwischen linearen und nicht-linearen Transformationen. Bei linearen Transformationen werden die Daten lediglich mit einem Faktor multipliziert oder es wird ein Term addiert. Diese Transformationen verändern allerdings nicht das Aussehen der Verteilung der Daten. Dafür müssen nicht-lineare Transformationen angewendet werden.

Die Johnson Transformation

Die Johnson Transformation ist eigentlich nicht nur eine, sondern eine ganze Familie von verschiedenen Transformationen, die speziell dafür entwickelt wurden, Daten so zu transformieren, dass sie mehr einer Normalverteilung entsprechen. Der Algorithmus versucht die optimale Formal mit optimalen Parametern zu ermitteln.

Neben der Johnson Transformation, existiert noch die Box-Cox Transformation. Die Box-Cox Transformation versucht allerdings nicht die Daten so zu optimieren, dass sie normal verteilt sind. Dass die Daten näher an einer Normalverteilung liegen, ist lediglich ein Nebeneffekt der Box-Cox Transformation.

Funktioniert die Johnson Transformation immer?

Auch wenn die Johnson Transformation expliziert versucht, die Daten normal zu verteilen, ist sie keine Garantie dafür. In einigen Fällen wird eine Anwendung der Transformation sogar den gegenteiligen Effekt haben. In solchen Fällen wird die Rechner allerdings keine Formel zur Transformation ausgeben. Wir testen immer die Originaldaten und die Transformierten Daten auf Normalverteilung mit dem Anderson-Darling Test. Sind die transformierten weniger normalverteilt, wird keine Formel angegeben. In solchen Fällen empfiehlt es sich, noch einmal die Box-Cox Transformation zu berechnen.

Johnson Transformation online berechnen

Einfach eine Variable aus SPSS (wie in der Einleitung unter beschrieben) in das Textfeld kopieren und die Transformationsformel berechnen lassen. Die Anzahl der Fälle ist auf 10.000 beschränkt. Alle Fälle darüber hinaus werden nicht berücksichtigt. Das Ergebnis wird direkt darunter eingeblendet.

Johnson Transformation berechnen

Datenauswahl von SPSS

  1. In der Datenansicht zuerst eine Variable mit einem Klick auf den Variablennamen auswählen, sodass die gesamte Variable gelb markiert ist.

    Box-Cox Variable selektieren


  2. Mit Bearbeiten > Kopieren werden die Daten in die Zwischenablage kopiert.

    Box-Cox Variable kopieren


  3. Daten dann in das Textfeld einfügen und Berechnung durchführen.

    Box-Cox Daten einfügen


Johnson Transformation berechnen

Nachdem wir die  Johnson Transformation berechnet haben, müssen wir sie noch anwenden. Dazu berechnen wir eine neue Variable:

  1. Um eine neue Variable zu berechnen, gehen wir zu Transformieren > Variable berechnen…

    Variable berechnen


  2. Es öffnet sich das Dialogfenster unten


  3. Unter Zielvariable geben wir den Namen der neuen neuen Variable ein, die berechnet wird. Bei Numerischer Ausdruck geben wir die Formel zur Berechnung ein, die der Rechner ermittelt hat.

    Variable berechnen (Gleichung eingefügt)


  4. In der Formel steht noch der Platzhalter VARIABLE, manchmal mehr als einmal. Wir müssen ihn noch gegen den Namen der Variable austauschen, die wir transformieren wollen.

    Variable berechnen (fertig ausgefüllt)


  5. Mit einem Klick auf OK wenden wir die Transformation an und berechnen die neue Variable.

Literaturverzeichnis

  1. Lumley, T., Diehr, P., Emerson, S., & Chen, L. (2002). The importance of the normality assumption in large public health data sets. Annual review of public health, 23, 151–169. doi:10.1146/annurev.publhealth.23.100901.140546
  2. Salkind, N. J. (2010). Encyclopedia of Research Design (Vol. 2). Los Angeles: Sage.
  3. Thode, H. C. (2002). Testing for normality. Statistics, textbooks and monographs: v. 164. New York: CRC Press.