Korrelationskoeffizienten und Winkel

09.03.2020 - Tim David Brachwitz
In diesem Blogpost versuche ich zu zeigen, dass Winkel aus der linearen Algebra und der Korrelationskoeffizient aus der Stochastik quasi dasselbe mathematische Konzept inne haben. In der linearen Algebra werden Winkel zwischen Vektoren mithilfe von Skalarprodukten und deren induzierten Normen beschrieben. Seien und zwei Vektoren aus , dann ist der Winkel dieser beiden Vektoren mit der Formel
berechnbar, wobei den Betrag, also die Länge eines Vektors und das Skalarprodukt darstellt.
Seien konkret und .
Beide Vektoren im Koordinatensystem
Beide Vektoren im Koordinatensystem
Wir rechnen einfach mal den Winkel zwischen diesen beiden Vektoren aus.
Das Skalarprodukt ist übrigens wie folgt definiert:
Also für und . Produkt der ersten Zeile plus Produkt der zweiten Zeile: .

Für allgemeine Vektoren und deren Winkel führt man ein allgemeines Skalarprodukt definiert werden. Man bezeichnet es mit dieser Notation.
Jedes Skalarprodukt induziert gleichzeitig eine Norm. Die Norm berechnet uns die Länge des Vektors. Dazu nehmen wir einfach die Wurzel aus dem Skalarprodukt mit sich selber.
Dann ist ein allgemeiner Winkel durch die Gleichung
definiert.

Jetzt kommt ein wenig Wahrscheinlichkeitstheorie dazu.
Seien und zwei Zufallsvariablen, dann ist der Korrelationskoeffizient definiert als
Führen wir nun ein konkretes Skalarprodukt für Zufallsvariablen ein.

Seien und zentriert, also und . Dann stellt sich heraus, dass
gilt. Das heißt, dass das Skalarprodukt und die Kovarianz von zwei zentrierten Zufallsvariablen übereinstimmen. Die Kovarianz einer Zufallsvariable mit sich selbst ist die Varianz
Mit diesem Wissen können wir den Korrelationskoeffizienten in folgender allgemeinen Form schreiben:
kann man als Winkel zwischen und interpretieren. Zufallsvariablen sind daher genau dann unkorreliert, wenn sie orthogonal aufeinander stehen. Daher findet man in der Literatur auch die Schreibweise als Zeichen für Unkorreliertheit oder auch Unabhängigkeit. Wir haben damit die geometrische Anschauung von Vektoren und deren Winkel aus der linearen Algebra auf Zufallsvariablen und Korrelation übertragen.

Zum Schluss können wir noch einsehen, dass die Rechenregel für zwei unkorrelierte, also senkrecht aufeinander stehende, Zufallsvariablen dem Satz des Pythagoras entspricht.

Wir können noch einen letzten Schritt machen und die Annahme der Unkorreliertheit bzw. der Orthogonalität fallen lassen. Für beliebige Zufallsvariablen ist
also der Kosinussatz
Wir können schreiben als