Die Varianz – meist in Verbindung mit der Standardabweichung benutzt – ist ein Dispersionsmaß und zeigt die Streuung einer Verteilung auf. Sie ist die durchschnittliche quadratische Abweichung vom arithmetischen Mittel. Sie ist ein vom Mittelpunkt abhängiger Parameter. Um die Varianz berechnen zu können, müssen die Merkmale metrisch skalierbar sein. Die Interpretation der Varianz und der daraus resultierenden Standardabweichung ist ab etwa 30 Datensätzen verlässlich; mit weniger Datensätzen wird der ermittelte Wert nicht aussagekräftig sein.
<m>S^2=sum{i=1}{n}{(x_i - overline{x})^2}/n</m>
Gegeben sind folgende Werte zu den Einwohnerzahlen ausgewählter Städte:
Stadt | Stadtteile |
---|---|
München | 25 |
Frankfurt a.M. | 16 |
Berlin | 12 |
Köln | 9 |
Hamburg | 7 |
<m>AM = {12 + 7 + 25 + 9 + 16} / 5</m>
<m>AM = 13,8</m>
Stadt | Stadtteile | Stadtteile abzgl. arithm. Mittel |
---|---|---|
München | 25 | 11,2 (<m>25-13,8</m>) |
Frankfurt a.M. | 16 | 2,2 (<m>16-13,8</m>) |
Berlin | 12 | -1,8 (<m>12-13,8</m>) |
Köln | 9 | -4,8 (<m>9-13,8</m>) |
Hamburg | 7 | -68 (<m>7-13,8</m>) |
Stadt | Stadtteile | Stadtteile abzgl. arithm. Mittel | Quadrierung |
---|---|---|---|
München | 25 | 11,2 (<m>25-13,8</m>) | 125,44 (<m>sqrt{11,2}</m>) |
Frankfurt a.M. | 16 | 2,2 (<m>16-13,8</m>) | 4,84 (<m>sqrt{2,2}</m>) |
Berlin | 12 | -1,8 (<m>12-13,8</m>) | 3,24 (<m>sqrt{-1,8}</m>) |
Köln | 9 | -4,8 (<m>9-13,8</m>) | 23,04 (<m>sqrt{-4,8}</m>) |
Hamburg | 7 | -6,8 (<m>7-13,8</m>) | 46,24 (<m>sqrt{-6,8}</m>) |
<m>s^2 = {125,44+4,84+3,24+23,04+46,24}/5</m>
<m>s^2 = 40,56</m>
Die Varianz beträgt in diesem Beispiel 40,56 „Quadratstadtteile“.
Hier findest du Informationen zur Ermittlung und Interpretation der Standardabweichung.