Dies ist eine alte Version des Dokuments!
Die Varianz – meist in Verbindung mit der Standardabweichung benutzt – ist ein Dispersionsmaß und zeigt die Streuung einer Verteilung auf. Sie ist die durchschnittliche quadratische Abweichung vom arithmetischen Mittel. Sie ist ein vom Mittelpunkt abhängiger Parameter. Um die Varianz berechnen zu können, müssen die Merkmale metrisch skalierbar sein. Die Interpretation der Varianz und der daraus resultierenden Standardabweichung ist ab etwa 30 Datensätzen erlaubt. Mit weniger Datensätzen wird der ermittelte Wert nicht aussagekräftig sein.
<m>S^2=sum{i=1}{n}{(x_i - overline{x})^2}/n</m>
Gegeben sind folgende Werte zu den Einwohnerzahlen ausgewählter Städte:
Stadt | Stadtteile |
---|---|
München | 25 |
Frankfurt a.M. | 16 |
Berlin | 12 |
Köln | 9 |
Hamburg | 7 |
<m>AM = {12 + 7 + 25 + 9 + 16} / 5</m>
<m>AM = 13,8</m>
Stadt | Stadtteile | Stadtteile abzgl. arithm. Mittel |
---|---|---|
München | 25 | 11,2 (<m>25-13,8</m>) |
Frankfurt a.M. | 16 | 2,2 (<m>16-13,8</m>) |
Berlin | 12 | -1,8 (<m>12-13,8</m>) |
Köln | 9 | -4,8 (<m>9-13,8</m>) |
Hamburg | 7 | -68 (<m>7-13,8</m>) |
Stadt | Stadtteile | Stadtteile abzgl. arithm. Mittel | Quadrierung |
---|---|---|---|
München | 25 | 11,2 (<m>25-13,8</m>) | 125,44 (<m>sqrt{11,2}</m>) |
Frankfurt a.M. | 16 | 2,2 (<m>16-13,8</m>) | 4,84 (<m>sqrt{2,2}</m>) |
Berlin | 12 | -1,8 (<m>12-13,8</m>) | 3,24 (<m>sqrt{-1,8}</m>) |
Köln | 9 | -4,8 (<m>9-13,8</m>) | 23,04 (<m>sqrt{-4,8}</m>) |
Hamburg | 7 | -6,8 (<m>7-13,8</m>) | 46,24 (<m>sqrt{-6,8}</m>) |
<m>s^2 = {125,44+4,84+3,24+23,04+46,24}/5</m>
<m>s^2 = 40,56</m>
Die Varianz beträgt 40,56 „Quadratstadtteile“.
Zur Ermittlung der Standardabweichung und deren Interpretation lies hier weiter.