Was ist der Unterschied zwischen Varianz und Standardabweichung?


Antwort 1:

Das zentrale Tendenzmittel gibt Ihnen die Vorstellung vom Durchschnitt der Datenpunkte (dh der zentralen Position der Verteilung).

Und jetzt möchten Sie wissen, wie weit Ihre Datenpunkte vom Mittelwert entfernt sind

Hier kommt also das Konzept der Varianz, um zu berechnen, wie weit Ihre Datenpunkte vom Mittelwert entfernt sind (in einfachen Worten, um die Variation Ihrer Datenpunkte vom Mittelwert zu berechnen).

Populationsvarianz:

i=1n(xiμ)2N\sum\limits_{i=1}^n \frac{(x_i-\mu)^2}{N}

Stichprobenvarianz:

i=1n(xix)2n1\sum\limits_{i=1}^n \frac{(x_i-\overline{x})^2}{n-1}

Die Standardabweichung ist einfach die Quadratwurzel der Varianz. Die Standardabweichung wird auch verwendet, um die Variation Ihrer Datenpunkte zu berechnen

(Und Sie fragen sich vielleicht, warum wir die Standardabweichung verwenden, wenn wir Varianz haben. Denn um die Berechnungen in denselben Einheiten zu halten, nehmen wir an, der Mittelwert ist in

cm/m,cm/m,

dann ist die Varianz in

cm2/m2cm^2/m^2

, während die Standardabweichung in ist

cm/mcm/m

, also verwenden wir meistens Standardabweichung)

Bevölkerungsstandardabweichung:

i=1n(xiμ)2N\sqrt{\sum\limits_{i=1}^n \frac{(x_i-\mu)^2}{N}}

Standardabweichung der Stichprobe:

i=1n(xix)2n1 \sqrt{\sum\limits_{i=1}^n \frac{(x_i-\overline{x})^2}{n-1}}


Antwort 2:

Die Standardabweichung ist in den ursprünglichen Maßeinheiten angegeben und daher von praktischer Relevanz. Es beschreibt den typischen Betrag, um den Werte vom Mittelwert abweichen.

Die Varianz wird in quadratischen Einheiten angegeben, sodass sie für die tatsächliche Beschreibung von Daten wenig hilfreich ist. Es ist wirklich nur als kritische Komponente von Verfahren nützlich, die analysieren, wie mehrere Variablen zusammenhängen, wie z. B. ANOVA, lineare Regression usw. Im Wesentlichen hat die Arbeit mit Summen quadratischer Abweichungen, die der Zähler der Varianzformel sind, bessere mathematische Eigenschaften.


Antwort 3:

Die Standardabweichung ist in den ursprünglichen Maßeinheiten angegeben und daher von praktischer Relevanz. Es beschreibt den typischen Betrag, um den Werte vom Mittelwert abweichen.

Die Varianz wird in quadratischen Einheiten angegeben, sodass sie für die tatsächliche Beschreibung von Daten wenig hilfreich ist. Es ist wirklich nur als kritische Komponente von Verfahren nützlich, die analysieren, wie mehrere Variablen zusammenhängen, wie z. B. ANOVA, lineare Regression usw. Im Wesentlichen hat die Arbeit mit Summen quadratischer Abweichungen, die der Zähler der Varianzformel sind, bessere mathematische Eigenschaften.