º£½ÇÖ±²¥

Deskriptivstatistik

²Ñ²¹ÃŸ±ð

²Ñ²¹ÃŸ±ð der zentralen Tendenz und ¶Ù¾±²õ±è±ð°ù²õ¾±´Ç²Ô²õ³¾²¹ÃŸ±ð sind grundlegende Konzepte der Deskriptivstatistik, die verwendet werden, um Datenmengen zu beschreiben und zu analysieren.

²Ñ²¹ÃŸ±ð der zentralen Tendenz geben an, wo der "Mittelpunkt" einer Datenverteilung liegt. Die bekanntesten ²Ñ²¹ÃŸ±ð sind:

    •    Arithmetisches Mittel (Durchschnitt): Die Summe aller Werte, geteilt durch die Anzahl der Werte.

    •    º£½ÇÖ±²¥n: Der Wert, der in einer sortierten Datenreihe in der Mitte liegt, also 50 % der Werte über und 50 % der Werte unter sich hat.

    •    Modus: Der am häufigsten vorkommende Wert in einer Datenreihe.

 

¶Ù¾±²õ±è±ð°ù²õ¾±´Ç²Ô²õ³¾²¹ÃŸ±ð (oder Streuungsmaße) geben Auskunft darüber, wie stark die Daten um den Mittelpunkt streuen, also wie "breit" die Verteilung ist. Wichtige ¶Ù¾±²õ±è±ð°ù²õ¾±´Ç²Ô²õ³¾²¹ÃŸ±ð sind:

    •    Spannweite: Der Unterschied zwischen dem größten und dem kleinsten Wert.

    •    Varianz: Das durchschnittliche Quadrat der Abweichungen der Werte vom arithmetischen Mittel, was die Streuung in den Daten beschreibt.

    •    Standardabweichung: Die Quadratwurzel der Varianz, die das Ausmaß der Streuung in derselben Einheit wie die Daten angibt.

 

Diese ²Ñ²¹ÃŸ±ð helfen, die Eigenschaften einer Datenverteilung besser zu verstehen und zu interpretieren.

Je nach Skalenniveau dürfen unterschiedliche ²Ñ²¹ÃŸ±ð verwendet werden.

Skalenniveau²Ñ²¹ÃŸ±ð der zentralen Tendenz¶Ù¾±²õ±è±ð°ù²õ¾±´Ç²Ô²õ³¾²¹ÃŸ±ð
NominalskalaModusKeine
OrdinalskalaModus, º£½ÇÖ±²¥nSpannweite
IntervallskalaModus, º£½ÇÖ±²¥n, Arithmetisches MittelSpannweite, Varianz, Standardabweichung
³Õ±ð°ù³óä±ô³Ù²Ô¾±²õ²õ°ì²¹±ô²¹Modus, º£½ÇÖ±²¥n, Arithmetisches MittelSpannweite, Varianz, Standardabweichung, Variationskoeffizient

 

Tutorials von Björn Walther:  

Excel:  

SPSS:  

R:  


Grafiken

Balkendiagramm (Bar Chart):

      •    Verwendet, um kategoriale und ordinale Daten darzustellen (Skalenniveau: Nominal, Ordinal)

      •    Die Höhe (oder Länge) der Balken repräsentiert die Häufigkeit einer Kategorie

      •    Besonders nützlich für den Vergleich von verschiedenen Kategorien

Tutorials

Excel: ;

SPSS:   (Tutorials von Björn Walther)

R:

Histogramm:

      •    Eine spezielle Form des Balkendiagramms, das kontinuierliche Daten in Intervallen (Klassen) darstellt (Skalenniveau: Metrisch)

      •    Die Höhe der Balken zeigt an, wie viele Datenpunkte in jedes Intervall fallen

      •    Verwendet, um die Verteilung einer numerischen Variable darzustellen

Tutorials

Excel: ;

SPSS:  

R:

Kreisdiagramm (Pie Chart):

      •    Zeigt die relative Häufigkeit oder den Anteil jeder Kategorie in einem Datensatz (Skalenniveau: Nominal)

      •    Der Kreis ist in Segmente unterteilt, wobei die Größe jedes Segments dem Anteil der jeweiligen Kategorie entspricht

      •    Eignet sich gut für die Darstellung von Anteilen in einer Gesamtheit

Tutorials

Excel:

SPSS:  

R:

Boxplot (Box-and-Whisker Plot):

      •    Verwendet, um die Verteilung einer numerischen Variable zu visualisieren (Skalenniveau: Metrisch)

      •    Zeigt den º£½ÇÖ±²¥n, das untere und obere Quartil sowie Ausreißer

      •    Eignet sich gut, um die Streuung und Symmetrie der Daten zu visualisieren und Ausreißer zu identifizieren

Tutorials

Excel:

SPSS:  

R:  

Streudiagramm (Scatterplot):

      •    Verwendet, um den Zusammenhang zwischen zwei numerischen Variablen darzustellen (Skalenniveau: Metrisch)

      •    Jeder Punkt repräsentiert ein Paar von Werten (einer auf der x-Achse, einer auf der y-Achse)

      •    Nützlich, um Korrelationen oder Trends zwischen den Variablen zu erkennen

Tutorials

Excel:

SPSS:  

R: