Das arithmetische Mittel, auch Durchschnitt oder arithmetischer Mittelwert genannt, wird errechnet, indem man die einzelnen Beobachtungswerte addiert und die Summe durch die Anzahl der Beobachtungswerte teilt.
In mathematischer Schreibweise ist der Mittelwert einer Anzahl n Beobachtungswerte x1, x2 bis xn definiert als x = (x1 + x2 + + xn) / n.
Im Gegensatz zu einem anderen häufig verwendeten Lagemass, dem Median (siehe dort), wird das arithmetische Mittel durch die Grösse der Extremwerte stark beeinflusst. Bei einer streng symmetrischen Häufigkeitsverteilung fällt das arithmetische Mittel mit dem Median zusammen. Im Falle einer asymmetrischen Verteilung, z.B. des Einkommens, mit hohen Extremwerten liegt das arithmetischen Mittel über dem Median, bei tiefen Extremwerten darunter. Je deutlicher die Asymmetrie ist, desto grösser ist der Unterschied zwischen arithmetischem Mittel und Median. Um die Lokation einer Verteilung zu beschreiben ist das arithmetische Mittel darum nur bei ungefähr symmetrischen Verteilungen geeignet. Eine Variante des arithmetischen Mittels, das gewichtete Mittel, ordnet jeder Beobachtung ein Gewicht zu. (748)
Der Median oder Zentralwert teilt die nach Grösse geordneten Beobachtungswerte in zwei gleich grosse Hälften. Die eine Hälfte der Werte liegt über, die andere unter dem Median.
In mathematischer Schreibweise ist der Median einer Anzahl n Beobachtungswerte x1, x2 bis xn so definiert: Die Beobachtungen seien x(1) < x(2) < < x(n).
Wenn n eine ungerade Zahl ist, dann ist der Median der Beobachtungswert in der Mitte: x((n+1) / 2).
Bei gerader Anzahl n liegt der Median in der Mitte zwischen den zwei mittleren Beobachtungen:
(1/2)x(n/2) + (1/2)x((n/2) + 1).
Im Gegensatz zu einem anderen häufig verwendeten Lagemass, dem arithmetischen Mittel (siehe dort), wird der Median durch Extremwerte nicht beeinflusst. Bei einer streng symmetrischen Häufigkeitsverteilung fällt der Median mit dem arithmetischen Mittel zusammen. Im Falle einer asymmetrischen Verteilung, z.B. des Einkommens, mit hohen Extremwerten liegt er unter dem arithmetischen Mittel und bei tiefen Extremwerten darüber. Je deutlicher die Asymmetrie ist, desto grösser ist der Unterschied zwischen arithmetischem Mittel und Median. Der Median ist auch bei asymmetrischen Verteilungen geeignet, die Lokation der Verteilung zu beschreiben. Eine Variante des Medians, der gewichtete Median, ordnet jeder Beobachtung ein Gewicht zu.
Teilt man die der Grösse nach geordneten Beobachtungswerte in vier Gruppen mit einer gleichwertigen Anzahl Fälle auf, so stellt der Wert des unteren Quartils denjenigen Wert dar, der zwischen dem Wert des letzten beobachteten Falles des ersten Viertels und dem Wert des ersten beobachteten Falles des zweiten Viertels liegt. Der Wert des oberen Quartils stellt denjenigen Wert dar, der zwischen dem Wert des letzten beobachteten Falles des dritten Viertels und dem Wert des ersten beobachteten Falles des vierten Viertels liegt. (8)
Diese Formel gilt für die Berechnung der Parteistärke innerhalb eines Wahlkreises, nicht jedoch für die Berechnung der Parteistärke einer Einheit mit unterschiedlich grossen Wahlkreisen. Bei solchen Berechnungen kann nicht von der Summe der Stimmen ausgegangen werden, da den Wählenden je nach Wahlkreis eine unterschiedliche Zahl von Stimmen – entsprechend der Anzahl Sitze im Parlament – zur Verfügung stehen. Um kantonale oder gesamtschweizerische Werte zu erhalten, müssen daher die abgegebenen Stimmen – wahlkreisweise – in eine über alle Wahlkreise hinweg vergleichbare Grösse umgerechnet werden: in die sogenannten fiktiven Wählenden.
Die Zahl der fiktiven Wählenden wird ermittelt, indem, vereinfacht gesagt, die Anzahl der erhaltenen Stimmen durch die Anzahl der zu vergebenden Sitze des entsprechenden Wahlkreises geteilt wird.
Diese Berechnung enthält allerdings einen kleinen Fehler, da sie das Faktum übergeht, dass nicht alle Wählende ihre Stimmkraft voll ausschöpfen: Etwa 1% der Stimmen – auf Wahlzetteln ohne Listenbezeichnung (den sogenannten «freien Listen»), auf denen nicht sämtliche Zeilen ausgefüllt wurden – gehen verloren. Die Zahl der fiktiven Wählenden ist bei dieser vereinfachten Berechnung denn auch um rund 1% kleiner als die Zahl der gültigen Wahlzettel bzw. der Zahl derjenigen, die sich effektiv an den Wahlen beteiligt und gültig gewählt haben.
Das Bundesamt für Statistik geht jedoch davon aus, dass die Zahl der fiktiven Wählenden identisch sein muss mit der Zahl der abgegebenen gültigen Wahlzettel. Es verteilt daher die «verlorenen Stimmen» von den Wahlzetteln ohne Listenbezeichnung gleichermassen auf alle Parteien, und zwar ent-sprechend derer Parteistärke. Dies geschieht, indem anstelle des Divisors «Anzahl Sitze pro Wahlkreis» ein Divisor «Total der abgegebenen Stimmen/Total der gültigen Wahlzettel» gebildet wird. Das Total der so berechneten fiktiven Wählenden ist identisch mit der Zahl der gültigen Wahlzettel. (948)
Da Stichprobenerhebungen nur einen Teil der interessierenden Population (Grundgesamtheit) einschliessen, sind ihre Ergebnisse immer mit einer Unsicherheit behaftet. Diese Unsicherheit hängt vom Stichprobenumfang, der Stichprobenrate, den Antwortausfällen und von der Streuung des betrachteten Merkmals in der Grundgesamtheit ab. Sie kann quantifiziert werden, indem ein Vertrauensintervall berechnet wird, dessen Grenzen umso weiter auseinander liegen, je ungenauer die Resultate sind. Eine solche Quantifizierung setzt voraus, dass die Stichprobe mittels eines Zufallsverfahrens aus der Grundgesamtheit gezogen worden ist, was bei Stichprobenerhebungen des Bundesamtes für Statistik immer der Fall ist.
Ein Vertrauensintervall hängt von seinem "Konfidenz-Niveau" (oder Vertrauensniveau) ab, welches meistens bei 95% festgelegt wird. Wenn wir annehmen, dass sich der Parameter, der zu schätzen ist, innerhalb des Vertrauensintervalls befindet, dann ist auf längere Sicht unser Fehlerrisiko auf 5% beschränkt. Genauer gesagt bedeutet dies, dass im Durchschnitt 95% der berechneten Intervalle den Parameter enthielten, wenn die Stichprobenerhebung viele Male unabhängig und unter gleichen Bedingungen durchgeführt würde. In der Praxis werden natürlich die Erhebungen nicht wiederholt. Die Definition des Vertrauensintervalls bedeutet also, dass es zwar unwahrscheinlich, aber nicht völlig ausgeschlossen ist, dass der Parameter nicht im berechneten Vertrauensintervall liegt.
Wenn der geschätzte Wert jeweils in der Mitte des Vertrauensintervalls liegt, spricht man von einem symmetrischen Vertrauensintervall. Im gegenteiligen Fall ist der Vertrauensintervall asymmetrisch. Zum Beispiel für Quantile treten asymmetrische Vertrauensintervalle im allgemeinen auf. (783)