Comme les enquêtes par échantillonnage ne contiennent qu'une partie de la population d'intérêt (l'ensemble fondamental), il y a forcément une incertitude sur les résultats. Cette incertitude dépend de la taille de l'échantillon, du taux de sondage et de réponse, et aussi de la dispersion la variable d'intérêt dans la population. Si l'enquête est basée sur un échantillonnage aléatoire - ce qui est toujours le cas à l'Office fédéral de la statistique - il est possible de quantifier l'incertitude en calculant un intervalle de confiance dont les bornes sont d'autant plus éloignées que l'imprécision des résultats est grande.
Un intervalle de confiance dépend de son "niveau de confiance", le plus souvent fixé à 95%. Si nous supposons que le paramètre à estimer se trouve dans l'intervalle de confiance, notre risque d'erreur est limité à long terme à 5%. Plus précisément, cela signifie que, si l'enquête était répétée un grand nombre de fois indépendamment et dans les mêmes conditions, 95% en moyenne des intervalles obtenus contiendraient effectivement le paramètre. En pratique, néanmoins, on ne répète pas l'enquête. La définition de l'intervalle de confiance implique donc qu'il n'est pas totalement exclu – mais improbable - que certains des intervalles de confiance calculés ne contiennent pas le paramètre.
Si la valeur estimée ponctuelle se trouve au milieu de l'intervalle de confiance, on parle d'un intervalle symétrique. Dans le cas contraire l'intervalle est asymétrique. Par exemple pour les quantiles, on donne généralement des intervalles de confiance asymétriques. (783)
La médiane ou valeur centrale partage l'ensemble des valeurs observées (et ordonnées selon leur grandeur) en deux moitiés de taille égale, l'une comprenant les valeurs supérieures à la médiane, l'autre les valeurs inférieures à celle-ci.
En notation mathématique, la médiane de n observations x1, x2 à xn est définie comme suit : les observations sont ordonnées telles que x(1) < x(2) < < x(n).
Si n est impair, la médiane correspond à la valeur située au centre de l'ensemble: x((n+1) / 2).
Si n est pair, la médiane se situe entre les deux observations situées au centre de l'ensemble:
(1/2)x(n/2) + (1/2)x((n/2) + 1).
A la différence d'une autre mesure de tendance centrale fréquemment utilisée, la moyenne arithmétique (voir définition), la médiane n'est pas influencée par les valeurs extrêmes. Lorsque les valeurs sont distribuées de manière symétrique, la médiane coïncide avec la moyenne arithmétique. Lorsque la distribution est asymétrique (dans le cas des revenus p. ex.), la médiane est inférieure à la moyenne arithmétique si les valeurs extrêmes sont élevées et dépasse celle-ci si les valeurs extrêmes sont basses. Plus l'asymétrie est marquée, plus la différence est grande entre la moyenne arithmétique et la médiane. La médiane peut également être utilisée en cas de distribution asymétrique. La médiane pondérée, qui attribue un poids à chaque observation, constitue une variante de la médiane.
Si l'on divise l'ensemble des observations, ordonnées selon leur grandeur, en quatre groupes de taille égale, le quartile inférieur se situe entre la dernière valeur du premier quart et la première du deuxième quart d'observations. Le quartile supérieur se situe entre la dernière valeur du troisième quart et la première valeur du quatrième quart d'observations. (8)
La moyenne arithmétique, également appelée moyenne, correspond à la somme des valeurs observées divisée par leur nombre.
En notation mathématique, la valeur moyenne d'un nombre n de valeurs x1, x2 à xn est définie telle que x = (x1 + x2 + + xn) / n.
A la différence d'une autre mesure de tendance centrale fréquemment utilisée, la médiane (voir définition), la moyenne arithmétique est fortement influencée par les valeurs extrêmes. Lorsque les valeurs sont distribuées de manière symétrique, la moyenne arithmétique coïncide avec la médiane. Lorsque la distribution est asymétrique (dans le cas des revenus p. ex.), la moyenne arithmétique dépasse la médiane si les valeurs extrêmes sont élevées et se situe en dessous de la médiane si les valeurs extrêmes sont basses. Plus l'asymétrie est marquée, plus la différence est grande entre la moyenne arithmétique et la médiane. Ainsi, le recours à la moyenne arithmétique n'est pertinent que si la distribution est à peu près symétrique. La moyenne pondérée, qui attribue un poids à chaque observation, constitue une variante de la moyenne arithmétique. (748)