Commentaires

Mode et médiane


La mode

La mode est définie comme: la valeur qui revient le plus souvent si les données sont discrètes, ou l'intervalle de classe le plus souvent si les données sont continues.

Ainsi, à partir de la représentation graphique des données, la valeur qui représente le mode ou la classe modale est immédiatement obtenue.

Cela est particulièrement utile pour réduire les informations d'un ensemble de données qualitatives, présentées sous forme de noms ou de catégories, pour lesquelles la moyenne et parfois la médiane ne peuvent pas être calculées.

Médiane

La médiane est une mesure de l'emplacement du centre de la distribution des données, définie comme suit:

Trié les éléments de l'échantillon, la médiane est la valeur (appartenant ou non à l'échantillon) qui le divise en deux, c'est-à-dire que 50% des éléments de l'échantillon sont inférieurs ou égaux à la médiane et les 50% restants sont supérieurs ou égaux à la médiane. .

Pour sa détermination, la règle suivante est utilisée, après avoir commandé l'échantillon de n éléments:

Si n est impair, la médiane est l'élément moyen.
Si n est pair, la médiane est la demi-somme des deux éléments moyens.

Considérations moyennes et médianes

Pour mesurer l'emplacement, la médiane est plus robuste que la moyenne car elle n'est pas aussi sensible aux données.

1- Lorsque la distribution est symétrique, la moyenne et la médiane coïncident.
2- La médiane n'est pas aussi sensible que la moyenne à des observations beaucoup plus grandes ou beaucoup plus petites que les autres (valeurs aberrantes). Par contre, la moyenne reflète la valeur de toutes les observations.

Comme nous l'avons vu, la moyenne, contrairement à la médiane, est une mesure fortement influencée par des valeurs "très grandes" ou "très petites", même si ces valeurs apparaissent en petit nombre dans l'échantillon. Ces valeurs sont responsables de l'utilisation abusive de la moyenne dans de nombreuses situations où il serait plus significatif d'utiliser la médiane.

De ce qui précède, nous déduisons que si la distribution des données:
1. est approximativement symétrique, la moyenne se rapproche de la médiane.
2. est asymétrique vers la droite (certaines valeurs importantes comme les valeurs aberrantes), la moyenne a tendance à être supérieure à la médiane.
3. biaisé vers la gauche (quelques petites valeurs telles que les valeurs aberrantes), la moyenne a tendance à être inférieure à la médiane.

Suivant: Mesures de dispersion