Définitions de base en statistique et probabilités
Définition
Moyenne Pondérée
La moyenne pondérée d'un ensemble de données est une moyenne où chaque valeur est multipliée par un poids correspondant, ce qui donne plus d'importance à certains éléments. Elle est calculée en multipliant chaque valeur par son poids, puis en divisant la somme de ces produits par la somme des poids. Formellement, si l'on note xi les valeurs et wi les poids associés, la moyenne pondérée W est : W = (∑ wi xi) / (∑ wi).
Médiane
La médiane est la valeur qui partage un ensemble de données en deux parties égales une fois que celles-ci sont triées dans l'ordre croissant ou décroissant. Si le nombre d'observations est impair, la médiane est la valeur médiane. Si le nombre est pair, elle correspond à la moyenne des deux valeurs centrales. La médiane est une mesure de tendance centrale robuste, peu influencée par les valeurs extrêmes.
Étendue
L'étendue d'un ensemble de données est la différence entre la valeur maximale et la valeur minimale de cet ensemble. Elle donne une idée de la dispersion ou de la variabilité des données. Plus l'étendue est grande, plus les valeurs sont dispersées.
Probabilité
La probabilité est une mesure numérique de la chance qu'un événement se realise. Elle est comprise entre 0 et 1, où 0 indique que l'événement est impossible et 1 indique qu'il est certain. La probabilité d'un événement A est souvent notée P(A). Elle peut être déterminée théoriquement dans le cadre d'événements équiprobables ou estimée à partir de données expérimentales.
Partie 1 : Moyenne Pondérée
La moyenne pondérée est particulièrement utile lorsque certains éléments de données ont une importance ou un poids différent. Par exemple, dans une classe où les notes ont des coefficients différents selon les matières, la moyenne pondérée permet de calculer une note finale prenant en compte ces coefficients. La formule mentionnée précédemment s'applique dans divers contextes, comme en économie pour le calcul du PIB avec des indices de prix, ou en sciences pour donner plus de poids à certaines mesures expérimentales.
Partie 2 : Médiane
La médiane est une mesure de tendance centrale qui résiste aux valeurs extrêmes, contrairement à la moyenne. Elle est très utilisée dans l'analyse des revenus ou des prix pour éviter que des valeurs exceptionnellement élevées ou basses n'influencent le résultat. Par exemple, lorsque l'on veut connaître le salaire typique d'une population, la médiane est souvent plus représentative que la moyenne.
Partie 3 : Étendue
L'étendue est une mesure simple mais efficace pour caractériser la dispersion totale d'un ensemble de données. Elle ne fournit cependant qu'une idée très grossière de la variabilité, car elle ne tient pas compte de la distribution des valeurs intermédiaires. Elle est souvent utilisée comme un premier indicateur pour analyser la dispersion dans des contextes rapides ou pour des ensembles de données où l'on souhaite connaître la variation extrême.
Partie 4 : Probabilité
La probabilité est fondamentale en statistiques et en sciences de l'incertitude. Elle permet de modéliser et de quantifier l'incertitude liée à la survenue d'événements. La théorie de la probabilité repose sur des axiomes fondamentaux, comme ceux de Kolmogorov, qui définissent la probabilité comme une fonction attribuant une valeur à chaque événement dans un espace probabiliste. La probabilité est utilisée dans de nombreux domaines : jeux de hasard, modélisation scientifique, finance, assurance, etc. Elle permet aussi de construire des modèles statistiques pour faire des prévisions ou des analyses de risques.
A retenir :
Ce cours porte sur quatre notions essentielles en statistique et probabilités : la moyenne pondérée, qui permet de calculer une moyenne en tenant compte de l'importance relative de chaque valeur ; la médiane, qui est une mesure résistante à l'influence des valeurs extrêmes et représente le point central d'un ensemble ; l'étendue, qui mesure la dispersion totale entre la valeur maximale et minimale, donnant une idée de la variabilité des données ; et enfin, la probabilité, qui quantifie la chance qu'un événement survienne, constituant la base de la modélisation de l'incertitude dans diverses disciplines. La maîtrise de ces concepts est fondamentale pour analyser des données, prendre des décisions et modéliser le hasard dans différentes applications.