Définition
Statistiques
Les statistiques sont une branche des mathématiques qui se concentrent sur la collecte, l'analyse, l'interprétation, la présentation et l'organisation des données.
Moyenne
La moyenne est une mesure de tendance centrale qui se calcule en additionnant toutes les valeurs d'un ensemble de données et en divisant le total par le nombre de valeurs.
Médiane
La médiane est la valeur centrale d'un ensemble de données numériquement ordonné. Si le nombre total est pair, la médiane est la moyenne des deux valeurs centrales.
Écart-type
L'écart-type est une mesure qui quantifie la dispersion d'un ensemble de données autour de sa moyenne.
Quartiles
Les quartiles sont les trois valeurs qui divisent les données en quart. Le premier quartile (Q1) sépare le quart inférieur des données, le deuxième quartile (Q2) est la médiane, et le troisième quartile (Q3) sépare les 75% inférieurs des 25% supérieurs.
Écart interquartile
L'écart interquartile est la différence entre le troisième quartile (Q3) et le premier quartile (Q1), et mesure l'étendue des valeurs médianes.
Mesures de tendance centrale
Les mesures de tendance centrale, telles que la moyenne et la médiane, sont essentielles en statistique pour comprendre où se trouve le centre des données. La moyenne est utile pour les ensembles de données symétriques sans valeurs aberrantes extrêmes, tandis que la médiane est plus appropriée pour les ensembles où les valeurs aberrantes peuvent influencer la moyenne.
Dispersion des données
La dispersion des données est une mesure de la variété dans un ensemble de données. L'écart-type est couramment utilisé pour comprendre à quel point les valeurs s'écartent de la moyenne. Un écart-type élevé indique une grande dispersion des valeurs, tandis qu'un écart-type faible indique que les valeurs sont proches de la moyenne.
Quartiles et écart interquartile
Les quartiles aident à décrire la distribution de l'ensemble de données en le divisant en quatre parties égales. L'utilisation des quartiles est cruciale pour créer des boîtes à moustaches (box plots) dans la visualisation des données. L'écart interquartile, qui est la différence entre le troisième et le premier quartile, fournit une mesure de la variabilité des valeurs médianes, excluant les valeurs extrêmes.
A retenir :
Les statistiques sont fondamentales pour comprendre et analyser les données. En connaissant comment calculer et interpréter des mesures comme la moyenne, la médiane, l'écart-type, et les quartiles, on peut obtenir un aperçu clair de l'ensemble des données, tant en termes de tendance centrale qu'en termes de dispersion, et déterminer comment les différentes parties des données se comportent.