I. Démarche d'Étude Statistique
- Formalisation : Types de Caractères
- Caractères Qualitatifs :
- Nominal : Pas d'ordre (ex : professions, types de produits).
- Ordinal : Ordre entre les catégories (ex : niveaux d'éducation).
- Caractères Quantitatifs :
- Discret : Valeurs entières (ex : nombre de personnes, jours).
- Continu : Prend toutes les valeurs dans un intervalle (ex : âge, taille).
II. Tableaux de Données et Représentations Graphiques
- Tableaux et Graphiques pour Caractères Qualitatifs :
- Tableau de Fréquence Simple : Montre les effectifs (ni) et les fréquences (fi =ni/N ) de chaque catégorie.
- Graphiques :
- Diagramme en Secteurs (Camembert) : Représente la part de chaque catégorie par rapport au total, adapté aux données qualitatives nominales et ordinales.
- Diagramme en Bandes : Permet de comparer les effectifs ou les pourcentages de plusieurs catégories, souvent utilisé pour des données qualitatives ou pour comparer plusieurs groupes (ex : deux entreprises).
- Tableaux et Graphiques pour Caractères Quantitatifs Discrets :
- Tableau de Fréquence Simple : Liste chaque valeur discrète de la variable (xi ) avec ses effectifs (ni) et fréquences (fi).
- Tableau de Fréquences Cumulées : Pour les effectifs cumulés croissants (Ni ), utilisé pour la médiane ou l'analyse de position.
- Graphiques :
- Diagramme en Bâtons : Représente la discontinuité entre les valeurs discrètes en utilisant des barres séparées.
- Diagramme en Secteurs : Peut aussi être utilisé pour représenter la répartition d'un caractère quantitatif discret (par exemple, le nombre de familles ayant 0, 1, 2, etc., enfants).
- Tableaux et Graphiques pour Caractères Quantitatifs Continus :
- Tableau de Classes :
- Divise les données continues en classes ([L1 ;L2 [) avec leurs effectifs (ni ), fréquences (fi ), et densités.
- Effectifs Cumulés : On utilise les bornes supérieures des classes pour l'analyse cumulative.
- Graphiques :
- Histogramme : Affiche la distribution des effectifs dans chaque classe avec la largeur des rectangles proportionnelle à l'amplitude de la classe.
- Polygone des Effectifs : Représente la répartition cumulée, chaque point sur la courbe indiquant un effectif cumulé.
- Courbe de Répartition (Ogive) : Utile pour visualiser les effectifs cumulés croissants, en prenant les bornes supérieures des classes.
III. Paramètres de Tendance Centrale
- Mode (Mo)
- Série discrète : La valeur de la variable ayant le plus grand effectif.
- Série continue : Classe modale, c'est-à-dire celle avec le plus grand effectif.
- Médiane (Me)
- Série discrète : La valeur au centre des données, telle que 50% des effectifs sont en-dessous et 50% au-dessus.
- Si N est impair : Me=valeur pour N/2+0,5.
- Si N est pair : Moyenne des deux valeurs centrales.
- Série continue : Calcul par interpolation linéaire dans la classe médiane. Si N est le nombre total et N/2 se situe dans la classe [L1 ;L2 [, alors :
- Me= L1 +(N/2 - Fprécédent / f ) × amplitude
- où Fprécédent est l'effectif cumulé avant la classe médiane, f est l’effectif de la classe médiane.
- Moyenne Arithmétique (xˉ)
- Série discrète :x-
- Où xi sont les valeurs de la variable et ni les effectifs correspondants.
- Série continue : Moyenne pondérée des centres de classes (xi ) par les effectifs :x
III. Paramètres de Dispersion
- Variance (V(x)) et Écart-Type (σ)
- Variance pour une série discrète :
- Écart-Type :
- Ces mesures montrent la dispersion autour de la moyenne. Plus l'écart-type est grand, plus les valeurs sont dispersées.
- Coefficient de Variation (CV)
- Pour évaluer la dispersion relative des données :
- Si CV est élevé, la dispersion est forte par rapport à la moyenne.
Exemple d'Application
- Mode : Dans une série discrète avec des effectifs [10,20,40,15,12,8], le mode est x=2 car n2 =40 (effectif le plus élevé).
- Médiane : Pour N=105, on calcule N/2+0,5=53, donc la médiane est la valeur pour laquelle l'effectif cumulé atteint ou dépasse 53.
- Moyenne et Écart-Type :
- Moyenne : xˉ= 233/ 105 =2,22.
- Variance et écart-type calculés sur la base des écarts entre chaque valeur et la moyenne.