Partielo | Créer ta fiche de révision en ligne rapidement
Post-Bac
2

Statistiques pour l'analyse des données

Objectifs du cours


  1. Choisir une méthode d’analyse adaptée : Identifier la méthodologie statistique appropriée selon la nature des données et des questions à résoudre.
  2. Mener les analyses de données : Utiliser des outils statistiques pour explorer et modéliser les données.
  3. Dégager des insights clairs et exploitables : Transformer les résultats en recommandations stratégiques.


Types et formats de données


  • Numéro : Ce sont des identifiants sans signification mathématique (exemple : numéros de téléphone).
  • Nombre : Représentent une quantité mesurable (exemple : 10 kg, 25 ânes).
  • Chiffre : Les composantes d’un nombre (exemple : dans 123, 1, 2 et 3 sont des chiffres).


Types d’études


  • Qualitatives : Explorent les comportements et perceptions (exemple : comprendre pourquoi les clients préfèrent un produit).
  • Quantitatives :
  • Descriptive : Décrit les données, par exemple en calculant la moyenne des notes d'une classe.
  • Explicative : Teste les relations entre variables (exemple : l’impact de l’âge sur le salaire).
  • Causale : Identifie les impacts de plusieurs variables sur une autre, comme l'effet des publicités et des promotions sur les ventes.



Typologies des analyses statistiques


  1. Univariées :
  • Exemple : Calculer la moyenne d’âge d’une population.
  • Objectif : Résumer une seule variable par des indicateurs simples.
  1. Bivariées :
  • Exemple : Analyse du lien entre l’âge et le revenu.
  • Objectif : Comprendre comment deux variables sont reliées.
  1. Multivariées :
  • Exemple : Comprendre comment plusieurs facteurs (niveau d’éducation, expérience, âge) influencent le revenu.
  • Objectif : Analyser des interactions complexes.



Méthodes de collecte de données et vocabulaire


  • Population : L’ensemble d’individus concernés par l’étude (exemple : tous les élèves d’un lycée).
  • Individu : Une unité unique de la population (exemple : un élève).
  • Variable : Caractéristique mesurable (exemple : l’âge, le genre).
  • Echantillon : Une partie représentative de la population (exemple : 100 élèves sur 1000).
  • Recensement : Étude exhaustive sur toute la population (rarement réalisée en pratique).
  • Paramètre : Une mesure caractéristique de la population (exemple : la proportion de femmes dans un groupe).
  • Estimation : Approche du paramètre à partir d’un échantillon.



Variables et bases de données


  • Structure des bases : Une matrice avec des lignes (élèves, clients) et des colonnes (variables comme l’âge, le revenu).


Types de variables :


  1. Qualitatives :
  • Nominale : Les modalités n’ont pas d’ordre logique (exemple : les couleurs).
  • Ordinale : Les modalités sont hiérarchiques (exemple : petit, moyen, grand).


  1. Quantitatives :
  • Intervalles : Les distances entre valeurs ont du sens (exemple : la température en Celsius).
  • Ratios : Les zéros sont absolus et signifient l’absence de quantité (exemple : 0 kg).



Notions d’inférence et hypothèses


  • H0 (hypothèse nulle) : Exemple : Il n’y a pas de différence entre les hommes et les femmes pour un test de QI.
  • H1 (hypothèse alternative) : Exemple : Les femmes ont un QI différent des hommes.



Types d’erreurs :


  1. Type 1 (α) : Conclure à tort qu’il existe un effet (faux positif).
  • Exemple : Dire qu’un médicament est efficace alors qu’il ne l’est pas.
  1. Type 2 (β) : Ne pas détecter un effet réel (faux négatif).
  • Exemple : Ne pas détecter qu’un médicament est efficace


P-Value :

  • Exemple concret : Si P = 0.03 et α = 0.05, on rejette H0. Cela signifie qu’il y a moins de 3% de chances que les résultats soient dus au hasard.


Analyse statistique sur SPSS


Construction d’une base de données


  1. Vue des variables : Définir clairement chaque colonne en précisant :
  • Le type de données (texte, numérique).
  • Les unités ou catégories.
  1. Vue des données : Entrer les réponses sous forme de matrice (lignes = individus).


Tests courants :

  1. Tableau de contingence et test du χ² :
  • Concret : Analyse du lien entre genre (homme/femme) et choix de produit (A/B).



  1. Test t de Student :
  • Concret : Comparer les scores de deux groupes d’élèves (filles vs garçons).
  1. ANOVA :
  • One-way : Comparer la satisfaction client selon trois magasins.
  • Two-way : Analyser l’interaction entre genre et niveau d’éducation sur le revenu.
  1. Corrélation de Pearson :
  • Concret : Mesurer le lien entre l’âge et le revenu (r proche de 1 = corrélation forte).


Résumé des indicateurs clés


  1. Position :
  • Moyenne : Exemple, revenu moyen = 2500€.
  • Médiane : Le revenu du milieu est 2400€.
  1. Dispersion :
  • Écart-type : Mesure si les salaires varient beaucoup autour de la moyenne.
  • Étendue : Différence entre le salaire minimum et maximum.
  1. Corrélation :
  • Un r = 0.8 entre l’âge et le revenu indique une relation forte.
Post-Bac
2

Statistiques pour l'analyse des données

Objectifs du cours


  1. Choisir une méthode d’analyse adaptée : Identifier la méthodologie statistique appropriée selon la nature des données et des questions à résoudre.
  2. Mener les analyses de données : Utiliser des outils statistiques pour explorer et modéliser les données.
  3. Dégager des insights clairs et exploitables : Transformer les résultats en recommandations stratégiques.


Types et formats de données


  • Numéro : Ce sont des identifiants sans signification mathématique (exemple : numéros de téléphone).
  • Nombre : Représentent une quantité mesurable (exemple : 10 kg, 25 ânes).
  • Chiffre : Les composantes d’un nombre (exemple : dans 123, 1, 2 et 3 sont des chiffres).


Types d’études


  • Qualitatives : Explorent les comportements et perceptions (exemple : comprendre pourquoi les clients préfèrent un produit).
  • Quantitatives :
  • Descriptive : Décrit les données, par exemple en calculant la moyenne des notes d'une classe.
  • Explicative : Teste les relations entre variables (exemple : l’impact de l’âge sur le salaire).
  • Causale : Identifie les impacts de plusieurs variables sur une autre, comme l'effet des publicités et des promotions sur les ventes.



Typologies des analyses statistiques


  1. Univariées :
  • Exemple : Calculer la moyenne d’âge d’une population.
  • Objectif : Résumer une seule variable par des indicateurs simples.
  1. Bivariées :
  • Exemple : Analyse du lien entre l’âge et le revenu.
  • Objectif : Comprendre comment deux variables sont reliées.
  1. Multivariées :
  • Exemple : Comprendre comment plusieurs facteurs (niveau d’éducation, expérience, âge) influencent le revenu.
  • Objectif : Analyser des interactions complexes.



Méthodes de collecte de données et vocabulaire


  • Population : L’ensemble d’individus concernés par l’étude (exemple : tous les élèves d’un lycée).
  • Individu : Une unité unique de la population (exemple : un élève).
  • Variable : Caractéristique mesurable (exemple : l’âge, le genre).
  • Echantillon : Une partie représentative de la population (exemple : 100 élèves sur 1000).
  • Recensement : Étude exhaustive sur toute la population (rarement réalisée en pratique).
  • Paramètre : Une mesure caractéristique de la population (exemple : la proportion de femmes dans un groupe).
  • Estimation : Approche du paramètre à partir d’un échantillon.



Variables et bases de données


  • Structure des bases : Une matrice avec des lignes (élèves, clients) et des colonnes (variables comme l’âge, le revenu).


Types de variables :


  1. Qualitatives :
  • Nominale : Les modalités n’ont pas d’ordre logique (exemple : les couleurs).
  • Ordinale : Les modalités sont hiérarchiques (exemple : petit, moyen, grand).


  1. Quantitatives :
  • Intervalles : Les distances entre valeurs ont du sens (exemple : la température en Celsius).
  • Ratios : Les zéros sont absolus et signifient l’absence de quantité (exemple : 0 kg).



Notions d’inférence et hypothèses


  • H0 (hypothèse nulle) : Exemple : Il n’y a pas de différence entre les hommes et les femmes pour un test de QI.
  • H1 (hypothèse alternative) : Exemple : Les femmes ont un QI différent des hommes.



Types d’erreurs :


  1. Type 1 (α) : Conclure à tort qu’il existe un effet (faux positif).
  • Exemple : Dire qu’un médicament est efficace alors qu’il ne l’est pas.
  1. Type 2 (β) : Ne pas détecter un effet réel (faux négatif).
  • Exemple : Ne pas détecter qu’un médicament est efficace


P-Value :

  • Exemple concret : Si P = 0.03 et α = 0.05, on rejette H0. Cela signifie qu’il y a moins de 3% de chances que les résultats soient dus au hasard.


Analyse statistique sur SPSS


Construction d’une base de données


  1. Vue des variables : Définir clairement chaque colonne en précisant :
  • Le type de données (texte, numérique).
  • Les unités ou catégories.
  1. Vue des données : Entrer les réponses sous forme de matrice (lignes = individus).


Tests courants :

  1. Tableau de contingence et test du χ² :
  • Concret : Analyse du lien entre genre (homme/femme) et choix de produit (A/B).



  1. Test t de Student :
  • Concret : Comparer les scores de deux groupes d’élèves (filles vs garçons).
  1. ANOVA :
  • One-way : Comparer la satisfaction client selon trois magasins.
  • Two-way : Analyser l’interaction entre genre et niveau d’éducation sur le revenu.
  1. Corrélation de Pearson :
  • Concret : Mesurer le lien entre l’âge et le revenu (r proche de 1 = corrélation forte).


Résumé des indicateurs clés


  1. Position :
  • Moyenne : Exemple, revenu moyen = 2500€.
  • Médiane : Le revenu du milieu est 2400€.
  1. Dispersion :
  • Écart-type : Mesure si les salaires varient beaucoup autour de la moyenne.
  • Étendue : Différence entre le salaire minimum et maximum.
  1. Corrélation :
  • Un r = 0.8 entre l’âge et le revenu indique une relation forte.
Retour

Actions

Actions