Objectifs du cours
- Choisir une méthode d’analyse adaptée : Identifier la méthodologie statistique appropriée selon la nature des données et des questions à résoudre.
- Mener les analyses de données : Utiliser des outils statistiques pour explorer et modéliser les données.
- Dégager des insights clairs et exploitables : Transformer les résultats en recommandations stratégiques.
Types et formats de données
- Numéro : Ce sont des identifiants sans signification mathématique (exemple : numéros de téléphone).
- Nombre : Représentent une quantité mesurable (exemple : 10 kg, 25 ânes).
- Chiffre : Les composantes d’un nombre (exemple : dans 123, 1, 2 et 3 sont des chiffres).
Types d’études
- Qualitatives : Explorent les comportements et perceptions (exemple : comprendre pourquoi les clients préfèrent un produit).
- Quantitatives :
- Descriptive : Décrit les données, par exemple en calculant la moyenne des notes d'une classe.
- Explicative : Teste les relations entre variables (exemple : l’impact de l’âge sur le salaire).
- Causale : Identifie les impacts de plusieurs variables sur une autre, comme l'effet des publicités et des promotions sur les ventes.

Typologies des analyses statistiques
- Univariées :
- Exemple : Calculer la moyenne d’âge d’une population.
- Objectif : Résumer une seule variable par des indicateurs simples.
- Bivariées :
- Exemple : Analyse du lien entre l’âge et le revenu.
- Objectif : Comprendre comment deux variables sont reliées.
- Multivariées :
- Exemple : Comprendre comment plusieurs facteurs (niveau d’éducation, expérience, âge) influencent le revenu.
- Objectif : Analyser des interactions complexes.

Méthodes de collecte de données et vocabulaire
- Population : L’ensemble d’individus concernés par l’étude (exemple : tous les élèves d’un lycée).
- Individu : Une unité unique de la population (exemple : un élève).
- Variable : Caractéristique mesurable (exemple : l’âge, le genre).
- Echantillon : Une partie représentative de la population (exemple : 100 élèves sur 1000).
- Recensement : Étude exhaustive sur toute la population (rarement réalisée en pratique).
- Paramètre : Une mesure caractéristique de la population (exemple : la proportion de femmes dans un groupe).
- Estimation : Approche du paramètre à partir d’un échantillon.

Variables et bases de données
- Structure des bases : Une matrice avec des lignes (élèves, clients) et des colonnes (variables comme l’âge, le revenu).
Types de variables :
- Qualitatives :
- Nominale : Les modalités n’ont pas d’ordre logique (exemple : les couleurs).
- Ordinale : Les modalités sont hiérarchiques (exemple : petit, moyen, grand).
- Quantitatives :
- Intervalles : Les distances entre valeurs ont du sens (exemple : la température en Celsius).
- Ratios : Les zéros sont absolus et signifient l’absence de quantité (exemple : 0 kg).
Notions d’inférence et hypothèses
- H0 (hypothèse nulle) : Exemple : Il n’y a pas de différence entre les hommes et les femmes pour un test de QI.
- H1 (hypothèse alternative) : Exemple : Les femmes ont un QI différent des hommes.

Types d’erreurs :
- Type 1 (α) : Conclure à tort qu’il existe un effet (faux positif).
- Exemple : Dire qu’un médicament est efficace alors qu’il ne l’est pas.
- Type 2 (β) : Ne pas détecter un effet réel (faux négatif).
- Exemple : Ne pas détecter qu’un médicament est efficace
P-Value :
- Exemple concret : Si P = 0.03 et α = 0.05, on rejette H0. Cela signifie qu’il y a moins de 3% de chances que les résultats soient dus au hasard.
Analyse statistique sur SPSS
Construction d’une base de données
- Vue des variables : Définir clairement chaque colonne en précisant :
- Le type de données (texte, numérique).
- Les unités ou catégories.
- Vue des données : Entrer les réponses sous forme de matrice (lignes = individus).
Tests courants :
- Tableau de contingence et test du χ² :
- Concret : Analyse du lien entre genre (homme/femme) et choix de produit (A/B).

- Test t de Student :
- Concret : Comparer les scores de deux groupes d’élèves (filles vs garçons).
- ANOVA :
- One-way : Comparer la satisfaction client selon trois magasins.
- Two-way : Analyser l’interaction entre genre et niveau d’éducation sur le revenu.
- Corrélation de Pearson :
- Concret : Mesurer le lien entre l’âge et le revenu (r proche de 1 = corrélation forte).
Résumé des indicateurs clés
- Position :
- Moyenne : Exemple, revenu moyen = 2500€.
- Médiane : Le revenu du milieu est 2400€.
- Dispersion :
- Écart-type : Mesure si les salaires varient beaucoup autour de la moyenne.
- Étendue : Différence entre le salaire minimum et maximum.
- Corrélation :
- Un r = 0.8 entre l’âge et le revenu indique une relation forte.
Objectifs du cours
- Choisir une méthode d’analyse adaptée : Identifier la méthodologie statistique appropriée selon la nature des données et des questions à résoudre.
- Mener les analyses de données : Utiliser des outils statistiques pour explorer et modéliser les données.
- Dégager des insights clairs et exploitables : Transformer les résultats en recommandations stratégiques.
Types et formats de données
- Numéro : Ce sont des identifiants sans signification mathématique (exemple : numéros de téléphone).
- Nombre : Représentent une quantité mesurable (exemple : 10 kg, 25 ânes).
- Chiffre : Les composantes d’un nombre (exemple : dans 123, 1, 2 et 3 sont des chiffres).
Types d’études
- Qualitatives : Explorent les comportements et perceptions (exemple : comprendre pourquoi les clients préfèrent un produit).
- Quantitatives :
- Descriptive : Décrit les données, par exemple en calculant la moyenne des notes d'une classe.
- Explicative : Teste les relations entre variables (exemple : l’impact de l’âge sur le salaire).
- Causale : Identifie les impacts de plusieurs variables sur une autre, comme l'effet des publicités et des promotions sur les ventes.

Typologies des analyses statistiques
- Univariées :
- Exemple : Calculer la moyenne d’âge d’une population.
- Objectif : Résumer une seule variable par des indicateurs simples.
- Bivariées :
- Exemple : Analyse du lien entre l’âge et le revenu.
- Objectif : Comprendre comment deux variables sont reliées.
- Multivariées :
- Exemple : Comprendre comment plusieurs facteurs (niveau d’éducation, expérience, âge) influencent le revenu.
- Objectif : Analyser des interactions complexes.

Méthodes de collecte de données et vocabulaire
- Population : L’ensemble d’individus concernés par l’étude (exemple : tous les élèves d’un lycée).
- Individu : Une unité unique de la population (exemple : un élève).
- Variable : Caractéristique mesurable (exemple : l’âge, le genre).
- Echantillon : Une partie représentative de la population (exemple : 100 élèves sur 1000).
- Recensement : Étude exhaustive sur toute la population (rarement réalisée en pratique).
- Paramètre : Une mesure caractéristique de la population (exemple : la proportion de femmes dans un groupe).
- Estimation : Approche du paramètre à partir d’un échantillon.

Variables et bases de données
- Structure des bases : Une matrice avec des lignes (élèves, clients) et des colonnes (variables comme l’âge, le revenu).
Types de variables :
- Qualitatives :
- Nominale : Les modalités n’ont pas d’ordre logique (exemple : les couleurs).
- Ordinale : Les modalités sont hiérarchiques (exemple : petit, moyen, grand).
- Quantitatives :
- Intervalles : Les distances entre valeurs ont du sens (exemple : la température en Celsius).
- Ratios : Les zéros sont absolus et signifient l’absence de quantité (exemple : 0 kg).
Notions d’inférence et hypothèses
- H0 (hypothèse nulle) : Exemple : Il n’y a pas de différence entre les hommes et les femmes pour un test de QI.
- H1 (hypothèse alternative) : Exemple : Les femmes ont un QI différent des hommes.

Types d’erreurs :
- Type 1 (α) : Conclure à tort qu’il existe un effet (faux positif).
- Exemple : Dire qu’un médicament est efficace alors qu’il ne l’est pas.
- Type 2 (β) : Ne pas détecter un effet réel (faux négatif).
- Exemple : Ne pas détecter qu’un médicament est efficace
P-Value :
- Exemple concret : Si P = 0.03 et α = 0.05, on rejette H0. Cela signifie qu’il y a moins de 3% de chances que les résultats soient dus au hasard.
Analyse statistique sur SPSS
Construction d’une base de données
- Vue des variables : Définir clairement chaque colonne en précisant :
- Le type de données (texte, numérique).
- Les unités ou catégories.
- Vue des données : Entrer les réponses sous forme de matrice (lignes = individus).
Tests courants :
- Tableau de contingence et test du χ² :
- Concret : Analyse du lien entre genre (homme/femme) et choix de produit (A/B).

- Test t de Student :
- Concret : Comparer les scores de deux groupes d’élèves (filles vs garçons).
- ANOVA :
- One-way : Comparer la satisfaction client selon trois magasins.
- Two-way : Analyser l’interaction entre genre et niveau d’éducation sur le revenu.
- Corrélation de Pearson :
- Concret : Mesurer le lien entre l’âge et le revenu (r proche de 1 = corrélation forte).
Résumé des indicateurs clés
- Position :
- Moyenne : Exemple, revenu moyen = 2500€.
- Médiane : Le revenu du milieu est 2400€.
- Dispersion :
- Écart-type : Mesure si les salaires varient beaucoup autour de la moyenne.
- Étendue : Différence entre le salaire minimum et maximum.
- Corrélation :
- Un r = 0.8 entre l’âge et le revenu indique une relation forte.