1. Concepts et Introduction à l'ACP
Définition et Objectifs :
- Analyse en Composantes Principales (ACP) :
- Réduire un grand nombre de variables en un plus petit nombre de facteurs tout en conservant l’essentiel de l’information.
- Identifier des combinaisons linéaires de variables initiales (appelées composantes ou facteurs).
- Simplifier l’interprétation des données complexes.
- Utilité :
- Identifier les variables qui contribuent le plus à la variabilité des données.
- Résumer plusieurs variables corrélées en un facteur synthétique.
- Exemple : Calculer une moyenne pondérée des notes par matière pour résumer la performance d’un élève.
Exploration vs. Confirmation :
- Analyse Factorielle Exploratoire (AFE) :
- Cas où on ne connaît pas les facteurs.
- Objectif : Identifier les facteurs latents (cachés) expliquant le maximum de variabilité.
- Analyse Factorielle Confirmatoire (AFC) :
- Cas où les facteurs sont déjà connus.
- Objectif : Vérifier la cohérence des variables associées à chaque facteur.
2. Mécanismes de l'ACP
1. Corrélation et Variabilité
- Matrice de corrélation :
- Analyse les relations entre les variables pour repérer celles qui sont inutiles ou incohérentes.
- Exemple : Si une variable n’est pas corrélée avec d'autres, elle n’apporte pas d’information commune.
- Variance totale expliquée :
- Montre combien d’information chaque composante explique.
- Exemple :
- Composante 1 (C1) explique 34.5% de la variabilité totale.
- Les trois premières composantes expliquent 62% de l’information initiale.
2. Indice KMO (Kaiser-Meyer-Olkin)
- But :
- Mesurer la cohérence des variables entre elles.
- Indique si l’analyse factorielle est adaptée.
- Si KMO > 0.7, l’analyse est cohérente.
- Si KMO < 0.5, l’analyse factorielle n’est pas recommandée.
3. Évaluation des Composantes
- Qualité des représentations :
- Vérifie si une variable est bien représentée dans les facteurs.
- Mesure entre 0 (mauvaise représentation) et 1 (bonne représentation).
- Matrice des composantes :
- Montre les poids des variables dans chaque facteur.
- Exemple :
- F1=0.547P1+0.508P2+…F1 = 0.547P_1 + 0.508P_2 + \ldots
4. Rotation des Composantes
- Rotation Varimax :
- Rend les résultats plus clairs et interprétables.
- Augmente les poids des variables fortement liées à un facteur tout en diminuant les poids faibles.
3. Application Pratique : AFE
Étapes :
- Standardisation des données :
- Les variables doivent avoir une moyenne de 0 et un écart-type de 1.
- Extraction des facteurs :
- Utilisation de l’Eigenvalue pour déterminer le nombre de facteurs.
- Règle : Retenir les facteurs avec une Eigenvalue > 1.
- Calcul des poids (coefficients) :
- Chaque variable contribue à la formation d’un facteur.
- Exemple :
- F1=0.547P1+0.508P2+…F1 = 0.547P_1 + 0.508P_2 + \ldots
- Rotation (Varimax) :
- Simplifie l’interprétation en concentrant chaque variable sur un seul facteur.
Exemple :
- Si les trois premières composantes expliquent 62% de la variance totale, cela signifie qu’on peut résumer les données initiales à 62% avec ces trois composantes.
4. Application Pratique : AFC
Concept des échelles psychométriques :
- But : Vérifier que les variables mesurent bien les dimensions prévues.
- Exemple :Questionnaire avec plusieurs items mesurant une seule dimension (e.g., satisfaction client).
- Les items sont des variables regroupées sous un même facteur.
Étapes :
- Définir les facteurs (dimensions).
- Vérifier la cohérence des variables au sein de chaque facteur :
- À l’aide de matrices de corrélation et d’Eigenvalues.
Cas d’utilisation :
- Validation de questionnaires ou d'échelles de mesure en psychologie, marketing, etc.
5. Interprétation des Résultats
1. Variance totale expliquée :
- Montre combien chaque facteur explique dans la variabilité totale des données.
2. Poids des variables dans les facteurs :
- Les variables avec des poids proches de 1 ont une forte contribution dans ce facteur.
- Les poids faibles peuvent être supprimés après rotation.
3. Utilisation de Varimax :
- Simplifie la lecture : chaque variable contribue principalement à un seul facteur.
4. Limites :
- Si KMO est faible ou les corrélations sont faibles, l’analyse factorielle n’est pas adaptée.
- Attention à l’interprétation subjective des facteurs extraits.
6. Cas Pratiques dans SPSS
1. AFE :
- Ne pas appliquer de rotation si l’objectif est de trouver un seul facteur.
- Examiner la matrice des composantes et la variance expliquée.
2. AFC :
- Appliquer les rotations (Varimax) pour vérifier la cohérence des groupes de variables.
- Interpréter les poids pour confirmer l’association des variables à chaque facteur.