Partielo | Créer ta fiche de révision en ligne rapidement
Post-Bac
1

Analyse des correspondances Multiples ACM (CM2 et TP2)

Analyse de données multivariées

Définition

Analyse des correspondances Multiples
C'est une méthode d'analyse de variables qualitatives qui ressemble à l'AFC appliqué un tableau disjonctif complet soit un tableau qui regroupe les données d'individus pour plus de 2 variables qualitatives.
Tableau disjonctif complet
C'est un tableau dans qui regroupe plusieurs variables qualitatives pour plusieurs individus. Les modalités de toutes les variables sont en colonnes et les individus en lignes. On note 1 ou 0 la présence ou l'absence de chaque modalité par individus.

Les objectifs de l'ACM sont d'étudier: la ressemblance des individus par le nombre de modalités qu’ils ont en commun (la typologie des individus), résumer l’ensemble des variables par un petit nombre de variables synthétiques (la liaison entre les variables), la ressemblance entre les modalité, la présences ou absences chez un grand nombre d’individus et leurs s’association entre elles (la typologie des modalités).

Concrètement, le principe est de faire une AFC en donnant le même poids à toutes les modalités et tous les individus. Comme en AFC, on produit 2 graphiques à partir de profils- lignes ou -colonnes:

  • Le profil ligne soit le profil individus: la transformation en profils- lignes est calculé en divisant le codage par J. On obtient alors soit des 0 soit 1/J ce qui modifie guère les données. Les poids affectés aux individus sont uniformes car il y a le même poids J associé à chaque individus. Dans le calcul de la distance (chi²) entre 2 individus, une modalité de poids de la modalité I/Ik est prise en compte. Ik est la somme des individus qui porte une même modalité donc si la modalité est rare elle va donner plus de poids à l’individus (I/Ik grand). Les individus avec des modalité rare sont mis en évidence.
  • Le profil- colonne soit le profils modalité: la transformation en profils- colonne est est calculé en divisant par Ik donnant soit des 0 ou 1/Ik. Le centre de gravité du nuage de points des modalité est le profil plat soit la moyenne des profils de toutes les modalités. Une modalité qui a un très grand nombre d’individus va avoir un profils qui ressemble au profil moyen. A l’opposé, une modalité rare est toujours loin du centre de gravité du nuage des modalités.

Création de l'AMC sur R:

acm=dudi.acm(tableau de données brute, scannf = FALSE, nf = 2);                            
names(acm); 
s.arrow(acm$co, 1,2, clabel=0,7)

Fait l'ACM et le graphique des flèches avec les modalités.

scatter(acm,col=rainbow)

Fait le graphique des individus pour chaque variables

acm$cr

Donne la contribution relative des variables au axes

Interprétation

L’interprétation de la position d’1 individus se fait par rapport à la position des modalité de cet individus. Un individus i est placé entre l’étoile le triangle et le carré car il possède ces 3 modalités. Un individus est positionné au barycentre des modalités qu’il possède.

L’interprétation d’un modalité se fait par rapport au individus qui la possède. Une modalité est placé au barycentre des individus qui la possède.

Interprétation de la proximité entre modalités ce fait a partir de 2 points de vue/

• Si les modalités est de 2 variables différentes alors il y a une association des modalités

• Si les modalités d’une même variable alors il y a une ressemblance entre classes d’individus

Dans cette exemple, il est difficile de déterminer le lien entre les variables via la disposition des flèches et des axes (gauche). Par contre, en observant les graphiques des plans factoriels des modalités (droite), on constate des modèles récurent, on peut donc estimer que c'est variables sont proches.

Post-Bac
1

Analyse des correspondances Multiples ACM (CM2 et TP2)

Analyse de données multivariées

Définition

Analyse des correspondances Multiples
C'est une méthode d'analyse de variables qualitatives qui ressemble à l'AFC appliqué un tableau disjonctif complet soit un tableau qui regroupe les données d'individus pour plus de 2 variables qualitatives.
Tableau disjonctif complet
C'est un tableau dans qui regroupe plusieurs variables qualitatives pour plusieurs individus. Les modalités de toutes les variables sont en colonnes et les individus en lignes. On note 1 ou 0 la présence ou l'absence de chaque modalité par individus.

Les objectifs de l'ACM sont d'étudier: la ressemblance des individus par le nombre de modalités qu’ils ont en commun (la typologie des individus), résumer l’ensemble des variables par un petit nombre de variables synthétiques (la liaison entre les variables), la ressemblance entre les modalité, la présences ou absences chez un grand nombre d’individus et leurs s’association entre elles (la typologie des modalités).

Concrètement, le principe est de faire une AFC en donnant le même poids à toutes les modalités et tous les individus. Comme en AFC, on produit 2 graphiques à partir de profils- lignes ou -colonnes:

  • Le profil ligne soit le profil individus: la transformation en profils- lignes est calculé en divisant le codage par J. On obtient alors soit des 0 soit 1/J ce qui modifie guère les données. Les poids affectés aux individus sont uniformes car il y a le même poids J associé à chaque individus. Dans le calcul de la distance (chi²) entre 2 individus, une modalité de poids de la modalité I/Ik est prise en compte. Ik est la somme des individus qui porte une même modalité donc si la modalité est rare elle va donner plus de poids à l’individus (I/Ik grand). Les individus avec des modalité rare sont mis en évidence.
  • Le profil- colonne soit le profils modalité: la transformation en profils- colonne est est calculé en divisant par Ik donnant soit des 0 ou 1/Ik. Le centre de gravité du nuage de points des modalité est le profil plat soit la moyenne des profils de toutes les modalités. Une modalité qui a un très grand nombre d’individus va avoir un profils qui ressemble au profil moyen. A l’opposé, une modalité rare est toujours loin du centre de gravité du nuage des modalités.

Création de l'AMC sur R:

acm=dudi.acm(tableau de données brute, scannf = FALSE, nf = 2);                            
names(acm); 
s.arrow(acm$co, 1,2, clabel=0,7)

Fait l'ACM et le graphique des flèches avec les modalités.

scatter(acm,col=rainbow)

Fait le graphique des individus pour chaque variables

acm$cr

Donne la contribution relative des variables au axes

Interprétation

L’interprétation de la position d’1 individus se fait par rapport à la position des modalité de cet individus. Un individus i est placé entre l’étoile le triangle et le carré car il possède ces 3 modalités. Un individus est positionné au barycentre des modalités qu’il possède.

L’interprétation d’un modalité se fait par rapport au individus qui la possède. Une modalité est placé au barycentre des individus qui la possède.

Interprétation de la proximité entre modalités ce fait a partir de 2 points de vue/

• Si les modalités est de 2 variables différentes alors il y a une association des modalités

• Si les modalités d’une même variable alors il y a une ressemblance entre classes d’individus

Dans cette exemple, il est difficile de déterminer le lien entre les variables via la disposition des flèches et des axes (gauche). Par contre, en observant les graphiques des plans factoriels des modalités (droite), on constate des modèles récurent, on peut donc estimer que c'est variables sont proches.

Retour

Actions

Actions