Cahier 2010-04Titre : | Rotation en Analyse des Correspondances Multiples : une procédure de rotation planaire itérative | Résumé : | L’Analyse des Correspondance Multiples (ACM) est une méthode d’analyse multidimensionnelle bien connue pour la description d’un jeu de données qualitatives. Comme en Analyse en Composantes Principales (ACP) ou en Analyse en Facteurs, la rotation peut être utilisée pour simplifier la lecture des résultats numériques. L’idée est d’appliquer une matrice de rotation à la matrice des composantes principales afin de voir se former des groupes de variables et interpréter plus facilement les composantes principales. En ACP, le critère le plus connu est probablement le critère varimax proposé par Kaiser (1958). D’autre part, Kiers (1991) s'est intéressé à ce problème dans le cadre de la méthode PCAMIX qu'il a développée pour l'analyse de données mixtes (qualitatives et quantitatives). Cette méthode inclut ainsi comme cas particuliers l'ACP et l'ACM. Il propose un critère de rotation qui dans le cas purement qualitatif est basé sur les rapports de corrélation entre les variables qualitatives et les composantes principales. Il utilise l'algorithme de De Leeuw et Pruzansky (1978) pour optimiser ce critère. Dans cet article, nous utilisons ce même critère de rotation et nous définissons, dans le cas particulier de deux dimensions (rotation planaire), l'expression analytique de l'angle optimal de rotation. Dans le cas de plus de deux dimensions, nous utilisons la procédure de rotations successives planaires, proposée par Kaiser (1958) pour la rotation en ACP. Une étude sur simulations permet de vérifier l'exactitude de la solution analytique et de visualiser l'impact de la rotation. Enfin, une étude de cas réelle illustre les intérêts potentiels de la rotation en ACM. | Mot(s) clé : | données qualitatives, analyse des correspondances multiples, rapport de corrélation, rotation, critère varimax | Title: | Rotation in Multiple Correspondence Analysis: a planar rotation iterative procedure | Abstract: | Multiple Correspondence Analysis (MCA) is a well-known multivariate method for statistical description of categorical data (see for instance Greenacre and Blasius, 2006). Similarly to what is done in Principal Component Analysis (PCA) and Factor Analysis, the MCA solution can be rotated to increase the components simplicity. The idea behind a rotation is to find subsets of variables which coincide more clearly with the rotated components. This implies that maximizing components simplicity can help in factor interpretation and in variables clustering. In PCA, the probably most famous rotation criterion is the varimax one introduced by Kaiser (1958). Besides, Kiers (1991) proposed a rotation criterion in his method named PCAMIX developed for the analysis of both numerical and categorical data, and including PCA and MCA as special cases. In case of only categorical data, this criterion is a varimax-based one relying on the correlation ratio between the categorical variables and the MCA numerical components. The optimization of this criterion is then reached by the algorithm of De Leeuw and Pruzansky (1978). In this paper, we give the analytic expression of the optimal angle of planar rotation for this criterion. If more than two principal components are to be retained, similarly to what is done by Kaiser (1958) for PCA, this planar solution is computed in a practical algorithm applying successive pairwise planar rotations for optimizing the rotation criterion. A simulation study is used to illustrate the analytic expression of the angle for planar rotation. The proposed procedure is also applied on a real data set to show the possible benefits of using rotation in MCA. | Keyword(s): | categorical data, multiple correspondence analysis, correlation ratio, rotation, varimax criterion | Auteur(s) : | Jérome SARACCO (GREThA UMR CNRS 5113), Marie CHAVENT (IMB UMR CNRS 5251), Vanessa KUENTZ (IMB UMR CNRS 5251) | JEL Class.: | C49 ; C69 | Télécharger le cahier Retour à la liste des Cahier du GRETHA (2010) |
|