Chapitre 4 : Analyse Factorielle Des Correspondances - Free

1y ago
21 Views
2 Downloads
3.70 MB
24 Pages
Last View : Today
Last Download : 3m ago
Upload by : Abram Andresen
Transcription

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 11/03Chapitre 4 : Analyse factorielle des correspondances binairesObjet – L’analyse Factorielle des Correspondances ou AFC constitue une technique d'analyse statistique d'un ou deplusieurs tableaux de contingences permettant une représentation graphique des attractions et des distances entre lesmodalités des variables choisies.L’analyse factorielle des correspondances (AFC) peut être considérée comme une extensionde l’analyse en composantes principales (ACP). Elle est adaptée au traitement de donnéesqualitatives sans restrictions fortes, son but répond à tout essai d’analyse d’un tableau formépar des observations qualitatives sur des individus ou des catégories. Ce chapitre sera scindéen deux sections :- 1. le tableau de contingences et la mesure des distances,- 2 l’analyse des correspondances binaires,Le chapitre 5 sera consacré à l’analyse des correspondances multiples quand les variablessont purement qualitatives.1. Tableau de contingence et distances entre individus.1.1 Définition du tableau de contingence.Le tableau de contingence1 est un moyen particulier de représenter simultanément deuxcaractères2 observés sur une même population, s'ils sont discrets ou bien continus etregroupés en classes. Les deux caractères sont X et Y, la taille de l'échantillon est n. Lesmodalités ou classes de X seront notées a1,a2, .an, celles de Y sont notées b1,b2, bn. . Lesdonnées initiales sont sur une population, il existe donc une contrainte d’homogénéité dutableau, on étudie donc la répartition d’une population par rapport à deux critères qualitatifsde répartition soit en analyse économique par rapport à une nomenclature préétablie.On note : - ki,j l'effectif conjoint de ai et bj : c'est le nombre d'individus pour lesquels X prendla valeur ai et Y la valeur bj. Ainsi dans un tableau croisant catégories professionnelles (CSP)et diplômes, l’effectif conjoint peut représenter les professions intermédiaires possédant leDEUG.- ki. l'effectif marginal de ligne i :p kj 1i, j ki ,.1Pour un échantillon bidimensionnel discret, ou regroupé en classes, la table de contingence contient les effectifsconjoints des couples de modalités ou des couples de classes. Autrement dit l’observation x(i,j) est placé dans la case decolonne i et de ligne j du tableau de contingence car elle possède les deux modalités i et j comme caractéristique.2Pour recueillir une série statistique, on observe un ou plusieurs caractères sur les individus d'une population.1

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 11/03c'est le nombre d'individus pour lesquels X prend la valeur i , soit poursuivant notre exemplel’ensemble des effectifs de professions intermédiaires pour tous les diplômes.n- k.j l'effectif marginal de colonne j : ki 1i, j k., j c'est le nombre d'individus pour lesquels Yprend la valeur j , soit poursuivant notre exemple l’ensemble des diplômés de niveau DEUGpour toutes les CSP.On représente ainsi ces différentes valeurs dans un tableau à double entrée, dit tableau decontingence.X/Ya1b1 k1,1 .aik i,1. ankn,1Totalk.,1bjk1,j bp Totalk1,.k1,p.ki,p kn,j.kn,pk n,. k.,j k.,pk.,.ki,j.ki,.Chaque ligne et chaque colonne correspond à un sous-échantillon particulier. La ligned'indice i est la répartition sur les p caractères des individus pour lesquels le caractère X prendla valeur ai. La colonne d'indice j est la répartition sur les i caractères lignes des individuspour lesquels le caractère X prend la valeur bj. En divisant les lignes et les colonnes par leurssommes, on obtient sur chacune des distributions empiriques constituées de fréquencesconditionnelles.1.2 Etude des fréquences conditionnelles.La première étape consiste à passer du tableau brut, effectifs contingentés, au tableau desfréquence. Chaque case peut s’interpréter : combien détiennes le caractère X sachant que parailleurs ils possèdent le caractère Y. Dans la mesure où le total sur chaque caractère donnel’univers des possibles, la proportion de contingence renvoie à la notion de probabilitéconditionnelle. Aussi la contingence pose le fait que la case k i,j indique la probabilitéconditionnelle Prob(X i) sachant Prob(Y j). Il est ainsi logique de passer au tableau desfréquences telle que f i,j ki,j / k.Pour comparer les lignes de ce dernier tableau, on fait appel aux profils de lignes. On noterapour chaque case la probabilité conditionnelle « posséder le caractère colonne j sachant quel’on possède le caractère ligne i » soit Prob (Y j X i), soit fréquence de i sachant que l’onest conditionné par l’appartenance à j : f (i j ) soit f ji ki , j / k j , fi , j / fi , avec fi , j ki , j / k , Soit en termes de tableau des profils lignes :2

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 11/03Soit en terme de profils-colonnes :On trouvera les notations f (i j ) ou f ji et, d'autre part, f ( j i ) ou fi j comme alternatives pour lesprofils.3

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 11/031.3 Un exemple : la localisation des ingénieurs suivant le secteur d’activité.Cette présentation sous forme de tableau contingent va être appliquée sur un exemple, il s’agit de lalocalisation, au lieu de travail, des ingénieurs diplômés de grandes écoles scientifiques et techniques,suivant leur secteur de spécialisation. Les résultats proviennent de l’enquête réalisée, début 2001, parle CNISF (Conseil national des ingénieurs et scientifiques de France)3. La répartition retient les 95départements de la France métropolitaine (Corse réunie), les DOM, les TOM et l’étranger (observations n 98). La répartition des variables colonnes reprend les dix spécialités suivantes :- agro : agronomie,- ind : industrie et énergie,- conseil : activités de conseil,- SSII : société de service et d’ingénierie informatique,- Etudes : bureaux d’études et de contrôle,- Finances : activités de finances, banques et assurances,- Telec : télécommunications,- Comm : commerces et services de proximité,- Fonc. Publique : fonction publique et activités non marchandes,- Autres : activités qui ne relèvent pas des précédentes.Dans notre cas k (i,j) représente donc le nombre d’ingénieurs du secteur de spécialisation jdans le département i.Les profils colonne indiqueront donc pour un département la ventilation des ingénieurs entreles divers secteurs ; les profils lignes représenteront la répartition de ces secteurs, au niveaunational, entre les divers départements.La notion de distance prend alors plusieurs interprétations :un département comporte-t-il plus ou moins d’ingénieurs dans une spécialité ;quelle est la part d’une spécialité dans un département donné en rapport aux 12211867617720310400358513Une présentation est donnée de ces résultats dans « 14e enquête sur les rémunérations des ingénieurs », Revue IDCNISF, n 80 bis, septembre 2001.4

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 1010301771168270261241151367287963375245691555

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev ndance numéro d’ordre noms de département et isnePicardie3AllierAuvergne4Alpes Hte-Prov.PACA5Hautes-AlpesPACA6Alpes harentes18CherCentre19CorrèzeLimousin20Haute Corse et Corse du SudPACA21Côte d'OrBourgogne22Côte 6

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev eHaute-Normandie28Eure et le et VilaineBretagne36IndreCentre37Indre et �40LandesAquitaine41Loir et CherCentre42LoireRhône-Alpes43Haute LoireAuvergne44Loire AtlantiquePays de Loire45LoiretCentre46LotMidi-Pyrénées47Lot et GaronneAquitaine48LozèreLang-Roussillon49Maine et LoirePays de 2Haute-MarneChamp-Ardennes53MayennePays de Loire54Meurthe icardie61OrneBasse-Normandie62Pas de CalaisNord63Puy de DomeAuvergne64Pyrénées 6Pyrénées Orient.Lang-Roussillon67Bas RhinAlsace68Haut e-Comté71Saône et LoireBourgogne72SarthePays de Loire73SavoieRhône-Alpes74Haute SavoieRhône-Alpes75ParisIle de France76Seine MaritimeHaute Normandie77Seine et MarneIle de France7

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 11/0378YvelinesIle de France79Les Deux yrénées82Tarn et déePays de Loire86ViennePoitou-Charentes87Haute lfortFranche Comté91EssonneIle de France92Hauts de SeineIle de France93Seine St-DenisIle de France94Val de MarneIle de France95Val d'OiseIle de France96DOM97TOM98EtrangerUne première interprétation peut être donnée à partir des tableaux attraction/répulsion,c’est à dire l’expression générale de la contribution de chaque case à la distance duk .k( f i , j i , , j ) 2k , Chi2 ou χ 2 , soit : d (i, j ) ki , .k , jk , Cette distance ou contribution d’une cellule au χ2 possède une valeur est positive ounulle par construction, dans ce dernier cas la valeur de la cellule correspond à celle detotale conformité avec les structures des marges. Dans la pratique on utilise une formeplus directe privilégiant la dimension ligne, le coefficient de spécificité, ou coefficientde Moran en analyse géographique, il indique, s’il est supérieur à 1, une surreprésentation de la modalité j pour l’observation i, et par symétrie une sousreprésentation quand il est inférieur à 1. Sa valeur est S (i, j ) f ji /( fi , . f , j ) positive ounulle par construction.Cette valeur de ce coefficient représente ici la proportion des ingénieurs du secteur despécialité j dans le département i, ceci par rapport à ce secteur représenterait si larépartition dans ce département était identique à celle de l’ensemble des localisationspossibles (grand total). Ainsi en prenant l’exemple des départements de la régionBourgogne, on remarque que la spécialité agronomie est plus représentée et moins pourles spécialités de la finance et les SSII. Dans nos exemples, la plus forte contribution estles métiers de la finance à Paris.8

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 0,9Ssiietudes Finance telec comm foncpub 50,51,11,21,8Tableau : indicateurs de spécificité : ingénieursDans le traitement de ce type de tableau, l'enjeu principal est d'étudier la dépendancedes deux : répartition des ingénieurs pour un département entre toutes les spécialités etrépartition de la spécialité entre les départements. Deux caractères i et j sontindépendants si la valeur de l'un n'influe pas sur les distributions des valeurs de l'autre.Si c'est le cas, les profils-lignes seront tous peu différents de la distribution empiriquede Y, et les profils-colonnes de celle de X :f ji ki , j / k i , f , j ki , j / k , et fi j ki , j / k , j fi , ki , j / k , C'est équivalent à dire que les fréquences conjointes doivent être proches des produitsde fréquences marginales. fi , j fi , j / k , f i , . f , j ( ki , / k , ) . ( k , j / k , )Les fréquences conjointes d'une part, et les produits de fréquences marginales d'autrepart, constituent deux distributions de probabilité sur l'ensemble produit[a1,a2, .ai, .an] x [b1, b2, .bj, .bp]. Un des moyens de quantifier leur proximité estde calculer la distance du chi-deux de l'une par rapport à l'autre. Dans ce cas particulier,on parle de chi-deux de contingence .Ainsi, la distance du chi-deux de contingence de la distribution empirique f i , j à ladistribution théorique f i , j * f , j f i, .npvaut : D ( χ ) 2i 1 j 1(fi, j f i , . f , j )f i , . f , jnp 1 i 1 j 1ki , jki , .k , jLa première expression est l'application directe de la définition sur les écarts de marges.Pour passer à la seconde, on développe le carré. La distance du chi-deux vaut 0 si lesdeux caractères sont indépendants. Elle est maximale s'il existe une dépendancesystématique. Supposons une table carrée n j et une application bi-univoque Y F(X),pour une certaine fonction bijective F. Sur chaque ligne et chaque colonne du tableaude contingence, une seule case est non nulle, et la distance du chi-deux vaut n-1.Dans l’exemple des ingénieurs,, il est aisé avec un tableur d’obtenir ce calcul d’unedistance au Chi-deux.Dans le tableau de contingence, nous croisons, dans cet exemple, 11 critères de secteursavec 98 critères de localisation. Propre à tout tableau de contingence, puisqu’une ligneet une colonne peuvent être obtenues connaissant les contraintes (f.j et fi.), il y auradonc (n-1) x (p-1) degrés de liberté, soit ici 97 x 10 970.Test d'indépendance entre les lignes et les colonnes actives du tableau de contingence :Valeur observée du khi² (ddl 970) : 9162,47691,01,01,01,01,01,0

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 11/03Le test étant unilatéral, la p-value est comparée au seuil de risque : alpha 0,050 (5%).Suivant la table, la valeur critique du khi² (ddl 970) : 1043,583.La conclusion indique qu’au seuil de risque alpha 0,050, on peut rejeter l'hypothèsenulle d'indépendance entre les lignes et les colonnes. Autrement dite, la dépendanceentre les lignes et les colonnes est significative. La répartition des ingénieurs suivantleur spécialisation n’est pas homogène entre les différentes localisations enregistrées.2 Analyse des correspondances binaires.Dans un sens pratique, on peut avancer que l’analyse des correspondances met envaleur les résultats significatifs d’un tableau de contingence et des contributions auChi2 qui viennent d’être évoquées.Aussi peut-on avancer que la méthode de l’AFC revient en une analyse du tableau decontingence en plusieurs étapes.La première étape revient à réaliser une ACP du tableau des profils lignes. Lesmodalités de type ai en sont les « individus » et les modalités bj les variables.Simplement des différences fondamentales existent puisque ici chaque individu n’a pasle même poids ; il possède le poids attribué à sa fréquence marginale f i , et par ailleurssa distance ne sera plus sa contribution à la variance (donc à l’inertie) mais la distancedu Chi2 le caractérisant.La seconde étape revient à effectuer le processus transposé de la première étape. . Lesmodalités de type bj en sont ici les « individus » et les modalités ai les variables. Lesindividus bj auront comme poids la mesure des distances entre profils colonnes, doncleur contribution au Chi2.La troisième étape est basée sur la comparaison des deux premières par l’analyse desliens entre les ACP constituant les 2 premières étapes. Ceci revient à une analysecroisée des vraisemblance et dissemblance entre profils lignes et profils colonnes.La quatrième et dernière étape, revient à donner une vision synthétique des liaisonsentre lignes et colonnes en comparant distances et proximités dans les profils lignes etcolonnes.2.1 Etape 1 : comparaison des profils lignesLes lignes du tableau du profil ligne permettent de définir la probabilité conditionnellepour chaque individu : Possède-t-il la modalité bj, sachant que par ailleurs, il possède lamodalité ai ? Aussi chaque profil ligne est formé de probabilités qui en terme de margeligne se cumulent sur l’élément certain : la contrainte du tableau croisé fait que toutindividu possédant la modalité ai possédera une modalité b donc une loi de probabilitésur Y.Ainsi la jème coordonnées du profil ligne, notéeoù, traduit la loi deprobabilité de Y sachant que le caractère X i est possédé par l’individu. De ce faitchaque profil ligneest formé d’une loi de probabilité sur J de forme :10

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 11/03sur p dimensions introduit un hyperplangénéréL’ensemble des profils lignespar l’équation x1 x2 xp 1. Alors que dans l’ACP chaque point se voit caractériserpar sa distance à l’origine, ici l’on part de la reconstruction des données en profil-ligneset l’on compare chaquepar rapport à la fréquence de marge de ligneêtre associée. Ainsisurqui peut lui, les profils lignes pondérés, engendre un nuage N(I). Le centre de gravité g de ce nuage ne peut être alors, que la pondération desnprofils lignes pour chaque caractère g J fi , f ji . Donc chaque jème élément de gji 1nvaut f , j puisque i 1nni 1i 1f i , f ji fi , ( fi , f i , j ) fi , j f , jSi l’on considère que ƒJ est le vecteur formé des fréquences marginales de colonne(ƒ.,1, ƒ.,j .ƒ.,p) il vient gj ƒJLes profils-lignes ƒiJ génèrent donc un nuage N(I) dont le centre de gravité s’assimile auprofil ligne marginal ƒJ. Cette situation est reprise dans le graphique suivant dans unesimulation de l’hyperespace dans les trois dimensions.Note :dans ce graphique, on lira f(i,j) comme ƒi,j et fJ comme ƒJ.La géométrie générale du problème de l’AFC est posée ; maintenant il faut évoquer lareprésentation des distances. Au sens de la métrique du Chi2 le produit scalaire de deuxvecteurs x et y, dans un espace Rp , s’écrit :11

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 11/03Il en découle la distance du Chi2 :L’expression permet de vérifier le résultat sur le profil ligne marginal en terme denorme f J2p f J , f J (1/ f , j ) f 2, j 1j 1Le vecteur fJ et le vecteur engendré parscalaire est nulsont orthogonaux puisque leur produitL’inertie totale du nuage N(I) s’obtient en tenant compte du poids de chaque ligne et dela distance au Chi2 :L’inertie totale est une mesure de la correspondance entre les variables qualitatives X etY indépendantes elles mêmes de l’effectif du tableau utilisé. Si l’inertie totale est nullececi signifie que tous les profils lignes fiJ se confondent au point fJ tel que f(i,j)/fi,. f.,jpour tous les croisements i x j, soit l’indépendance entre lignes et colonnes. Ainsi dansle tableau pris comme exemple la valeur de χ 2 est 9162 puisque k correspond à uneffectif de 27.046, l’inertie totale sera de 0,336.4.2.2 Etape 1 suite : ACP des profils lignesLes démarches de la méthode s’assimilent ici totalement à ce qui a été présenté auchapitre 3.Le premier axe principal D1 du nuage N(I) est ainsi la droite qui s’ajuste au mieux parrapport au nuage N(I). Cet axe se détermine en minimisant l’inertie de N(I) en rapport àD1 :est la projection du profil ligne fiJ sur l’axe D1. Par analogie avec l’ACP, iloùest évident que l’axe D1 passe par le centre de gravité fJ du nuage N(I) et est parallèle àune direction u1 ; ce dernier étant le vecteur propre normé au sens de la métrique duChi2 de la matrice A constitué de j x j éléments, tels que :12

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 11/03Intuitivement, on remarque de la taille de l’élément ajj’ à la singularité des fréquences ƒijentre les individus, de ce fait on ne teste plus une situation de corrélation entre descaractères comme dans l’ACP mais une hétérogénéité de la distribution des caractèresentre les individus4.L’axe D1 sera généré par la plus grande valeur propre λ1 de cette matrice ALe centre de gravité ƒJ du nuage N(I) est orthogonal au vecteur caractéristique u. Sauf lecas limite de totale indépendance qui entraînerait un Chi2 nul doncpeut s’écrire 0, le vecteur u1oùreprésente la je composante de la matrice A. Le vecteur u1 est combinaison linéaire de, qui est lui même orthogonal au centre d’inertie.La première composante associée F1 s’assimile à une nouvelle variable où pour chaqueindividu i, F(i) représente la longueur algébrique du segmentc’est à dire la coordonnée de la projectionsur l’axe D1 en prenant commeorigine le centre de gravité ƒJ du nuage N(I). Ceci conduit à :4Une présentation plus précise et détaillée de la constitution de cette matrice A se trouve dans l’ouvrage de JAMBU M.(1989), Exploration informatique et statistique des données, Dunod13

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 11/03La composante principale F1 est ainsi :Qui possède les caractéristiques :1. centrée puisque2 Possède une variance égale à sa valeur propre λ1.Variance égale à l’inertie du nuage N(I) projeté sur l’axe D1, en rapport à fj.Erreur !La qualité de F1 s’apprécie comme pour les ACP en fonction de la part d’inertie dontelle rend compte :Ceci peut s’écrire :n i 1nni 1i 1fi , d 2 ( f Ji , f J ) f i , d 2 ( P.D1( f Ji ), f J ) f i , d 2 ( f Ji , P.D1( fi j ))Soit une décomposition de l’inertie totale entre celle expliquée par l’axe D1 et cellerestant à l’inertie résiduelle :Il en ressort que la part d’inertie expliquée par D1 peut s’exprimer :Toujours par similitude à l’ACP, on peut en déduire les contributions de chaquemodalité à la variance de F1 puisqueOn en déduit que la contribution CTR1(i) de la modalité ai à la variance de F1 dérive dela formuleainsi, par construction, la somme des CTR sur i vaut 1. Unprofil ligne ƒij possède une contribution d’autant plus forte à l’axe principal D1 que leCTR(i) sera élevé.Toujours par analogie aux ACP, la qualité de la représentation du profil ligne fiJ surl’axe D1 sera représentée par le cosinus carré entre l’axe D1 et le vecteur14

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 11/03Autrement dit plus un point fj sera proche de l’axe plus sa projection sur l’axe serasignificative. Dans le graphe suivant on s’intéressera à la longueur des projections(segment de couleur bleu sur les axes).Erreur !De manière générale, si r représente le nombre de composantes r p prises en compte,l’inertie expliquée par l’axe Dh est égale à λh. Ainsi on peut vérifier que la trace de lamatrice A est égale à l’inertie totale. À l’identique, les contributions desmodalités a(i) à la composante principale Fh sont définies parPour l’interprétation, on doit conserver en mémoire de ceci que l’axe D1 se trouvegénéré en particulier par les modalités à forte contribution.En généralisant aussi, la qualité de la représentation des profils ligne fiJ sur l’axe Dhsera représentée par le cosinus carré entre l’axe Dh et le vecteurAvec l’égalité sur la répartition entre composantes des sources d’une distance normée :La distance entre deux profils lignes peut s’écrire sur les r composantes principalesretenues :15

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 11/03On en déduit que deux modalités bien représentées dans le plan principal (F1,F2)possèdent des profils lignes voisins.2.3 Etape 2 réplication sur les profils colonnesNotations et résultats de l’analyse des profils lignes et du nuage N(I) se généralisent àl’analyse N(J) du nuage des profils colonnes. Le nuage N(J) des profils colonnes seprésente comme l’association, à chaque colonne du tableau des profils colonnes, dupoint :Les lignes du tableau du profil colonne permettent de définir la probabilitéconditionnelle pour chaque individu :Possède-t’il la modalité bj, sachant que parailleurs il possède la modalité ai ? Aussi chaque profil colonne est formé de probabilitésqui en termes de marge colonne se cumulent sur l’élément certain. Chaque individuappartient à l’univers des possibles puisqu’il répond à une modalité. La contrainte dutableau croisé fait que tout individu possédant la modalité bj possédera une modalité adonc une loi de probabilité sur X.Ainsi la ième des coordonnées du profil ligne, notéeoù, traduit la loide probabilité de X sachant que le caractère Y bj est possédé par l’individu. De ce faitchaque profil ligneest formé d’une loi de probabilité sur I de forme :sur p dimensions introduit un hyperplangénéréL’ensemble des profils lignespar l’équation y1 y2 yp 1. Alors que dans l’ACP chaque point se voit caractériserpar sa distance à l’origine, ici l’on part de la reconstruction des données en profil-ligneset l’on compare chaquelui être associée. Ainsiun nuage N(J) surpar rapport à la fréquence de marge de colonnequi peutles profils lignes colonnes pondérés, engendrent. Le centre de gravité g de ce nuage est formé de l’ensemble despoints pondérés par la marge.nLa distance du Chi2 est alors définie dans R par le produit scalaireIl en découle la distance du Chi2 :L’inertie totale du nuage N(J) s’obtient en tenant compte du poids de chaque colonne etde la distance au Chi2 :16

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 11/03Les axes principaux E1,E2, .Er du nuage N(J) coupent le centre de gravité fI et sontparallèles aux vecteurs propres normés v1,v2 .vr, associés aux valeurs propres, caractérisant la matrice B dont les éléments s’expriment :Il est facile de comprendre que les valeurs propres des matrices A et B sont identiques,ceci va permettrent d’ailleurs les relations de transitions entre les deux analyses.Les composantes associés G1,G2, .,Gr sont coordonnées des profils colonnesgénérés dans le système d’axes E1,E2, .Er d’origine ƒI. Les composantes principalessont définies par :et la qualité de représentation de la modalité bj sur l’axe Eh est donnée par2.4 La richesse de l’AFC : les relations de transitionEn tenant compte de la construction des profils, on se rend compte que les analyses surun nuage se déduisent de celles de l’autre nuage. Il est aisé de retrouver des relationsqui précèdent que les composantes principales d’un nuage sont reliées linéairement auxdirection des axes principaux de l’autre nuage :De ceci il vient la nécessité d’une référence au même système de valeurs propres pourles matrices A et B, d’une part, et l’établissement des relations de transition d’autrepart. Ces dernières partent de :Ainsi au terme inverse près Fh(i) se situe au barycentre des Gh(j), le poids de Gh(j) estla jéme coordonnée du profil lignePar symétrie, on obtient :17

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 11/03Ainsi au terme inverse près Gh(j) se situe au barycentre des Fh(i), le poids de Fh(i) estla iéme coordonnée du profil colonneLes relations de transition permettent de déduire que:1-les valeurs propres sont toutes inférieures ou égales à l’unité,2-la corrélation entre les composantes principale Fh et Gh est égale àcovarianceentrelesdistancesetlescomposantesλh . Las’exprimeLa corrélation entre dij et Gh, s’exprime par :F (h)(i ) 2Cor 2 (dij , G (h)) 2 id ( fJ , fJ )3-une relation, pour un niveau de composante h, entre le cosinus de l’angle d’unemodalité et la corrélation entre la distance et la composante.2.5 Retour sur l'exempleLa suite reprend pour l’essentiel la sortie des résultats de l’exemple traité avecXLSTAT 5. Ce logiciel est un logiciel commercial qui constitue une annexe de Excel.Utilisant les macros commandes, il est totalement intégré au tableur et ainsi évite toutequestion de transfert de données6Valeurs propres et pourcentage de variance :Valeur propre% variance% cumuléF10,14643,11943,119F2F30,071 0,03820,822 11,28563,941 ,08493,492F70,0102,86796,35

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 11/03 Chapitre 4 : Analyse factorielle des correspondances binaires Objet - L'analyse Factorielle des Correspondances ou AFC constitue une technique d'analyse statistique d'un ou de

Related Documents:

Chapitre 2 Chapitre 3 Chapitre 4 Chapitre 5 Chapitre 6 Chapitre 7 Chapitre 8 Chapitre 9 Chapitre 10 Chapitre 11 Chapitre 12 Chapitre 13. Chapitre 14 Chapitre 15 Chapitre 16 Chapitre 17 Chapitre 18 Chapitre 19 Chapitre 20 Chapitre 21 Épilogue. Prologue : la voie du destin. Angleterre, 1804

Des livres Chapitre XI De la cruauté Chapitre XII Apologie de Raimond de Sebonde Chapitre XIII De juger de la mort d'autruy Chapitre XIV Comme nostre esprit s'empesche soy mesme Chapitre XV Que nostre desir s'accroit par la malaisance Chapitre XVI De la gloire Les Essais Livre II 2. Chapitre XVII De la presumption Chapitre XVIII Du desmentir Chapitre XIX De la liberté de conscience .

III CHAPITRE 1 Définition et principes de la comptabilité 1 CHAPITRE 2 L’écriture comptable 8 CHAPITRE 3 Actif et passif 22 CHAPITRE 4 Charges et produits 31 CHAPITRE 5 La taxe sur la valeur ajoutée 37 CHAPITRE 6 Les achats 48 CHAPITRE 7 Les ventes 56 CHAPITRE 8 Les réductions sur achats et ventes 65 CHAPITRE

sommaire avant-propos v chapitre 1 premier contact 1 chapitre 2 gÉomÉtrie i 13 chapitre 3 couleur i : le noir et blanc 25 chapitre 4 variables i 29 chapitre 5 setup() et draw() 35 chapitre 6 opÉrateurs 39 chapitre 7 structures conditionnelles et itÉratives 45 chapitre 8 interactivitÉ avec la souris 55 chapitre 9 gÉomÉtrie ii : transformations 67

7 Dedication Contents Introduction Chapitre 1: Infested with Parasites! Chapitre 2: In the Classroom Chapitre 3: Magnifying your Microbes Chapitre 4: Bonner's Private Investigation Chapitre 5: A beautiful Case Chapitre 6: Giving Hope to the World Chapitre 7: Getting Through It Chapitre 8: To Each his own Burden Chapitre 9: A Small Hisory of Amoebiasis .

Chapitre 2 : La gestion prévisionnelle des emplois et des compétences. Chapitre 3 : Le recrutement et la sélection du personnel. Chapitre 4 : La formation. Chapitre 5 : La rémunération. Chapitre 6 : L'évaluation du rendement et la mesure des performances. Chapitre 7 : La gestion des carrières.

Table des matières Avant de commencer : les cinq grandes dimensions de la personnalité 5 Avant-propos 9 Chapitre 1 Le visage 11 Chapitre 2 Les mimiques 57 Chapitre 3 La voix et le regard 87 Chapitre 4 Les mains 107 Chapitre 5 Les mouvements et les postures 143 Chapitre 6 Les goûts et préférences 179 Chapitre 7 Les

Social Studies Research and Practice www.socstrp.org 14 Volume 7 Number 1 Spring 2012 VI. The World Economy (3 weeks) Major economic concepts: Comparative advantage, voluntary trade/exchange, barriers to trade, exchange rates, trade deficits and surpluses, internati onal organizations.