ANALYSE FACTORIELLE CONFIRMATOIRE - Université Laval

1y ago
20 Views
2 Downloads
606.50 KB
43 Pages
Last View : 13d ago
Last Download : 3m ago
Upload by : Jamie Paz
Transcription

STT-7620ANALYSE FACTORIELLE CONFIRMATOIREL’analyse factorielle exploratoire permet d’identifier des facteurs latents à partir devariables mesurées. Elle définit chaque variable latente en y associant un certain nombrede variables mesurées. L’analyse factorielle confirmatoire permet de poursuivrel’analyse en posant des paramètres (loadings) égaux à 0, en permettant aux facteurslatents d’être corrélés, et en ajoutant au besoin des corrélations supplémentaires entres leserreurs résiduelles. Elle définit de façon détaillée les facteurs latents.En principe l’analyse exploratoire et confirmatoire ne se font pas sur le même jeu dedonnées. L’analyse confirmatoire peut chercher à déterminer si un ensemble de questionsdéveloppées dans un certain contexte permet de bien caractériser un phénomène dans uncontexte un peu différent. Il peut s’agir du suivi et de la validation de questionnaires missur pied dans la phase initiale d’un projet de recherche.-1-

EXEMPLE DU MILIEU SOCIO-ECONOMIQUEDans les données sur les étudiants américains (n 3094) on cherche à caractériser lebackground d’un étudiant, à savoir le milieu socio-économique de ses parents et saperformance académique à l’école secondaire. Cette dernière est mesurée par la variableHSRank. Pour caractériser le milieu socio-économique on a utilisé la variable FaEd. Onva maintenant utiliser 3 variablespour cela, à savoir MoEd, FaEd etPaJntInc, (l’éducation de la mère, dupère et le revenu moyen des parents).Le milieu socio-économique del’étudiant (PaSeS) est maintenantune variable latente déterminée par 3variables observées. On a deuxvariables explicatives latentes (ladeuxième variable latente AcRank estconfondue avec la variable observéeHSRank.).-2-

EXEMPLE DU MILIEU SOCIO-ECONOMIQUELe diagramme précédent spécifie que MoEd, FaEd et PaJntInc sont conditionnellementindépendantes de HSRank étant donné PaSeS. En d’autres termes les corrélationsobservées entre MoEd, FaEd, PaJntInc et HSRank sont toutes déterminées par lacorrélation 12 entre les deux variables latentes du modèle et par les loadings , et .112131Si le diagramme ci-haut décrit bien la réalité et si la variable latente PaSeS est unevariable explicative pour les trois variables endogènes DegreAsp, Selctvty et Degree,alors l’analyse de régression avec variable observée où FaEd caractérise le milieu socioéconomique (voir partie 1) sous estime la force de la relation entre PaSeS et les variablesdépendantes. En effet selon le diagramme, FaEd mesure PaSeS avec une erreur 2.En régression, la force de la relation entre une variable explicative mesurée avec erreurset la variable dépendante est plus faible que si la variable explicative est mesurée sanserreur.-3-

DÉFINITION DU MODÈLESous forme matricielle X 1 11 0 1 X 0 1 2 221 ,où X 3 31 0 2 3 X 0 42 4 4 21 1 2 est la matrice de 2 2 12variances covariances des variableslatentes et diag ( 21 , 22 , 23 , 24 ) est lamatrice de variances covariancesrésiduelles.Ce modèle a la même forme qu’un modèle factoriel exploratoire à m 2 facteurs sauf que(i) on permet des variances quelconques et une corrélation pour les variables latentes et(ii) des loadings (paramètres ) sont fixés à 0, 0 .12-4-223241

DÉFINITION DU MODÈLEOn a vu, dans l’étude des modèles d’analyse factorielle exploratoire, que d 3 variablesobservées donnent un modèle à une variable latente saturé (il n’y a aucun degré de libertépour tester l’ajustement du modèle). Le modèle avec d 3 à une variable latente pourMoEd, FaEd et PaJntInc s’ajuste donc parfaitement.Le modèle étudié ici spécifie en plus que les trois corrélations entre HSrank et (MoEd,FaEd, PaJntInc) s’expliquent toutes par la corrélation entre PaSES et HSrank. Etudierl’ajustement du modèle c’est évaluer la véracité de cette hypothèse.-5-

ÉCRITURE DE LA MATRICE DE VARIANCES-COVARIANCES THÉORIQUE.La matrice de variances-covariances de X est une matrice 4x4 (note d 4 NX dans lanotation de LISREL). Pour la calculer on utilise le fait que les erreurs sontindépendantes des variables latentes et donc que E( 0. Ainsi, en général, ( ) aune forme semblable à celle rencontrée en analyse factorielle exploratoire, ( ) x E ( ') x ' E ( ')Pour le modèle à l’étude, 21 000 11 0 2 2 0 000 0 2 1 2112131 1 ( ) 21 20 3 0 00 42 0 31 0 1 2 22 0 0 2 00 4 42 0En effectuant les produits matriciels on obtient l’expression suivante. 112 21 21 11 21 21 11 31 21 11 42 1 2 22222 1121 21 2131 2142 11211 2 ( ) 22222 11 31 21 31 1 31 1 3 31 42 1 2 1 222 11 42 21 42 1 2 31 42 1 2 42 2 4 1 2 -6-

DÉFINITION DES VARIABLES LATENTESLes paramètres du modèle précédent ne sont pas tous identifiables car les variableslatentes peuvent être définies de plusieurs façons :1. On peut faire comme dans l’analyse exploratoire et standardiser les variableslatentes en imposant 21 22 1 . Le seul paramètre non estimable dans le modèleprécédent est alors 24 car la deuxième variable latente est proportionnelle à unevariable observée2. Pour donner des unités de mesure à chaque variable latente, on peut fixer un loadingégal à 1 pour chaque construit. Si on pose 1, la première variable latente ales mêmes unités que PaJntInc alors que la deuxième est égale à HSRank.Évidemment 24 n’est toujours pas estimable dans ces conditions.3. On a en d(d 1)/2 4x5/2 10 degrés de liberté dans une matrice de variancescovariances 4x4 et 8 paramètres à estimer. Il reste donc 2 degrés de liberté pourtester l’ajustement du modèle.31-7-42

ESTIMATEUR DU MAXIMUM DE VRAISEMBLANCELe modèle postule que les Xi suivent une loi normale de moyenne (un vecteur 4x1) etde matrice de variances covariances ( ) où est les vecteurs des 8 paramètres de lamatrice de variances covariances (on pose 1 et 24 0 ) :31 21 21 2 21 1 ( ) 31 21 1 2 42 21 2 212 2 2 21 31 2 31 2 21 31 2 312 2 2 21 31 11211 211131 2 21 31 1 2 . 1 2 2 2 1 2Notons que ( ) satisfait les deux égalités22 ( )13 ( ) 24 31 1 21 1 2 ( )12 ( )34 21 1 31 1 2 1 et 1.22 ( )23 ( )14 21 31 1 1 2 ( )13 ( ) 24 31 1 21 1 2La matrice de variances covariances empiriques S ne satisfait pas ces égalités, il faut doncutiliser un algorithme itératif pour trouver une matrice ( ) qui soit le plus prêt possiblede S.-8-

ESTIMATEUR DU MAXIMUM DE VRAISEMBLANCEMoins la log-vraisemblance des données s’écrit( ) n 1log ( ) log S tr[S ( ) 1 ] d 2où d est le nombre de variables X observées et S est la matrice de variances-covariances.Dans l’exemple on a d 4 variables (MoEd, FaEd, PaJntInc, HSRank ) de plus 1.510 1.133S 1.452 0.110 1.133 1.452 0.110 2.283 2.125 0.150 et ( ˆ) 2.125 7.017 0.113 0.150 0.113 0.604 1.510 1.135 1.447 0.098 1.135 1.447 0.098 2.283 2.122 0.144 ,2.122 7.017 0.183 0.144 0.183 0.604 où ( ˆ) représente la matrice ( ) évaluée à l’estimateur du maximum de vraisemblance ˆ . Cet estimateur est obtenu en minimisant ( ) à l’aide d’un algorithme itératif(attention des problèmes de convergence sont possibles!).-9-

TESTS D’AJUSTEMENTNotons que ( ˆ) mesure l’écart entre la matrice de variances covariances empirique S etson estimateur ( ˆ) . En fait ( ˆ) 0 si S ( ˆ) . La magnitude de ( ˆ) permet dejuger de l’ajustement du modèle CFA à l’étude. La statistique du chi-deux pour testerl’ajustement du modèle est d2( d 1)/2 p 2 ( ˆ) (n 1) F S , ( ˆ) .On rejette au seuil l’hypothèse que le modèle s’ajuste bien si 2 ( ˆ) d2( d 1)/2 p ,1 , lepercentile 100(1- ) du chi deux à d(d 1)/2-p degrés de liberté (ici 2 degrés de libertéssont associés à ce test). Notons qu’il n’y a pas de correction de Bartlett pour un modèleCFA quelconque. Dans la sortie LISREL,F S , ( ˆ) log ( ) log S tr[S ( ) 1 ] dest le Minimum fit function pour le modèle. En fait le test du rapport de vraisemblancen’est pas suffisant pour juger de la qualité d’un ajustement et plusieurs autres statistiqueson été mises de l’avant pour ce faire.- 10 -

ETUDE DES RÉSULTATSDans la sortie on regarde :1. Les variances estimées de variables latentes (une variable latente intéressante varie!)2. Les tests pour H0 : ji 0 pour savoir si les variables mesurées contribuent de façonsignificative aux variables latentes construites;3. Les R2 de chaque variable observée pour voir le pourcentage de sa variabilitéexpliquée par les variables latentes;4. Les estimations ˆ s des loadings standardisés pour déterminer les variables les plusijassociées à chaque variable latente;5. Les indices d’ajustement pour vérifier si le modèle s’ajuste bien aux données;- 11 -

AJUSTEMENT DU MODELEPROGRAMME RPROGRAMMATION SAS :library(sem)cov -matrix(c(1.510,1.133,1.452,0.110,1.133, 2.283, 2.125, 0.150,1.452, 2.125, 7.017, 0.113,0.110, 0.150, 0.113, 0.604),byrow T, nrow 4, ncol 4,dimnames ,"FaEd","PaJntInc","HSRank")))data afc(type cov);type "COV";infile cards missover;input name MoEd FaEd PaJntInc HSRank;datalines;MoEd1.510FaEd1.133 2.283PaJntInc 1.452 2.125 7.017HSRank0.110 0.150 0.113 0.604;model1 - specify.model()PaSES - MoEd, NA, 1PaSES - FaEd, lam21, NAPaSES - PaJntInc, lam31, NAAcRank - HSRank, NA, 1MoEd - MoEd, e1, NAFaEd - FaEd, e2, NAPaJntInc - PaJntInc, e3, NAHSRank - HSRank, NA, 0PaSES - PaSES, vf1, NAAcRank - AcRank, vf2, NAPaSES - AcRank, covF1F2, NAproc calis data afc cov pcorr nobs 3094;LINEQSMoEd F PaSES E1,FaEd lambda 21 F PaSES E2,PaJntInc lambda 31 F PaSES E3,HSRank F AcRank;STDF PaSES var PaSES,F AcRank var AcRank,E1-E3 var e1-var e3;COVF PaSES F AcRank cov;VAR MoEd FaEd PaJntInc HSRank;run;afc - sem(model1, cov, 3094)summary(afc)- 12 -

PROGRAMME SIMPLISQuatre variables pour le statut parental et laperformance scolaireObserved VariablesMoEd FaEd PaJntInc HSRankCorrelation Matrix1.610 1.446 .531 1.115 .128 .055 1Standard deviations1.229 1.511 2.649 .777Sample Size 3094Latent Variables: PaSES ACRankRelationships:MoEd 1*PaSESFaEd PaJntInc PaSESHSRank 1*ACRankSet the error Variance of HSRank to 0Number of Decimals 3Wide PrintPath DiagramEnd of ProblemProgramme LISRELTI Quatre variables pour le statut parental et laperformance scolaire!DA NI 4 NO 3094 MA CMSY 'C:\Documents and Settings\***\CFA02-06.DSF'MO NX 4 NK 2 TD SYLKPaSES ACRankFI TD(4,4)FR LX(2,1) LX(3,1)VA 1 LX(1,1)VA 1 LX(4,2)PDOU SC ND 3Note :LK Donne le nom des variables latentesTD Theta DeltaSY SymmetricFI fixe des paramètresFR spécifie les paramètres libresVA donne une valeur spécifique à unparamètre(Ce programme pose 1)3142- 13 -

SORTIE SAS :Matrice de variances covariances empirique (S):MoEdMoEd1.510FaEd1.133PaJntInc st Variable Equations with EstimatesMoEdFaEdStd Errt ValuePaJntIncStd Errt ValueHSRank 1.0000 F PaSES1.4665*F PaSES0.0483 lambda 2130.36631.8692*F PaSES0.0627 lambda 3129.79941.0000 F AcRank 1.0000 E11.0000 E2 1.0000 E3 1 1.467ˆx 1.869 00 0 0 1 Cette partie de la sortie SAS donne les éléments de la matrice des coefficients structuraux ˆij(loadings). Tous les coefficients sont significatifs.- 14 -

Variances of Exogenous VariablesVariableF PaSESF AcRankE1E2E3Parametervar PaSESvar AcRankvar e1var e2var r tValue0.03984 19.430.01536 39.330.02852 25.810.04875 12.690.13323 32.37Covariances Among Exogenous VariablesVar1Var2ParameterF PaSESF AcRank covEstimateStderrtValue0.098140.01392 7.050.7740 0.0981 ˆ 0.0981 0.6040 000 0.7360 0Ces parties de la sortie SAS renseigne sur les éléments de la matrice de0.618500 ˆ variances covariances des variables latentes ( ̂ ) et sur les éléments de 004.31270 la matrice de variances covariances des erreurs pour les variables 0000 ˆobservées ( ).Comme en régression, le modèle décompose la variance de chaque variable en une partie prédite parle modèle et une partie résiduelle. Par exemple,var( FaEd ) ˆ212 ˆ 2 ˆ 2 1.4672 0.774 0.6185 2.28311- 15 -

Manifest Variable Equations with Standardized EstimatesMoEd 0.7159 F PaSES 0.6982 E1FaEd 0.8539*F PaSES 0.5205 E2lambda 21PaJntInc 0.6208*F PaSES 0.7840 E3lambda 31HSRank 1.0000 F AcRank ˆijsSquared Multiple CorrelationsErrorTotalVariableVarianceVariance 54.Correlations Among Exogenous VariablesVar1F PaSESVar2ParameterF AcRank covEstimate0.14354Ces parties de la sortie SAS donne les loadings standardisés qui sont les corrélations entre lesvariables observées et les variables latentes. Par exemple, la corrélation entre MoEd et PaSES est de ˆ11s 0.7159 . De plus, le R2 de la régression de PaSES sur MoEd est de 51.26%. La dernièrestatistique nous renseigne sur la corrélation entre les deux variables latentes, soit r 0.14354.- 16 -

L’information sur l’ajustement du modèle peut être résumée dans le diagramme de cheminementsuivant :Diagramme de cheminement des variables latentesEffets standardisésd’origineEstimateurs des paramètres- 17 -

Interprétation des sortiesLe loading standardisé (standardized solution) est défini comme étant ˆijs ˆ 2j ˆij ,c’est le loading qu’on aurait obtenu si on avait fixé la variance de la variable latente à 1.Dans l’exemple précédent, le loading standardisé pour FaEd est ˆijs .774 1.467 1.290Par contre le loading complètement standardisé (completely standardized solution) estcelui qui tient également compte de la variance de la variable ˆijcs ˆ 2j / si2 ˆijDans l’exemple précédent, le loading complètement standardisé pour FaEd est ˆijs .774 / 2.283 1.467 0.854Dans LISREL les effets standardisés donnent les loadings complètement standardisés.Standardized SolutionCompletely Standardized Rank- 18 -PaSES0.7160.8540.621--ACRank---1.000

INDICES D’AJUSTEMENTTous les programmes pour les modèles d’équations structurelles rapportent plus d’unetrentaine d’indices pour évaluer l’ajustement d’un modèle. Le principal défaut du testd’ajustement du rapport de vraisemblance est qu’il dépend de n. Il a tendance à êtresignificatif lorsque n est grand même si le modèle s’ajuste relativement bien. Plusieursalternatives au test du chi-deux ont été mises de l’avant pour évaluer l’ajustement. On a,par exemple, essayer de généraliser le R2 de la régression qui s’écrit :( yi yˆ i )2SSres 2.R 1 1 2(y y)SS itotEn mot, c’est un moins la proportion de la variabilité de y qui n’est pas expliquée par lemodèle de régression.Le GFI (goodness of fit index) reprend cette formule avec SSres F S , ( ˆ) etSStot F S , (0) , où (0) est une matrice de variance covariances de référence donttous les paramètre sont fixes (peut-être que (0) est la matrice identité). Comme valeurde SStot le NFI (normed fit index) prend plutôt SStot F S ,diag( ˆ12 ,., ˆ d2 ) oùF S ,diag( ˆ12 ,., ˆ d2 ) Fi est proportionnelle à la statistique du chi-deux pour testerl’hypothèse d’indépendance,- 19 -

d2( d 1)/2 (n 1) F S ,diag( ˆ12 ,., ˆ d2 ) (n 1) Fi .Rappelons que si cette statistique est petite, disons du même ordre de grandeur que sesdegrés de liberté, l’hypothèse d’indépendance entre les d variables est acceptable. Il estinutile de poursuivre l’analyse.Le Normed fit index est donc 1 moins la proportion du chi-deux d’indépendance qui resteune fois que le modèle a été ajusté,Fi F S , ( ˆ) F S , ( ˆ) .NFI 1 FiFi(attention : peut être inférieur à 1 même si le modèle s’ajuste bien ; cet indice peut sousestimer la qualité de l’ajustement !)Certaines mesures, comme le adjusted goodness of fit index (AGFI) s’inspirent du R2ajusté,n 12Radj 1 (1 R 2 )n p 1(on rappelle que p est le nombre de paramètres du modèle d’équations structurelles).Une version un peu compliquée du NFI, le non normed fit index (NNFI), compare lesindices 2 divisés par leur degré de liberté pour le modèle d’indépendance et le modèle àl’étude :- 20 -

NNFI Fi / [d ( d 1) / 2 d ] F S , ( ˆ) / [d ( d 1) / 2 p]Fi / [d (d 1) / 2 d ] n .Le comparative fit index de Bentler estmax ( n 1) F S , ( ˆ) d ( d 1) / 2 p,0 .CFI 1 ˆmax (n 1) F S , ( ) d ( d 1) / 2 p,( n 1) Fi d ( d 1) / 2,0 L’ajustement du modèle est jugé satisfaisant si ces indices sont supérieurs à environ 90%.Le « parsimonious normed fit index », PNFI, multiplie le NFI par {d(d 1)/2-p}/{d(d1)/2}, la proportion des paramètres de dépendance non utilisée par le modèle. Une valeurfaible indique que le modèle utilise un pourcentage important des paramètres disponibles.Un autre indice mesure le manque d’ajustement. Le root mean squared errorapproximation (RMSEA), F S , ( ˆ) 1 RMSEA max ,0 d (d 1) / 2 p n 1 qui doit être inférieur à 6%.- 21 -

Goodness of Fit Statistics (LISREL)ECVI for Saturated Model 0.00647 ECVI forIndependence Model 0.888Degrees of Freedom 2 d(d 1)/2-pMinimum Fit Function Chi-Square 7.405 (P 0.0247) Test d’ajustement du modèle (Hypothèsenulle: le modèle postulé décrit bien la relation entreles variables, Alternative : le modèle ne décrit pasbien cette relation)Normal Theory Weighted Least Squares Chi-Square 7.372 (P 0.0251)Estimated Non-centrality Parameter (NCP) 5.37290 Percent Confidence Interval for NCP (0.491 ;17.733)Minimum Fit Function Value F S , ( ˆ) 0.00239Chi-Square for Independence Model with 6 Degreesof Freedom 2739.195Test d’indépendance, Hypothèse nulle: Les 4variables du modèle sont indépendantes (les 6paramètres de covariance sont nuls)Independence AIC 2747.195 Model AIC 23.372Saturated AIC 20.000 Independence CAIC 2775.344 Model CAIC 79.670 Saturated CAIC 90.372(AIC Akaike Information Criterion)Normed Fit Index (NFI) 0.997Non-Normed Fit Index (NNFI) 0.994Parsimony Normed Fit Index (PNFI) 0.332Comparative Fit Index (CFI) 0.998Incremental Fit Index (IFI) 0.998Relative Fit Index (RFI) 0.992(livre p. 89-90) 7.405/3093Population Discrepancy Function Value (F0) 0.0017490 Percent Confidence Interval for F0 (0.000159 ;0.00573)Root Mean Square Error of Approximation (RMSEA) 0.0295 .00239 / 2 1/ 309390 Percent Confidence Interval for RMSEA (0.00891 ; 0.0535) P-Value for Test of Close Fit(RMSEA 0.05) 0.915Critical N (CN) 3848.465Root Mean Square Residual (RMR) 0.0228Standardized RMR 0.0116Goodness of Fit Index (GFI) 0.999Adjusted Goodness of Fit Index (AGFI) 0.994Parsimony Goodness of Fit Index (PGFI) 0.200Expected Cross-Validation Index (ECVI) 0.0075690 Percent Confidence Interval for ECVI (0.00598 ;0.0116)- 22 -

Bentler's Comparative Fit Index0.9979Normal Theory Reweighted LS Chi-Square 7.3963Akaike's Information Criterion3.4288Bozdogan's (1987) CAIC-10.6457Schwarz's Bayesian Criterion-8.6457McDonald's (1989) Centrality0.9991Bentler & Bonett's (1980) Non-normed Index0.9938Bentler & Bonett's (1980) NFI 0.9972James, Mulaik, & Brett (1982) Parsimonious NFI0.3324Z-Test of Wilson & Hilferty (1931) 1.9794Bollen (1986) Normed Index Rho1 0.9915Bollen (1988) Non-normed Index Delta2 0.9979Hoelter's (1983) Critical N2496INDICE D’AJUSTEMENT DE LA SORTIE SAS(LISTE ÉCOURTÉE)Fit Function0.0024Goodness of Fit Index (GFI)0.9988GFI Adjusted for Degrees of Freedom (AGFI)0.9940Root Mean Square Residual (RMR)0.0228Parsimonious GFI (Mulaik, 1989)0.3329Chi-Square7.4288Chi-Square DF2Pr Chi-Square0.0244Independence Model Chi-Square2628.6Independence Model Chi-Square DF6RMSEA Estimate0.0296RMSEA 90% Lower Confidence Limit0.0091RMSEA 90% Upper Confidence Limit0.0537ECVI Estimate0.0076ECVI 90% Lower Confidence Limit0.0060ECVI 90% Upper Confidence Limit0.0116Probability of Close Fit0.9133- 23 -

CONCLUSIONS POUR LE PREMIER EXEMPLE:2Statistique du chi deux (et obs/ 2 3.71) un peu grande ; ceci est sans douteattribuable à la grande taille d’échantillon ;Cette grande valeur vient du fait que la corrélation observée de 0.055 entre PaJntIncet HSRank est beaucoup plus petite que la corrélation prédite .089. En fait PaJntIncmesure le volet économique du milieu socio économique parental alors que les deuxautres variables sont associés à l’aspect académique de ce milieu. HSRank quimesure la performance académique est plus corrélée avec MoEd et FaEd qu’avecPaJntInc. On pourrait raffiner le modèle en distinguant deux aspects, académique etéconomique, au milieu parental.Les indices d’ajustement sont bons, cependant les indices de parcimonie sontfaibles ; le modèle utilise beaucoup de paramètres pour modéliser 10 degrés deliberté ;Le R2 de .386 pour PaJntInc est faible et pose la question à savoir si cette variableest vraiment utile pour caractériser le niveau socio-économique des parents. Notonscependant que le loading associé à cette variable, ˆ13 1.869 , est significativementdifférent de 0 (t 30). Ceci suggère de conserver cette variable dans le modèle.Le alpha de Cronbach pour la variable latente PaSES est de .77. Les 3 items sousjacents sont bien associés à un même construit latent.- 24 -

ANALYSE FACTOREILLE CONFIRMATOIRE : QUE FAIRE SIL’AJUSTEMENT EST MAUVAISLe bon ajustement d’un modèle d’analyse factorielle confirmatoire signifie que l’analystea identifié une structure plausible pour le phénomène étudié. Évidemment, cette structureplausible n’est pas unique et il est possible qu’une analyse des mêmes données avec unautre modèle donne des résultats aussi bons!Que faire si le modèle postulé ne s’ajuste pas bien? On peut1. Rejeter le modèle étudié comme étant incapable de bien représenter la structure desdonnées à l’étude.2. Choisir le modèle qui s’ajuste le mieux parmi une liste dressée a priori des modèlessusceptibles de bien expliquer les données.3. Modifier le modèle en se basant sur des mesures d’ajustement et sur des statistiquesdiagnostiques dont nous allons discuter maintenant.On distingue souvent deux types d’erreurs, externes et internes. L’oubli d’une variableimportante pour l’analyse est une erreur externe alors que l’omission d’un lien entre deuxvariables de l’analyse est une erreur interne. Une bonne connaissance du domained’application des équations structurelles offre une certaine protection contre les erreursexternes. Des outils statistiques sont disponibles pour mettre en lumière les erreursinternes.- 25 -

Modification Indices (MI) et Expected Parameter Change (EPC)Ces deux classes de statistiques sont des outils pour détecter et corriger les erreursinternes pour un modèle.On peut ajouter au modèle des paramètres structuraux ou éventuellement descovariances entre les variables observées, c’est-à-dire des éléments non nuls hors de ladiagonale de la matrice .Si un paramètre est fixé à 0 dans la spécification initiale du modèle on peut étudier lebien fondé de cette décision en testant l’hypothèse H0 : 0. Une statistique score,souvent appelé test du multiplicateur de Lagrange, peut être utilisée dans ce cas.L’intérêt d’un test score est qu’il peut être calculé sans faire un nouvel ajustement dumodèle, en y ajoutant un nouveau possiblement non nul. En analyse d’équationsstructurelles les MI sont les statistiques chi-deux observées, à un degré de liberté, pour lestests scores de paramètres fixés à 0 lors de l’ajustement initial du modèle.On va maintenant construire des variables latentes pour les variables endogènes dansl’exemple du milieu socio-économique. Dans l’exemple de diagramme de cheminementavec variables observée, on avait trois variables endogènes DegreAsp Selctvty Degree. On va chercher à mieux caractériser l’ambition et le milieu socio-économique enles définissant à partir de plusieurs variables observées.- 26 -

CFA POUR LA MOTIVATION ACADEMIQUE, LE PRESTIGE DU COLLEGE ETLE STATUT SOCIO-ECONOMIQUEOn a 7 variables observées X1 AcAbilty, X2 SelfConf, X3 DegreAsp, X4 Selctvty,X5 Degree, X6 OcPrestg X7 Income. La matrice de variances covariances à 522.647On veut exprimer ces variables en terme de trois variables latentes, à savoir 1 Motivation académique, 2 Prestige du collège et 3 Statut socio-économique de lafaçon suivante,X1 AcAbilty, X2 SelfConf, X3 DegreAsp 1 Motivation académique,( AcMotiv )X4 Selctvty 2 Prestige du collège (ColgPres )X5 Degree, X6 OcPrestg X7 Income 3 Statut socio-économique (SES)- 27 -

UN PROBLEME POTENTIELEn principe, dans un modèle d’analyse factorielle confirmatoire, deux variables associéesà une même variable latente devraient être plus corrélées entre elles que si elles étaientassociées à deux variables latentes différentes. En effet, dans ce dernier cas la corrélationentre les deux variables vient seulement de la corrélation entre les deux variables latentes.Dans cet exemple, les corrélations entre Degree et Income est de .106 alors que lacorrélation Degree DegreAsp est de .253. Ces corrélations contreviennent à la règlegénérale énoncée plus haut. Elle laisse planer un doute concernant la qualité du modèlepostulé. On note également la faible corrélation de Income avec toutes les .2540.1550.07410.4810.10610.1361Note: les de Cronbach pour Degree , OcPrestg ,Income (correlation moyenne rm .241, s 0.49) et AcAbilty, SelfConf, DegreAsp (rm .310, s 0.57) ne satisfont pas le critère3rm s 0.7 .1 2rm- 28 -

Le modèle de CFA est décrit par les matrices suivantes 11 0 0 21 31 0 x 0 42 00 0 0 00 0 0 2 0 10 1 2 53 1 3 63 73 2 2 1 22 2 31 3 2 33 21 0 20 2 00 et 00 00 00 00 00000000 20000 20000 20000 2000034560 0 0 0 0 0 2 7 Sample Size 3094Latent Variables: AcMotiv ColgPres SESRelationships:AcAbilty 1*AcMotivSelfConf AcMotivDegreAsp AcMotivSelctvty 1*ColgPresDegree 1*SESOcPrestg SESIncome SESSet the error Variance of Selctvty to 0Number of Decimals 3Wide PrintPath DiagramEnd of ProblemLe programme SIMPLIS et sa sortie sont :Observed VariablesAcAbilty SelfConf DegreAsp SelctvtyDegree OcPrestg IncomeCorrelation Matrix1.487 1.236 .206 1.382 .216 .214 1.242 .179 .253 .254 1.163 .090 .125 .155 .481 1.064 .040 .025 .074 .106 .136 1Standard deviations.744 .782 1.014 1.990 .962 1.591 1.627- 29 -

LISREL Estimates (Maximum Likelihood)Goodness of Fit StatisticsMeasurement EquationsAcAbilty 1.000*AcMotiv, Errorvar. 0.193 R 0.651(0.0161)11.972Degrees of Freedom 12Minimum Fit Function Chi-Square 155.501 (P 0.0)Minimum Fit Function Value 0.0503Population Discrepancy Function Value (F0) 0.045990 Percent Confidence Interval for F0 (0.0341 ;0.0600)Root Mean Square Error of Approximation (RMSEA) 0.061890 Percent Confidence Interval for RMSEA (0.0533; 0.0707)P-Value for Test of Close Fit (RMSEA 0.05) 0.0116SelfConf 0.765*AcMotiv, Errorvar. 0.401 R² 0.345(0.0371)(0.0138)20.60529.045DegreAsp 0.568*AcMotiv, Errorvar. .912 R² 0.113(0.0387)(0.0244)14.67137.415Selctvty 1.000*ColgPres,, R² 1.000Degree 1.000*SES, Errorvar. 0.287(0.0430) 6.671, R² 0.690Expected Cross-Validation Index (ECVI) 0.0601 (ou.0606 selon le livre p.107)90 Percent Confidence Interval for ECVI (0.0483 ;0.0742)OcPrestg 1.151*SES, Errorvar. 1.685 , R² 0.334(0.0808)(0.0708)14.25423.801.5CS 1.151(.639/2.531) .578Income 0.309*SES, Errorvar. 2.586 , R² 0.0230(0.0452)(0.0663)6.83338.985Chi-Square for Independence Model with 21 Degreesof Freedom 3526.069Independence AIC 3540.069Model AIC 185.852 Saturated AIC 56.000Independence CAIC 3589.330Model CAIC 298.447 Saturated CAIC 253.042On note le petit R2 de 2.3%Covariance Matrix of Independent 40.478(0.013)(0.035)14.37713.631Normed Fit Index (NFI) 0.956Non-Normed Fit Index (NNFI) 0.928Parsimony Normed Fit Index (PNFI) 0.546Comparative Fit Index (CFI) 0.959Incremental Fit Index (IFI) 0.959Relative Fit Index (RFI) 0.923Critical N (CN) 522.490Root Mean Square Residual (RMR) 0.0540Standardized RMR 0.0370Goodness of Fit Index (GFI) 0.986Adjusted Goodness of Fit Index (AGFI) 0.967Parsimony Goodness of Fit Index (PGFI) 0.423SES0.639(0.048)13.325- 30 -

Faits saillants de l’analyse :1-Income contribue très peu à la variable SES (R² 0.0230)22- Mauvais ajustement 12 153.85 .Les degrés de liberté sont calculés de la façon suivante dl 7*8/2-6-4- 6 12 où 6 #variances résiduelles, 4 # paramètres qui varient, 6 # de paramètres dans la matrice . En fait ce modèle compte 6 4 6 16 paramètres.On va chercher les aspects les plus problématiques du modèle à l’aide des indices demodification (MI) et ajouter certains paramètres au modèle- 31 -

The Modification Indices Suggest to Add thePath from Decrease in 9.5SES85.3AcMotiv8.6New Estimate0.05-0.10-0.070.050.27-0.31La suggestion qui baisse le plus la statistique chi-deux n

La matrice de variances-covariances de X est une matrice 4x4 (note d 4 NX dans la notation de LISREL). Pour la calculer on utilise le fait que les erreurs sont indépendantes des variables latentes et donc que E( 0. Ainsi, en général, () a une forme semblable à celle rencontrée en analyse factorielle exploratoire,

Related Documents:

Traitement des données Chapitre 4 : Analyse factorielle des correspondances, rev 11/03 Chapitre 4 : Analyse factorielle des correspondances binaires Objet - L'analyse Factorielle des Correspondances ou AFC constitue une technique d'analyse statistique d'un ou de

ALFA LAVAL OIL PURIFIER ALFA LAVAL MOPX 207 Oil Purifier Alfa Laval FOPX 607,FOPX 609,FOPX 610 Oil Purifier Alfa Laval Mab 204,mab 205,mab 206,mab 207 Oil Purifier Alfa Laval Mab 103,Mab 104 Oil Purifier B u s i n e s s S e g m e n t s. MARINE ENGINE SPARE

Alfa Laval están marcadas individualmente con el número de pieza y la marca Alfa Laval. Las piezas Alfa Laval se entregan embaladas con marcas y etiquetas Alfa Laval, que es la garantía de su autenticidad. Acepte sólo piezas con marcas y embalajes de Alfa Laval. Recuerde que Alfa Lav

Alfa Laval is a trademark registered and owned by Alfa Laval Corporate AB. Alfa Laval reserves the right to change specification without prior notification. Selection Selection and pricing is to be performed with our Alfa Laval air heat exchanger selection software. Selection output includes all relevant technical data and dimensional drawings.

este manual, póngase en contacto con un representante de Alfa Laval. 1.3 Condiciones de la garantía A menos que se indique lo contrario mediante acuerdo por escrito, se aplican las condiciones de garantía estándar de Alfa Laval. 1.4 Compromiso con el medio ambiente Alfa Laval se esf

Alfa Laval led the way in adaptive oil treat-ment with Alcap, which lets the Alfa Laval S separator adjust automatically to oil composi-tion. Today, the Alfa Laval adaptive fuel line offers even more efficient engine protection. Synchronization with the e

Alfa Laval is a trademark registered and owned by Alfa Laval Corporate AB. 2 Alfa Laval reserves the right to change specifications without prior notification. MDD00609EN 1703 White paper Table of contents 1. Summa

Lisa Little, Joan Wagner, and Anne Sutherland Boal 216 13. Emergency Preparedness and Response Yvonne Harris 232 14. Nursing Leadership through Informatics Facilitating and Empowering Health Using Digital Technology Shauna Davies 249 15. Regulation, the Law, Labour Relations, and Negotiations Beverly Balaski 261 16. Emerging Nursing Leadership Issues Brendalynn Ens, Susan Bazylewski, and Judy .