Statistiques Param Etriques Et Non Param Etriques E.C .

3m ago
7 Views
0 Downloads
304.20 KB
79 Pages
Last View : 11d ago
Last Download : n/a
Upload by : Helen France
Share:
Transcription

Master de Psychologie Sociale - PSR73B9Statistiques paramétriques et nonparamétriquesE.C. PSR73BPrésentation du cours 2013/2014Organisation matérielleCours et TD de Statistiques : 24 heures.Horaire : mercredi 9h15 - 11h30Contrôle des connaissances :Examen écrit (2 heures)Bibliographie– D.C. Howell. Méthodes statistiques en sciences humaines De Boeck Université– P. Rateau, Méthode et statistique expérimentalesen sciences humaines, Ellipses– S. Siegel, N. Castellan, Non-parametric Statisticsfor the Behavioural Sciences, Mac Graw-Hill, 1988– N. Gauvrit, Stats pour psycho, De Boeck, 2005– J. Navarro, L’essentiel de la statistique en psychologie, Editions Ellipses, 2012Documents fournisTransparents du cours de statistiquesFiches de TD de statistiques.Adresse Webhttp://geai.univ-brest.fr/ carpenti/F.-G. Carpentier - 2013-20141

Master de Psychologie Sociale - PSR73B9ContenuStatistiques :Ce cours vise à présenter les concepts et les procéduresde l’analyse statistique des données en psychologie,en insistant sur les aspects méthodologiques : quellestratégie pour analyser les données ? Quelles sont lesméthodes disponibles pour tester telle hypothèse ? Ilcomporte également des compléments aux méthodesde statistiques descriptives et inférentielles vues en licence :– Statistiques paramétriques : tests de normalité desdistributions parentes ; tests d’homogénéité des variances. Loi de Fisher Snedecor ; analyse de variance.– Statistiques non paramétriques : test de KolmogorovSmirnov ; test de Kruskal-Wallis ; test Q de Cochran ;test de Friedman.– Compléments sur la corrélation et la régression linéairesà 2 ou plusieurs variables. Alpha de Cronbach. Régressionlinéaire pas à pas.– Puissance d’un test : effet calibré, taille d’un effet.F.-G. Carpentier - 2013-20142

Master de Psychologie Sociale - PSR73B9Tester les conditions d’application d’untest paramétriqueConditions d’application du test de StudentLe test de Student est un test paramétrique. Commetous les tests de ce type, son utilisation est soumiseà des conditions d’application ou hypothèses a priorisur la distribution des variables dans les populationsde référence.Rappel : L’application du test de Student (égalité desmoyennes) sur deux groupes indépendants suppose :– La normalité des distributions parentes– L’égalité des variances (homoscédasticité des résidus)Problèmes :– Comment étudier si ces conditions sont respectées ?– Peut-on s’affranchir de ces conditions ?Tests de normalité d’une distributionVariable numérique X définie sur une population(xi ) : valeurs observées sur un échantillon de taille nAu vu de cet échantillon : est-il légitime de supposerque la distribution de X dans la population est une loinormale ?Différents tests proposés : Test de Kolmogorov-Smirnov,test de Lilliefors, test de Shapiro-Wilk.F.-G. Carpentier - 2013-20143

Master de Psychologie Sociale - PSR73B9Tests de Kolmogorov-Smirnov et de LillieforsEchantillon : 8, 9, 9, 10, 10, 10, 11, 13, 14, 14H0 : X est distribuée selon une loi normale dans lapopulationH1 : X n’est pas distribuée selon une loi normale.Construction de la statistique de test :Moyenne observée : x 10.8Ecart type corrigé : sc 2.15Valeurs centrées réduites : zi xizi8 1.309 0.8410 0.37xi xsc110.09131.02141.49Détermination de la distribution cumulative théoriqueet calcul des écarts entre distributions cumulatives observée et théoriquezi 1.3024 0.8372 0.37210.09301.02331.4884F (X xi )F (X xi )0.00.10.30.60.70.80.10.30.60.70.81.0F.-G. Carpentier - 2013-2014F (zi )0.09640.20120.35490.53710.84690.9317Ecart -Ecart 24510.16290.04690.06834

Master de Psychologie Sociale - PSR73B9Comparaison des deux courbes cumulatives :1,00D D-0,750,500,250,0079111315Maximum des écarts absolus : Dobs 0.2451.Taille de l’échantillon : n 10.Dobs est la valeur observée de la statistique de test pourle test de Kolmogorov-Smirnov et celui de Lilliefors.Ces deux tests utilisent la même statistique de test,mais des lois statistiques et donc des tables de valeurscritiques différentes.– Kolmogorov-Smirnov s’utilise lorsque la moyenne etl’écart type de la loi théorique sont connus a priori etsont donc fixés indépendamment de l’échantillon.– Lilliefors s’utilise lorsque la moyenne et l’écart typede la loi normale théorique sont estimés à partir del’échantillon.F.-G. Carpentier - 2013-20145

Master de Psychologie Sociale - PSR73B9Dans l’exemple ci-dessus, c’est le test de Lilliefors quis’applique.Lobs 0.2451Consultation de la table : pour α 5%, Lcrit 0.258.Conclusion : hypothèse de normalité retenue.Remarque : ce test est fréquemment utilisé dans lespublications de psychologie.Si les paramètres de la loi théorique avaient été connusa priori, on aurait utilisé le test de Kolmogorov-Smirnovavec les résultats suivants :Consultation de la table : pour α 5%, Dcrit 0.41Conclusion : hypothèse de normalité retenue.Test de Shapiro-WilkLes statisticiens ont proposé un autre test, nettementplus puissant que les deux tests précédents : le test deShapiro-Wilk.Le calcul de la valeur observée de la statistique detest et de son niveau de significativité est très fastidieux : on utilisera donc un logiciel de statistiques pourle mettre en oeuvre.Ainsi, sur l’exemple précédent, Statistica nous indique :W 0.8849, p 0.1485et la conclusion demeure identique.F.-G. Carpentier - 2013-20146

Master de Psychologie Sociale - PSR73B9Sensibilité des tests précédents aux ex aequo.Test de D’Agostino-PearsonOn observe une variable numérique continue sur unéchantillon de sujets. Cependant (cas fréquent en Psychologie), nous ne pouvons pas obtenir des valeursprécises de cette variable. Seules quelques modalités(par exemple 5 à 7 modalités) sont présentes dans lesrésultats. Les valeurs observées sont donc des arrondis des valeurs réelles et comportent de nombreux exaequo. Par exemple, nous avons évalué un paramètrecontinu à partir de réponses sur une échelle de Likert.La présence d’ex aequo et de “trous” entre les valeursobservées a un effet immédiat sur les tests précédents :il y a de fortes chances que les tests de Lilliefors et deShapiro-Wilk ne permettent pas d’inférer la normalitéde la distribution parente.Aussi, certains auteurs ont mis au point d’autres testsde normalité, fondés sur l’étude de l’asymétrie (skewness) et de l’aplatissement (kurtosis) de la distribution.AsymétriePour une série statistique (xi ) définie sur une population finie d’effectif n, l’asymétrie γ1 est définie par :µ3γ1 3σP(xi µ)3où µ3 et où µ et σ désignent la moyennenet l’écart type.F.-G. Carpentier - 2013-20147

Master de Psychologie Sociale - PSR73B9Les statisticiens utilisent généralement une formuleplus compliquée, qui donne l’estimation g1 de l’asymétriesur une population à partir d’un échantillon (asymétriecorrigée).Pour une distribution symétrique et notamment pourune distribution normale, γ1 0.AplatissementPour une série statistique (xi ) définie sur une population finie d’effectif n, l’aplatissement γ2 est défini par :µ4γ2 4 3σP(xi µ)4où µ4 et où µ et σ désignent la moyennenet l’écart type.De même, une formule dérivée donne l’estimation g2de l’aplatissement sur une population à partir d’unéchantillon (aplatissement corrigé).Pour une distribution normale, γ2 0.Test de d’Agostino-PearsonDeux tests, dont les statistiques Z1 et Z2 suivent approximativement des lois normales centrées réduites,permettent de tester la nullité des paramètres γ1 etγ2 .Le test de d’Agostino-Pearson pose comme hypothèses :H0 : Normalité de la distribution parenteH1 : Défaut de normalité de la distribution parente.F.-G. Carpentier - 2013-20148

Master de Psychologie Sociale - PSR73B9Il utilise comme statistique de test : χ2 Z12 Z22 , quisuit approximativement une loi du χ2 à 2 ddl.Exemple(Xi ) (2, 4, 1, 2, 3, 4, 3, 2, 3, 3, 3, 5, 1, 4, 3, 2,4, 2, 3, 0, 4, 4, 3, 3, 4, 3, 0, 4, 3, 1, 4, 3,3, 3, 1, 4, 3, 3, 4, 3, 3, 3, 3, 1, 5, 2, 3, 5)Les tests de Lilliefors et de Shapiro-Wilk concluent surla non-normalité :Pour Lilliefors : D 0.2641, p 4.872 10 9Pour Shapiro-Wilk : W 0.9018, p 0.0007196.En revanche, les tests sur l’asymétrie et l’aplatissement et le test de D’Agostino donnent :Test Results :STATISTIC :Chi2 Omnibus : 3.2229Z3 Skewness : -1.7038Z4 Kurtosis : 0.5658P VALUE :Omnibus Test : 0.1996Skewness Test : 0.08843Kurtosis Test : 0.5715F.-G. Carpentier - 2013-20149

Master de Psychologie Sociale - PSR73B9Tests d’homogénéité des variancesDeuxième condition d’application d’un test t de Student :égalité des variances.Pour vérifier cette condition : tests de Fisher, de Levene, de Brown et Forsythe et le test de Bartlett (quenous n’étudierons pas).Test de Fisher et loi de Fisher SnedecorExemple. Etude sur la boulimie. Deux groupes desujets : boulimie simple ou “avec vomissements”.Variable dépendante : écart relatif par rapport au poidsnormal.xis2icniSimple4.61219.0449Avec vom. 0.8379.2132Cas généralDeux échantillons de tailles n1 et n2 extraits de deuxpopulations. Moyennes égales ou différentes. Distribution normale de la variable dans les populations parentes.Problème : Les variances dans les populations parentessont-elles égales ?H0 : Les variances sont égalesH1 : La première variance est supérieure à la deuxième.F.-G. Carpentier - 2013-201410

Master de Psychologie Sociale - PSR73B9Statistique de testF s21,cs22,cF suit une loi de Fisher à n1 1 et n2 1 degrés deliberté.Distributions du F de FisherSur l’exemple considéré : Fobs 219.04 2.7679.21Pour α 5%, ddl1 48 et ddl2 31, Fcrit 1.79.On rejette donc l’hypothèse H0 .Inconvénient du test de Fisher : très sensible à undéfaut de normalité.F.-G. Carpentier - 2013-201411

Master de Psychologie Sociale - PSR73B9Test de LeveneOn dispose des valeurs observées xij d’une variabledépendante X dans 2 ou plusieurs groupes.Au vu de ces valeurs, peut-on admettre l’hypothèsed’égalité des variances dans les différents groupes (H0 ),ou doit-on rejeter cette hypothèse, et accepter H1 ?Principe du test :Dans chaque groupe, on forme la série des écarts absolus à la moyenne du groupe : xij xj .On réalise ensuite un test (bilatéral) de comparaisonde moyennes sur ces séries (t de Student ou analysede variance à un facteur).Test de Brown et ForsytheIl s’agit d’une version modifiée du test de Levene, danslaquelle on considère les écarts absolus aux médianes,au lieu des moyennes.Ce test est plus robuste (moins sensible à un défautde normalité) que celui de Levene.F.-G. Carpentier - 2013-201412

Master de Psychologie Sociale - PSR73B9Test de Student dans le cas de variances hétérogènesPour le test t de Student, il existe des formules (approximatives) à utiliser lorsqu’on ne fait pas l’hypothèsed’égalité des variances.– La statistique de test est alors :x1 x2s21cs22c2t avec E En1n2Cette statistique est identique à celle vue l’an dernierlorsque n1 n2 .0– Le nombre de degrés de liberté à prendre en comptedépend des variances observées, mais est en généralstrictement inférieur à n1 n2 2. On retrouve dll n1 n2 2 lorsque n1 n2 et s1c s2c .F.-G. Carpentier - 2013-201413

Master de Psychologie Sociale - PSR73B9Analyse de Variance à un facteurExemple introductif : Test commun à trois groupesd’élèves. Moyennes observées dans les trois groupes :x1 8, x2 10,x3 12.Question : s’agit-il d’élèves ”tirés au hasard” ou degroupes de niveau ?Première situation 011131515.510Gr36791011121314182012Deuxième situation :xiGr155.5666.577.5101214.58F.-G. Carpentier - 2013-201414

Master de Psychologie Sociale - PSR73B9Démarche utilisée : nous comparons la dispersion desmoyennes (8, 10, 12) à la dispersion à l’intérieur dechaque groupe.68101214Boı̂tes à moustaches pour les deux situations proposéesGr2Gr3Gr1Gr2Gr35101520Gr1F.-G. Carpentier - 2013-201415

Master de Psychologie Sociale - PSR73B9Comparer a moyennes sur des groupes indépendantsPlan d’expérience : S Aa Une variable A, de modalités A1 , A2 , . . . , Aa définit agroupes indépendants.Variable dépendante X mesurée sur chaque sujet.xij : valeur observée sur le i-ème sujet du groupe j.Problème : La variable X a-t-elle la même moyennedans chacune des sous-populations dont les groupessont issus ?Hypothèses “a priori” :– distribution normale de X dans chacun des groupes– Egalité des variances dans les populations.Hypothèses du test :H0 : µ1 µ2 . . . µaH1 : Les moyennes ne sont pas toutes égales.F.-G. Carpentier - 2013-201416

Master de Psychologie Sociale - PSR73B9Exemple :15 sujets évaluent 3 couvertures de magazine. Sontelles équivalentes ?xiC113511979C21715991513C314161414121412Variation (ou somme des carrés) totale :SCT (13 12)2 (5 12)2 . . . (12 12)2 174Décomposition de la variation totale :Score d’un sujet Moyenne de son groupe 4-42C30200-2Variation (ou somme des carrés) inter-groupes :SCinter (9 12)2 (9 12)2 . . . (14 12)2 70Variation (ou somme des carrés) intra-groupes :SCintra 42 ( 4)2 . . . ( 2)2 104F.-G. Carpentier - 2013-201417

Master de Psychologie Sociale - PSR73B9Calcul des carrés moyens :CMinter SCinterSCintra 35 ; CMintra 8.67a 1N aStatistique de test :Fobs CMinter 4.04CMintraF suit une loi de Fisher avec ddl1 a 1 2 etddl2 N a 12.RésultatsSourceCRésid.TotalSomme carrés70104174ddl21214Carré Moyen358.67F4.04Pour α 5%, Fcrit 3.88 : H1 est acceptéeF.-G. Carpentier - 2013-201418

Master de Psychologie Sociale - PSR73B9Formules de calcul pour un calcul “à la main”efficaceConstruction de la statistique de test :Notations :n1 , n2 , . . ., na : effectifs des groupes.N : effectif totalT·1 , . . ., T·a : sommes des observations pour chacundes groupes.T·· ou TG : somme de toutes les observations.Somme des carrés totale ou variation totale :XTG22SCT xij Ni,jElle se décompose en une variation “intra-groupes” etune variation “inter-groupes” :SCT SCinter SCintra avec :SCinter aXT·j2j 1SCintra Xi,jF.-G. Carpentier - 2013-2014njx2ij TG2 NaXT·j2j 1nj19

Master de Psychologie Sociale - PSR73B9Formules de calcul (sans recherche d’efficacité)– SCT N (Variance non corrigée de l’ensemble desobservations)– SCinter N (Variance non corrigée du tableau obtenu en remplaçant chaque observation par la moyennede son groupe)C’est la somme des carrés (totale) que l’on obtiendraitsi toutes les observations d’un groupe étaient égales àla moyenne de ce groupe.– SCintra N (Variance non corrigée du tableau desécarts à la moyenne de chaque groupe)C’est la somme des carrés (totale) que l’on obtiendraiten “décalant” chaque observation de façon à avoir lamême moyenne dans chaque groupe.F.-G. Carpentier - 2013-201420

Master de Psychologie Sociale - PSR73B9Carrés moyens :CMinter SCinter;a 1CMintra SCintraN aStatistique de test :F CMinterCMintraF suit une loi de Fisher à (a 1) et (N a) ddl.Présentation des résultatsSource de variationA (inter-groupes)Résiduelle (intra-gr.)TotalSCSCinterSCintraSCTddla 1N aN 1CMCMinterCMintraFFobsRemarqueS’il n’y a que 2 groupes, l’ANOVA équivaut à un T deStudent (bilatéral). F T 2F.-G. Carpentier - 2013-201421

Master de Psychologie Sociale - PSR73B9Pour les deux situations proposées en introduction :Situation 1Analysis of Variance TableResponse : x1groupResidualsDf227Sum Sq80.00063.500Mean Sq40.0002.352F value17.008Pr( F)1.659e-05 ***F value2.7136Pr( F)0.08436 .Situation 2Analysis of Variance TableResponse : x2groupResidualsDf227Sum Sq80.00398.00F.-G. Carpentier - 2013-2014Mean Sq40.0014.7422

Master de Psychologie Sociale - PSR73B9Après l’analyse de variance : tests post hocLa statistique F calculée par l’ANOVA est souvent appelée F omnibus. Si H1 est retenue, il existe au moinsune différence significative entre deux groupes, maisl’ANOVA ne renseigne pas sur les paires de groupespour lesquelles la différence est significative.Utiliser le t de Student pour comparer les groupes deuxà deux ? Peu correct du point de vue statistique.Plusieurs tests de comparaison post hoc ont été proposés.Donnons quelques indications sur :- le test LSD de Fisher- le test de Bonferroni-Dunn- le test HSD de Tukey- le test de DunnettLe test LSD de FisherLSD : least significant differencePour comparer le groupe a et le groupe b, on calculeune statistique t de Student :t xa xbEoù xa et xb sont les moyennes observées dans les deuxgroupes et dans laquelle l’erreur type E est calculée àpartir du carré moyen intra-groupe de l’ANOVA par : 11E 2 CMintra nanb.F.-G. Carpentier - 2013-201423

Master de Psychologie Sociale - PSR73B9Sous H0 , t suit une loi de Student dont le nombre deddl est celui de CMintra , c’est-à-dire N k (nombretotal d’observations moins nombre de groupes).Le seuil et/ou le niveau de significativité sont évaluésde la même façon que dans le cas d’un test de Student.Ce test est peu conservateur (risque important decommettre une erreur de type I, c’est-à-dire de concluresur des différences qui ne sont pas réelles).ExempleOn considère les données suivantes 76475.862.48Le tableau d’ANOVA est le suivant :SourceGroupeRésid.TotalSomme carrés34.8427.1662.00F.-G. Carpentier - 2013-2014ddl21517Carré Moyen17.421.81F9.9224p.002

Master de Psychologie Sociale - PSR73B9Effectuons, par exemple, un test LSD de Fisher pourcomparer les moyennes des groupes 1 et 2.x1 x2 2.7 E 2 1.8105tobs 11 562.70.6639 0.6639 3.31On a ici ddl 15. D’où un niveau de significativitép 0.004723. Les deux groupes semblent significativement différents aussi bien au seuil de 5% qu’au seuilde 1%.Le test de Bonferroni-DunnSoit k le nombre de groupes. On calcule les statistiques t comme dans le cas du test LSD de Fisher,mais, pour énoncer un résultat au seuil α (seuil “familywise”), on fait les tests individuels au seuil “parαcomparaison” αP C où c est le nombre de compack(k 1)raisons à effectuer. Dans le cas général c .2Le test de Bonferroni-Dunn est plus conservatif (moinspuissant) que le test LSD de Fisher. Autrement dit, cetest fait courir moins de risques de commettre une erreur de type I (conclure sur des différences non réelles),mais plus de risques de commette une erreur de typeII (ne pas voir une différence qui existe).F.-G. Carpentier - 2013-201425

Master de Psychologie Sociale - PSR73B9ExempleOn reprend l’exemple précédent.On a ici k 3 et donc c 3. Pour obtenir un résultatau seuil global αF W 1%, chaque test de comparaisonest fait au seuil αP C 0.0033. On ne trouve pas dansles tables “papier” la valeur critique du t de Studentà 15 ddl pour ce seuil, mais on peut l’obtenir à partirde Statistica ou du sitegeai.univ-brest.fr/ carpenti/statistiques/table1.phpOn obtient ainsi : tcrit 3.49, et la différence entre lesgroupes 1 et 2 n’est pas significative selon ce test.Le test HSD de TukeyHSD : honestly significant differenceLe test HSD de Tukey représente un moyen termeentre les deux tests précédents. Le test proposé audépart par Tukey s’applique à des groupes équilibrésmais une variante pour des groupes non équilibrés aégalement été développée.Dans le cas de groupes équilibrés, la statistique calculée Q est égale à la statistique t précédente multipliée par 2. Mais, pour tester la significativité durésultat, on utilise la loi de l’étendue studentisée, quiprend comme paramètres le nombre de groupes (k) etle nombre de degrés de liberté de CMintra (en géné

Master de Psychologie Sociale - PSR73B9 Statistiques param etriques et non param etriques E.C. PSR73B Pr esentation du cours 2013/2014 Organisation mat erielle Cours et TD de Statistiques : 24 heures. Horaire : mercredi 9h15 - 11h30 Contr^ole des connaissances : Examen ecrit (2 heures) Bibliographie {D.C. Howell. M ethodes statistiques en ...