Rappels Sur Les Mod

3y ago
31 Views
2 Downloads
441.42 KB
21 Pages
Last View : 21d ago
Last Download : 3m ago
Upload by : Emanuel Batten
Transcription

Rappels sur les modèlesFormation phylogénie – Institut PasteurGuy PerrièreLaboratoire de Biométrie et Biologie ÉvolutiveUMR CNRS n 5558Université Claude Bernard – Lyon 11er octobre 2015Guy Perrière (BBE)Rappels sur les modèles1er octobre 20151 / 21

IntroductionDivergence observéeAppelée p (ou p-distance), c’est l’estimation la plus simple de ladistance entre deux séquences :p n/ avec n le nombre total de substitutions et le nombre de siteshomologues comparés.La distance évolutive réelle (d ) est généralement supérieure à ladivergence observée (p).En faisant des hypothèses sur la nature du processus évolutif, il estpossible d’estimer d à partir de p.Guy Perrière (BBE)Rappels sur les modèles1er octobre 20152 / 21

IntroductionTypes de substitutionsACTGAACGTAACGCT ! C !G !A !T ! C !ACTGAACGTAACGCSubstitution simpleSubstitutions multiplesSubstitutions coïncidentesSubstitutions parallèlesSubstitutions convergentesSubstitution inverseACTGTAGGAATCGCAATGAAAGAATCGCGuy Perrière (BBE)Rappels sur les modèlesACTGAACGTAACGC" A" A" A" T" T " Cp 3/14d 12/141er octobre 20153 / 21

Modéles de MarkovModèlisation markovienne de l’évolutionModèles pour les séquencesd’ADN ou de protéines.Hypothèses des modèlescourants :Temps continu.Homogénéité.Distribution stationnaire :Ch. 1Ch. 2Ch. 3 – Stationnarité atteintedès la racine.Réversibilité.Indépendance des sites.Uniformité du processus :– Une seule matrice detransition.Guy Perrière (BBE)ACTGAACGTAACTAAACGTAACTAAACCTA012tÉvolution des sites d’une séquenced’ADN selon un processus markovienRappels sur les modèles1er octobre 20154 / 21

Modéles de MarkovTaux instantanésSoit qij (i 6 j ) le taux de substitution instantané d’un nucléotide ivers un nucléotide j (i , j {A, C, T, G}).Dans ce cas le taux Pde changement instantané d’un nucléotide i estdéfini comme λi j 6 i qij .L’ensemble des taux de substitutions et des taux de changementspeuvent être regroupés dans une matrice Q (qij ) telle que : λA qAC qAT qAG qCA λC qCT qCG Q qTA qTC λT qTG qGA qGC qGT λGLes sommes en ligne de Q sont égales à 0.Guy Perrière (BBE)Rappels sur les modèles1er octobre 20155 / 21

Modéles de MarkovDynamique de fréquences des basesSoit π(t) (πA (t), πC (t), πT (t), πG (t)) le vecteur ligne des fréquences des nucléotides au temps t.Au temps t dt la fréquence du nucléotide A peut se calculer dela façon suivante :TempsAπA(t)tλAdtt dt1 - λAdtπB(t dt) πA(t dt)CπC(t)qCAdtπA(t dt)TπT(t)GπG(t)qTAdtπA(t dt)qGAdtπA(t dt)avec B {C, T, G}.Guy Perrière (BBE)Rappels sur les modèles1er octobre 20156 / 21

Modéles de MarkovGénéralisationLes fréquences des quatre nucléotides A, C, T et G au tempst dt sont données par le système d’équations différentielles :πA (t dt) πA (t)(1 λA dt) πC (t)qCA dt πT (t)qTA dt πG (t)qGA dtπC (t dt) πC (t)(1 λC dt) πA (t)qAC dt πT (t)qTC dt πG (t)qGC dtπT (t dt) πT (t)(1 λT dt) πA (t)qAT dt πC (t)qCT dt πG (t)qGT dtπG (t dt) πG (t)(1 λG dt) πA (t)qAG dt πC (t)qCG dt πT (t)qTG dtSoit, sous forme matricielle :π(t dt) π(t) π(t)Qdt dπ(t) π(t)QdtGuy Perrière (BBE)Rappels sur les modèles1er octobre 20157 / 21

Modéles de MarkovProbabilités de transitionLa résolution de l’équation précédente donne :π(t) π(0)eQtoù π(0) (πA (0), πC (0), πT (0), πG (0)) est le vecteur ligne desfréquences ancestrales des nucléotides.On pose P(t) eQt la matrice des probabilités de transition duprocessus de Markov, telle que : pAA (t) pAC (t) pAT (t) pAG (t) pCA (t) pCC (t) pCT (t) pCG (t) P(t) pTA (t) pTC (t) pTT (t) pTG (t) pGA (t) pGC (t) pGT (t) pGG (t)Les sommes en ligne de P(t) sont égales à 1.Guy Perrière (BBE)Rappels sur les modèles1er octobre 20158 / 21

Modéles de MarkovStationnaritéLa distribution stationnaire π (πi ) correspond à la distributionvers laquelle un processus de Markov converge lorsque t :lim πi (t) πit Dans le cas des séquences nucléotidiques, les valeurs de πi sontappelées fréquences des bases à l’équilibre.L’existence d’une distribution stationnaire implique que :πP(t) π, t 0ou son équivalent :πQ 0Guy Perrière (BBE)Rappels sur les modèles1er octobre 20159 / 21

Modéles de MarkovRéversibilitéUn processus de Markov est dit réversible si, lorsque la stationnarité est atteinte, on a :πi pij (t) πj pji (t), i , j {A, C, T, G}À l’équilibre, la quantité de changement i j est égale à laquantité de changement j i .Sous l’hypothèse de réversibilité, il est possible d’écrire l’expressiondes valeurs de qij comme :qij πj sij(i 6 j )avec sij sji un terme symétrique, appelé paramètre d’échangeabilité entre i et j .Guy Perrière (BBE)Rappels sur les modèles1er octobre 201510 / 21

Modéles de MarkovMatrices S et ΠSous l’hypothèse de réversibilité, l’expression de Q peut s’écrirecomme étant le produit : · α β γπA 000 α · δ 0 πC 00 Q SΠ β δ · η 00 πT 0 γ η ·000 πGavec S la matrice des écheangeabilités entre nucléotides etΠ diag(πi ) la matrice diagonale contenant les valeurs desfréquences des bases à l’équilibre.Guy Perrière (BBE)Rappels sur les modèles1er octobre 201511 / 21

Modéles de MarkovExpression de QAu moyen du produit matriciel précédent, on en déduit l’expression de Q : λA πC α πT β πG γ πA α λC πT δ πG Q πA β πC δ λT πG η πA γ πC πT η λG λA πC α πT β πG γ λC πA α πT δ πG avecλ πA β πC δ πG η TλG πA γ πC πT ηSoit neuf paramètres à estimer :Modèle GTR (Generalised Time Reversible) ou REV.Guy Perrière (BBE)Rappels sur les modèles1er octobre 201512 / 21

Exemples de modèlesImbrication des modèles9GTR!A, !T, !C, ", #, , %, &, '!A !T !C 1/4" # % '6TN93!A, !T, !C, "R, "Y, #SYM" , #, , % , & , '"R "Y5HKY, F84!A, !T, !C, ", #" #4!C !G (3T92" , #, (!A !T !C 1/4Guy Perrière (BBE)K3P" , #, &# &( 1/221" ', # % , & F81!A, !T, !C, "K2P", #JC"Rappels sur les modèles" #imbric 13 / 211er octobre 2015

Exemples de modèlesParamètres des modèlesπA πC πT πG ¼ACACACACGTGTGTGTJC(α)K2P(α, β)K3P(α, β, γ)SYM(α, β, δ, ε, γ, η)πA πC πT πGAGCACACACTGTGTGTF81(α)Guy Perrière (BBE)HKY, F84(α, β)TN93(αR, αY, β)Rappels sur les modèlesGTR(α, β, δ, ε, γ, η)1er octobre 2015rates14 / 21

Exemples de modèlesCalcul de la distance évolutiveSoit λ, le taux global de substitions dans une séquence. Sousl’hypothèse de réversibilité, ce taux est égal à :Xλ πi λi , i {A, C, T, G}iavec λi le taux de changement instantané d’un nucléotide enn’importe lequel des trois autres.Dans ce cas, la distance évolutive entre deux séquences est donnéepar la formule :Xd 2λt 2πi λi tiSéquence ancestrale!t!tSéquence considéréeGuy Perrière (BBE)Séquence ancestraleSéquence ARappels sur les modèles!tSéquence B1er octobre 201515 / 21

Exemples de modèlesQuelques distances IModèle de Jukes et Cantor (1969) – JC : 34d ln 1 p43Modèle de Kimura (1980) – K2P :11d ln(1 2r v ) ln(1 2v )24avec r la fréquence des transitions et v la fréquence des transversions observées entre les deux séquences (p r v ).Guy Perrière (BBE)Rappels sur les modèles1er octobre 201516 / 21

Exemples de modèlesQuelques distances IIModèle de Felsenstein (1981) – F81 : p d a ln 1 aavec a 1 πA2 πC2 πT2 πG2 .Modèle de Felsenstein (1984) – F84 : r(a1 a2 )vd 2a1 ln 1 2a12a1 a3 πA πGπC πT a1 πA πG πC πTavec a2 πA πG πC πT a3 (πA πG )(πC πT )Guy Perrière (BBE)Rappels sur les modèles1er octobre 201517 / 21

Choix d’un modèleLikelihood Ratio Test (LRT)Soient M0 et M1 deux modèles caractérisés par leurs vecteurs deparamètres ϑ0 et ϑ1 tels que k0 dim(ϑ0 ) et k1 dim(ϑ1 ) :M0 doit être imbriqué dans M1 (k0 k1 ).Le rapport des vraisemblances est donné par : L(ϑ1 )Λ 2 ln 2[ln L(ϑ1 ) ln L(ϑ0 )]L(ϑ0 )avec L(ϑ0 ) et L(ϑ1 ) les vraisemblances associés à M0 et M1 .Pour le calcul du test proprement dit, on considère queΛ χ2 (k1 k0 ).Guy Perrière (BBE)Rappels sur les modèles1er octobre 201518 / 21

Choix d’un modèleArbre de décision du LRTJCIF81JCF81K2PHKYIIHKYIIIGTRJCK2PF81HKYGTRJC !K2P !F81 !HKY !GTR !GTR !GTR !GTR ! IVGTR ! IGTRGTR IGTRHKY !HKY ! IGTR IHKY !HKY ! IHKYHKY IF81 !F81 ! IF81F81 IK2P !K2P ! IHKYHKY IK2PF81 !F81 ! IK2P IF81F81 IJC !K2P !K2P ! IJC ! IK2PK2P IJCJC !JC ! IJC IJCJC IIVlrtGuy Perrière (BBE)Rappels sur les modèles1er octobre 201519 / 21

Choix d’un modèleAkaike Information Criterion (AIC)Test AIC standard :AIC 2 ln L(ϑ) 2kavec k dim(ϑ) le nombre de paramètres du modèle.Test AICc, incluant une correction par la taille de l’échantillon :AICc 2 ln L(ϑ) 2k (k 1) k 1avec la longueur de l’alignement.Dans les deux cas, sélection du modèle présentant la plus faiblevaleur au test.Guy Perrière (BBE)Rappels sur les modèles1er octobre 201520 / 21

Choix d’un modèleBayesian Information Criterion (BIC)Test BIC standard :BIC 2 ln L(ϑ) k ln Comme dans le cas de l’AIC, sélection du modèle présentant laplus faible valeur au test.Approximation du test de comparaison de modèles utilisant lesFacteurs de Bayes :2 ln BF10 BIC1 BIC0Guy Perrière (BBE)Rappels sur les modèles1er octobre 201521 / 21

Rappels sur les mod eles Formation phylog enie { Institut Pasteur Guy Perri ere Laboratoire de Biom etrie et Biologie Evolutive UMR CNRS n 5558 Universit e Claude Bernard { Lyon 1 1er octobre 2015 Guy Perri ere (BBE) Rappels sur les mod eles 1er octobre 2015 1 / 21. Introduction Divergence observ ee Appel ee p (ou p-distance), c’est l’estimation la plus simple de la distance entre deux s .

Related Documents:

Rappels de Statistiques 1 Rappels sur les tests param etriques On suppose que l’on etudie un ph enom ene gouvern e par une loi P θ d ependant d’un param etre θ qui appartient a un ensemble Θ, r eunion disjointe de Θ 0 et Θ 1. On dispose des observations x 1,.,x n du ph enom ene etudi e de loi P θ inconnue. Effectuer un test de H 0: θ Θ 0 contre H 1: θ Θ 1 .

Servomech S.p.A. 01.05.27.BS-ModB.E - Rev. 03 DD (M/Y) 04/21 5 1 MODELS COVERED BY THIS DOCUMENT The present manual is referred to following products: Ball screw jack with travelling nut MA Series: MA 5 BS Mod.B - MA 10 BS Mod.B - MA 25 BS Mod.B - MA 50 BS Mod.B - MA 80 BS Mod.B - MA 150 BS Mod.B - MA 200 BS Mod.B - MA 350 BS Mod.B

OWNER'S MANUAL CENTRAL VACUUM CLEANERS DS MODULAR MOD. DS A01 MOD. DS B01 MOD. DS B02 MOD. DS BC100i MOD. DS C03 MOD. DS CD125i MOD. DS D02 MOD. DS EF125i MOD. DS F03 MOD. DS H02 . Central vacuum cleaner DS F03 125 l- up to 6 operators . 7 Central vacuum cleaner DS H02 175 l- up to 8 operators . 7 Central vacuum cleaner DS .

8 ! 1989 mod 15 9 1 iteration to place, 12 1 9 1 10 d. hash table with second hash function h2(x) 7 (x mod 7) ! 4371 mod 15 6 1323 mod 15 3 6173 mod 15 8 4199 mod 15 14 4344 mod 15 9 9679 mod 15 4 1989 mod 15 9

1 Rappels sur les variables discr etes Exercice 1.1 Un joueur effectue 5 lancers ind ependants d’une pi ece Pile Face.Pour chaque lancer, la probabilit e d’obtenir un Pile vaut p 1 3.On note X le nombre de Pile obtenus sur les 5 lancers. 1. En rappelant en d etail le sch ema de Bernoulli utilis e mais sans d emonstration, justifier que X suit une loi

Email: sales@modulift.com www.modulift.com 27 Mod 600XA/400 28 MOD 600XA/500 29 MOD 600XA/600 30 MOD 600XA/800 31 MOD 600XB/500 32 MOD 600XB/800 33 MOD 600 B/1000 34 Email: sales@modulift.com www.modulift.com Modulift Sets 03 Modulift UK Ltd Modulift Spreader Beams 04 One Beam Many Lifts 05 The Standard Range 06 The Heavy Range 07

territoriales (« ART »), les traités (les traités numérotés, les traités modernes et les traités sur les droits fonciers (« TDF »), les accords sur les établissements des Métis, les ententes d’autonomie gouvenementale (« EAG ») et les revendications spécifiques. Animateur : Jeff Harris, Myers Weinberg LLP (Winnipeg, Manitoba)

Ability Commerce P.O. Box 519 Spicer, MN 56288 Abinette, Jennifer A 1 Innovation Way Merrimack, NH 03054 Abir Yono 4514 Northridge Ct West Bloomfield, MI 48323 Ablajan, Uighur 1 Innovation Way Merrimack, NH 03054 Able Planet Incorporated 10601 W.I-70 Frontage Rd Wheat Ridge, CO 80033 Ables, Amanda 1 Innovation Way Merrimack, NH 03054 Abm Engineering/ Linc Facility Services Los Angeles, CA .