RegressioneLogistica: Un Modello Per Variabili .

3y ago
23 Views
2 Downloads
2.39 MB
228 Pages
Last View : 16d ago
Last Download : 3m ago
Upload by : Ryan Jay
Transcription

Regressione Logistica: un Modello perVariabili Risposta CategorialiNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali1 / 54

IntroduzionePremessaI modelli di regressione hanno lo scopo di studiare le determinanti di variabilirisposta quantitative (continue)Tuttavia è possibile costruire modelli di regressione anche per variabilirisposta categoriali e/o discreteIl caso delle variabili discrete è particolarmente complessoNel caso delle variabili categoriali possiamo distinguere 3 casi:1 Variabili risposta dicotomiche o binarie (del tipo 0 1, V-F, Sı̀-No, ecc.);2 Variabili risposta politomiche o multinomiali ordinali (almeno 3 categorie dirisposta ordinate);3 Variabili risposta politomiche o multinomiali non ordinali o nominali (almeno3 categorie di risposta ordinate).Nicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali2 / 54

IntroduzionePremessaI modelli di regressione hanno lo scopo di studiare le determinanti di variabilirisposta quantitative (continue)Tuttavia è possibile costruire modelli di regressione anche per variabilirisposta categoriali e/o discreteIl caso delle variabili discrete è particolarmente complessoNel caso delle variabili categoriali possiamo distinguere 3 casi:1 Variabili risposta dicotomiche o binarie (del tipo 0 1, V-F, Sı̀-No, ecc.);2 Variabili risposta politomiche o multinomiali ordinali (almeno 3 categorie dirisposta ordinate);3 Variabili risposta politomiche o multinomiali non ordinali o nominali (almeno3 categorie di risposta ordinate).Nicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali2 / 54

IntroduzionePremessaI modelli di regressione hanno lo scopo di studiare le determinanti di variabilirisposta quantitative (continue)Tuttavia è possibile costruire modelli di regressione anche per variabilirisposta categoriali e/o discreteIl caso delle variabili discrete è particolarmente complessoNel caso delle variabili categoriali possiamo distinguere 3 casi:1 Variabili risposta dicotomiche o binarie (del tipo 0 1, V-F, Sı̀-No, ecc.);2 Variabili risposta politomiche o multinomiali ordinali (almeno 3 categorie dirisposta ordinate);3 Variabili risposta politomiche o multinomiali non ordinali o nominali (almeno3 categorie di risposta ordinate).Nicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali2 / 54

IntroduzionePremessaI modelli di regressione hanno lo scopo di studiare le determinanti di variabilirisposta quantitative (continue)Tuttavia è possibile costruire modelli di regressione anche per variabilirisposta categoriali e/o discreteIl caso delle variabili discrete è particolarmente complessoNel caso delle variabili categoriali possiamo distinguere 3 casi:1 Variabili risposta dicotomiche o binarie (del tipo 0 1, V-F, Sı̀-No, ecc.);2 Variabili risposta politomiche o multinomiali ordinali (almeno 3 categorie dirisposta ordinate);3 Variabili risposta politomiche o multinomiali non ordinali o nominali (almeno3 categorie di risposta ordinate).Nicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali2 / 54

IntroduzionePremessaI modelli di regressione hanno lo scopo di studiare le determinanti di variabilirisposta quantitative (continue)Tuttavia è possibile costruire modelli di regressione anche per variabilirisposta categoriali e/o discreteIl caso delle variabili discrete è particolarmente complessoNel caso delle variabili categoriali possiamo distinguere 3 casi:1 Variabili risposta dicotomiche o binarie (del tipo 0 1, V-F, Sı̀-No, ecc.);2 Variabili risposta politomiche o multinomiali ordinali (almeno 3 categorie dirisposta ordinate);3 Variabili risposta politomiche o multinomiali non ordinali o nominali (almeno3 categorie di risposta ordinate).Nicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali2 / 54

Regressione LogisticaRegressione LogisticaSi consideri una variabile risposta dicotomica Y . Essa prende valori 0 o 1Solitamente si parla, rispettivamente, di fallimento e successoRicordiamo che la µ(Y ) E (Y ) è pari alla proporzione di soggetti per i qualisi osserva il successo (Σ1/n)Quindi i modelli di regressione logistica stimano le proporzioni dei successi inuna popolazioneOvviamente P(y 1) rappresenta la probabilità di osservare un successo perciascun soggetto della popolazioneNel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c.binomialeNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali3 / 54

Regressione LogisticaRegressione LogisticaSi consideri una variabile risposta dicotomica Y . Essa prende valori 0 o 1Solitamente si parla, rispettivamente, di fallimento e successoRicordiamo che la µ(Y ) E (Y ) è pari alla proporzione di soggetti per i qualisi osserva il successo (Σ1/n)Quindi i modelli di regressione logistica stimano le proporzioni dei successi inuna popolazioneOvviamente P(y 1) rappresenta la probabilità di osservare un successo perciascun soggetto della popolazioneNel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c.binomialeNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali3 / 54

Regressione LogisticaRegressione LogisticaSi consideri una variabile risposta dicotomica Y . Essa prende valori 0 o 1Solitamente si parla, rispettivamente, di fallimento e successoRicordiamo che la µ(Y ) E (Y ) è pari alla proporzione di soggetti per i qualisi osserva il successo (Σ1/n)Quindi i modelli di regressione logistica stimano le proporzioni dei successi inuna popolazioneOvviamente P(y 1) rappresenta la probabilità di osservare un successo perciascun soggetto della popolazioneNel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c.binomialeNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali3 / 54

Regressione LogisticaRegressione LogisticaSi consideri una variabile risposta dicotomica Y . Essa prende valori 0 o 1Solitamente si parla, rispettivamente, di fallimento e successoRicordiamo che la µ(Y ) E (Y ) è pari alla proporzione di soggetti per i qualisi osserva il successo (Σ1/n)Quindi i modelli di regressione logistica stimano le proporzioni dei successi inuna popolazioneOvviamente P(y 1) rappresenta la probabilità di osservare un successo perciascun soggetto della popolazioneNel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c.binomialeNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali3 / 54

Regressione LogisticaRegressione LogisticaSi consideri una variabile risposta dicotomica Y . Essa prende valori 0 o 1Solitamente si parla, rispettivamente, di fallimento e successoRicordiamo che la µ(Y ) E (Y ) è pari alla proporzione di soggetti per i qualisi osserva il successo (Σ1/n)Quindi i modelli di regressione logistica stimano le proporzioni dei successi inuna popolazioneOvviamente P(y 1) rappresenta la probabilità di osservare un successo perciascun soggetto della popolazioneNel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c.binomialeNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali3 / 54

Regressione LogisticaRegressione LogisticaSi consideri una variabile risposta dicotomica Y . Essa prende valori 0 o 1Solitamente si parla, rispettivamente, di fallimento e successoRicordiamo che la µ(Y ) E (Y ) è pari alla proporzione di soggetti per i qualisi osserva il successo (Σ1/n)Quindi i modelli di regressione logistica stimano le proporzioni dei successi inuna popolazioneOvviamente P(y 1) rappresenta la probabilità di osservare un successo perciascun soggetto della popolazioneNel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c.binomialeNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali3 / 54

Regressione LogisticaLa distribuzione binomialePer dati categoriali, possono verificarsi le seguenti condizioni:1 Ciascuna osservazione cade in una di due categorie2 Le probabilità per le due categorie sono le stesse per ciascuna osservazione.Indichiamo le probabilità con π per la categoria 1 e (1 π) per la categoria 23 I risultati di osservazioni successive sono indipendenti. Cioè, il risultato peruna osservazione non dipende dal risultato delle altre osservazioniUn buon esempio è rappresentato dal lancio di una moneta: due possibilirisultati (T o C), probabilità costante ad ogni lancio (π 0.50) e il risultatoad ogni lancio è indipendente dai precedentiNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali4 / 54

Regressione LogisticaLa distribuzione binomialePer dati categoriali, possono verificarsi le seguenti condizioni:1 Ciascuna osservazione cade in una di due categorie2 Le probabilità per le due categorie sono le stesse per ciascuna osservazione.Indichiamo le probabilità con π per la categoria 1 e (1 π) per la categoria 23 I risultati di osservazioni successive sono indipendenti. Cioè, il risultato peruna osservazione non dipende dal risultato delle altre osservazioniUn buon esempio è rappresentato dal lancio di una moneta: due possibilirisultati (T o C), probabilità costante ad ogni lancio (π 0.50) e il risultatoad ogni lancio è indipendente dai precedentiNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali4 / 54

Regressione LogisticaLa distribuzione binomialePer dati categoriali, possono verificarsi le seguenti condizioni:1 Ciascuna osservazione cade in una di due categorie2 Le probabilità per le due categorie sono le stesse per ciascuna osservazione.Indichiamo le probabilità con π per la categoria 1 e (1 π) per la categoria 23 I risultati di osservazioni successive sono indipendenti. Cioè, il risultato peruna osservazione non dipende dal risultato delle altre osservazioniUn buon esempio è rappresentato dal lancio di una moneta: due possibilirisultati (T o C), probabilità costante ad ogni lancio (π 0.50) e il risultatoad ogni lancio è indipendente dai precedentiNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali4 / 54

Regressione LogisticaLa distribuzione binomialePer dati categoriali, possono verificarsi le seguenti condizioni:1 Ciascuna osservazione cade in una di due categorie2 Le probabilità per le due categorie sono le stesse per ciascuna osservazione.Indichiamo le probabilità con π per la categoria 1 e (1 π) per la categoria 23 I risultati di osservazioni successive sono indipendenti. Cioè, il risultato peruna osservazione non dipende dal risultato delle altre osservazioniUn buon esempio è rappresentato dal lancio di una moneta: due possibilirisultati (T o C), probabilità costante ad ogni lancio (π 0.50) e il risultatoad ogni lancio è indipendente dai precedentiNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali4 / 54

Regressione LogisticaLa distribuzione binomialePer dati categoriali, possono verificarsi le seguenti condizioni:1 Ciascuna osservazione cade in una di due categorie2 Le probabilità per le due categorie sono le stesse per ciascuna osservazione.Indichiamo le probabilità con π per la categoria 1 e (1 π) per la categoria 23 I risultati di osservazioni successive sono indipendenti. Cioè, il risultato peruna osservazione non dipende dal risultato delle altre osservazioniUn buon esempio è rappresentato dal lancio di una moneta: due possibilirisultati (T o C), probabilità costante ad ogni lancio (π 0.50) e il risultatoad ogni lancio è indipendente dai precedentiNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali4 / 54

Regressione LogisticaDefinizione:Probabilità per una Distribuzione BinomialeSia π la probabilità che un’osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di xsuccessi per la categoria 1 èP(x) n!π x (1 π)n x ,x!(n x)!x 0, 1, 2, . . . , n.Il simbolo n! è chiamato n fattoriale. Rappresenta n! 1 2 3 · · · n. Ad esempio, 1! 1, 2! 1 2 2, 3! 1 2 3 6,e cosı̀ via. Per definizione, 0! è pari a 1.Sostituendo ad x il valore del numero di successi desiderato per n e π fissati,si avrà la P(x), cioè la probabilità di avere x successi in n lanci della monetaNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali5 / 54

Regressione LogisticaDefinizione:Probabilità per una Distribuzione BinomialeSia π la probabilità che un’osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di xsuccessi per la categoria 1 èP(x) n!π x (1 π)n x ,x!(n x)!x 0, 1, 2, . . . , n.Il simbolo n! è chiamato n fattoriale. Rappresenta n! 1 2 3 · · · n. Ad esempio, 1! 1, 2! 1 2 2, 3! 1 2 3 6,e cosı̀ via. Per definizione, 0! è pari a 1.Sostituendo ad x il valore del numero di successi desiderato per n e π fissati,si avrà la P(x), cioè la probabilità di avere x successi in n lanci della monetaNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali5 / 54

Regressione LogisticaDefinizione:Probabilità per una Distribuzione BinomialeSia π la probabilità che un’osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di xsuccessi per la categoria 1 èP(x) n!π x (1 π)n x ,x!(n x)!x 0, 1, 2, . . . , n.Il simbolo n! è chiamato n fattoriale. Rappresenta n! 1 2 3 · · · n. Ad esempio, 1! 1, 2! 1 2 2, 3! 1 2 3 6,e cosı̀ via. Per definizione, 0! è pari a 1.Sostituendo ad x il valore del numero di successi desiderato per n e π fissati,si avrà la P(x), cioè la probabilità di avere x successi in n lanci della monetaNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali5 / 54

Regressione LogisticaDefinizione:Probabilità per una Distribuzione BinomialeSia π la probabilità che un’osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di xsuccessi per la categoria 1 èP(x) n!π x (1 π)n x ,x!(n x)!x 0, 1, 2, . . . , n.Il simbolo n! è chiamato n fattoriale. Rappresenta n! 1 2 3 · · · n. Ad esempio, 1! 1, 2! 1 2 2, 3! 1 2 3 6,e cosı̀ via. Per definizione, 0! è pari a 1.Sostituendo ad x il valore del numero di successi desiderato per n e π fissati,si avrà la P(x), cioè la probabilità di avere x successi in n lanci della monetaNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali5 / 54

Regressione LogisticaDefinizione:Probabilità per una Distribuzione BinomialeSia π la probabilità che un’osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di xsuccessi per la categoria 1 èP(x) n!π x (1 π)n x ,x!(n x)!x 0, 1, 2, . . . , n.Il simbolo n! è chiamato n fattoriale. Rappresenta n! 1 2 3 · · · n. Ad esempio, 1! 1, 2! 1 2 2, 3! 1 2 3 6,e cosı̀ via. Per definizione, 0! è pari a 1.Sostituendo ad x il valore del numero di successi desiderato per n e π fissati,si avrà la P(x), cioè la probabilità di avere x successi in n lanci della monetaNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali5 / 54

Regressione LogisticaDefinizione:Probabilità per una Distribuzione BinomialeSia π la probabilità che un’osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di xsuccessi per la categoria 1 èP(x) n!π x (1 π)n x ,x!(n x)!x 0, 1, 2, . . . , n.Il simbolo n! è chiamato n fattoriale. Rappresenta n! 1 2 3 · · · n. Ad esempio, 1! 1, 2! 1 2 2, 3! 1 2 3 6,e cosı̀ via. Per definizione, 0! è pari a 1.Sostituendo ad x il valore del numero di successi desiderato per n e π fissati,si avrà la P(x), cioè la probabilità di avere x successi in n lanci della monetaNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali5 / 54

Regressione LogisticaDefinizione:Probabilità per una Distribuzione BinomialeSia π la probabilità che un’osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di xsuccessi per la categoria 1 èP(x) n!π x (1 π)n x ,x!(n x)!x 0, 1, 2, . . . , n.Il simbolo n! è chiamato n fattoriale. Rappresenta n! 1 2 3 · · · n. Ad esempio, 1! 1, 2! 1 2 2, 3! 1 2 3 6,e cosı̀ via. Per definizione, 0! è pari a 1.Sostituendo ad x il valore del numero di successi desiderato per n e π fissati,si avrà la P(x), cioè la probabilità di avere x successi in n lanci della monetaNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali5 / 54

Regressione LogisticaProprietà di una distribuzione binomialeProprietà di una distribuzione binomialeLa distribuzione binomiale tende alla simmetria per π 0.50 ed èperfettamente simmetrica quando π 0.50 conpµ nπ, σ nπ(1 π).Ciò vale anche per la distribuzione campionaria di π̂Inoltre tale comportamento si ha anche per valori di π vicini a 0 o a 1, mamolto più lentamenteNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali6 / 54

Regressione LogisticaProprietà di una distribuzione binomialeProprietà di una distribuzione binomialeLa distribuzione binomiale tende alla simmetria per π 0.50 ed èperfettamente simmetrica quando π 0.50 conpµ nπ, σ nπ(1 π).Ciò vale anche per la distribuzione campionaria di π̂Inoltre tale comportamento si ha anche per valori di π vicini a 0 o a 1, mamolto più lentamenteNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali6 / 54

Regressione LogisticaProprietà di una distribuzione binomialeProprietà di una distribuzione binomialeLa distribuzione binomiale tende alla simmetria per π 0.50 ed èperfettamente simmetrica quando π 0.50 conpµ nπ, σ nπ(1 π).Ciò vale anche per la distribuzione campionaria di π̂Inoltre tale comportamento si ha anche per valori di π vicini a 0 o a 1, mamolto più lentamenteNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali6 / 54

Regressione LogisticaProprietà di una distribuzione binomialeProprietà di una distribuzione binomialeLa distribuzione binomiale tende alla simmetria per π 0.50 ed èperfettamente simmetrica quando π 0.50 conpµ nπ, σ nπ(1 π).Ciò vale anche per la distribuzione campionaria di π̂Inoltre tale comportamento si ha anche per valori di π vicini a 0 o a 1, mamolto più lentamenteNicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali6 / 54

Regressione LogisticaProprietà di una distribuzione binomialeDistribuzione campionaria di π̂ per vari valori di π e nn 5 10ProbabilityProbabilityp 5 .5p 5 .1p̂p̂0.51.00p 5 .51.0p 5 .51.0p 5 .51.0p 5 .1n 5 50ProbabilityProbabilityp 5 .5p 5 .1p̂.50p̂1.00p 5 .1n 5 100ProbabilityProbabilityp 5 .5p 5 .1p̂.501.0p̂0p 5 .1Nicola Tedesco (Statistica Sociale)Regressione Logistica: un Modello per Variabili Risposta Categoriali7 / 54

Regressione LogisticaProprietà di una distribuzione binomialeDistribuzione campionaria di π̂ per vari valori di π e nn 5 10Prob

Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per VariabiliRisposta Categoriali 3 / 54 Regressione Logistica Si consideri una variabile risposta dicotomica Y. Essa prende valori 0 o 1

Related Documents:

La probabilità di successo (xi) dipende dai valori assunti dalle variabili esplicative (non stocastiche) X1, X2, Modello di regressione per logit[ (xi)] Modello di regressione logistica Il modello è lineare nei parametri: lo score per l’unità i è una combinazione lineare dei valori osservati xi1 xi,k-1

adly modello cc anno inter.code . aeon modello cc anno inter.code cobra/cx sport 50/90/100 ytx4l-bs aprilia rsv r modello cc anno inter.code scarabeo 4t 50 01-05 yb9-b scarabeo 4t 4v 50 10 yb9-b scarabeo 4t rst 50 06 yb9-b . arctic cat quad modello cc anno inter.code 5006ytx5l-bs 9006ytx5l-bs dvx 25006ytx12-bs 40006ytx9-bs

Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Introdurre tante variabili in un’analisi non ha molto senso, né al livello biologico, né al livello statistico.! Il modello diventa troppo complesso.!

Corso di Statistica Medica Un modello di regressione multipla spiega la variabile dipendente Y in funzione di k variabili esplicative o regressori , con k 2: Per convenzione la prima variabile esplicativa x1 assume valore 1. Il primo coefficiente di regressione β1 rappresenta l’intercetta del modello.

Fisher-Rosemount srl Via Pavia, 21 I-20053 Muggiò (MI), Italia Tel. 39 039 27021 Fax 39 039 2780750 email info.it@emersonprocess.com web www.emersonprocess.it AVVISO IMPORTANTE La presente guida rapida illustra le fasi per l’installazione del misuratore di portata Vortex Modello 8800C Rosemount . La

Sistemi e Modelli CA 2019‐2020 Prof. Laura Giarré 3 Variabili di stato:variabili che descrivono la “situazione interna” del sistema (determinata dalla storia) necessarie per determinar

La media condizionale (E(Y x)) deve essere compresa tra 0 e 1. Si utilizza quindi il modello di regressione logistica π(x) che soddisfa questo requisito. La distribuzione bernoulliana descrive la distribuzione degli errori e quindi sarà la distribuzione su cui l’analisi statistica è incentrata.

Usaha Kesehatan Mata Penyakit mata banyak terdapat di Indonesia (menular dan tidak menular) Penyakit mata menular 1. Conjunctivitis yaitu suatu penyakit mata yang sering terjadi pada bayi karena ibunya gonorrhoea. Mata bengkak, bernanh dan tidak dapat berubah. 2. Trachoma (belek) yaitu suatu penyakit mata yang disebabkan oleh virus. Mata gatal, sering berair, bulu mata membalik ke dalam .