Capitolo Zero : STATISTICA DESCRITTIVA UNIVARIATA

3y ago
40 Views
3 Downloads
800.72 KB
11 Pages
Last View : 12d ago
Last Download : 3m ago
Upload by : Luis Wallis
Transcription

1Capitolo zero:STATISTICA DESCRITTIVA UNIVARIATALa STATISTICA è la scienza che si occupa di fenomeni collettivi che richiedono lo studio di un grandenumero di dati.Il termine STATISTICA deriva dalla parola STATO, già gli antichi Romani facevano “censimenti” percontare gli abitanti e per conoscere le loro caratteristiche: età, professione,ecc.I censimenti sono indagini statistiche che riguardano l’intera popolazione residente nello stato.Si chiama POPOLAZIONE STATISTICA l’insieme su cui si fa l’indagine statistica. Il termine “popolazione”si usa anche quando tale insieme non è costituito da persone, ad esempio le auto immatricolate inItalia nel 2011 potrebbero essere oggetto di una indagine statistica e quindi costituire la “popolazione”oggetto dell’indagine.Per ragioni economiche spesso, le indagini statistiche riguardano un CAMPIONE e non l’interapopolazione, in tal caso è essenziale che il campione sia rappresentativo altrimenti l’indagine statisticadarebbe risultati errati.Per effettuare una INDAGINE STATISTICA bisogna: rilevare i dati, fare lo spoglio dei dati e correggere, se possibile, eventuali errori, elaborare i dati con strumenti matematici adatti interpretare i risultati ottenutiIl nostro studio riguarda prevalentemente gli ultimi due punti dell’indagine statistica: l’elaborazione deidati con strumenti matematici e l’interpretazione dei risultati dell’indagine statistica.Si dice UNITA’ STATISTICA ogni elemento della popolazione, di ciascuna unità statistica si studiaalmeno un CARATTERE, il carattere può essere qualitativo o quantitativo :CARATTERE QUALITATIVOun CARATTERE QUANTITATIVO èè espresso con attributi:frutto di un conteggio o di unamaschio / femminamisura ed è espresso con unonumero intero o con un numerocastano, rosso, biondo, realePer studiare i dati statistici si costruiscono delle tabelle di frequenza dove, accanto ad ogni modalità diun carattere, si riporta la frequenza della modalità.Tali tabelle si chiamano:SERIE se vi sono caratteri qualitativi , SERIAZIONI se vi sono caratteri quantitativi.Tra le serie statistiche, le più importanti e diffuse sono le serie storiche. Sono esempi di seriestatistiche, la serie che descrive l’andamento del costo della benzina negli ultimi dieci anni, la serie chedescrive il numero di multe date dai vigili urbani nei primi sette giorni dell’anno in corso, ecc. è unaserie, quella che descrive il colore degli occhi degli studenti della IIIaA.Esempio: serie storica della produzione annua di olio, in quintali, e rappresentazione grafica con ungrafico cartesiano :

2Anno2003200420052006ProduzioneIn o : serie delle materie scolastiche preferite dai ragazzi e dalle ragazze e loro rappresentazionecon diagramma a ia47Geografia42Matematica23Scienze64Ed. Fisica55totale2624LE SERIAZIONIEsempio 1 Con uno strumento, si è rilevato, per 40 minuti consecutivi, il numero delle particellecosmiche al siamo chiederci:Qual è il minor numero di particelle rilevato in un minuto?Qual è il maggior numero di particelle rilevato in un minuto?Quale numero di particelle è stato rilevato più frequentemente?Per quanti minuti sono state rilevate meno di 5 particelle al minuto ?Qual è il numero medio di particelle rilevate al minuto?Ad alcune domande si può rispondere anche con i dati grezzi, ad altre no.La variabile statistica che dobbiamo studiare la indichiamo con X.X è uguale al numero di particelle cosmiche rilevate al minuto, essa può assumere i valori interi da 0 ( il valoreminore rilevato) a 8 ( il valore massimo rilevato ).Il RANGE dei valori è 8-0 8Ad ogni valore di X corrisponde una frequenza assoluta fa( il numero di volte che si è ottenuto quel valore)Ad ogni valore di X corrisponde una frequenza relativa fr fa/n , n è il numero dei dati, in questo caso n 40.La frequenza può anche essere espressa in modo percentuale fr*100 %Molto interessante è la frequenza cumulata: per ogni valore della variabile X , la frequenza cumulata é lasomma delle frequenze assolute minori o uguali al valore di X considerato.In modo analogo si può costruire la tabella delle frequenze relative cumulate o di quelle percentuali cumulate.

3X012345678Totale:fa1610126400140numero 0%15%10%0%0%2,5%100%vale sempre 1vale sempre 100fa cumulata171729353939394040numero dei datiIstogramma che rappresenta la distribuzione della Frequenza assoluta cumulata delfrequenza assoluta del numero di particelle al minuto.numero di particelle al minuto rilevateOra che i dati sono stati ordinati e rappresentati, possiamo rispondere ad alcune domande relative alfenomeno su cui è stata fatta l’indagine statistica.Qual è il minor numero di particelle rilevato in un minuto? 0 (nessuna particella)Qual è il maggior numero di particelle rilevato in un minuto? 8 particelleQuale numero di particelle è stato rilevato più frequentemente? 3 particellePer quanti minuti sono state rilevate meno di 5 particelle ? 35 minutiPer quanti minuti sono state rilevate più di 4 particelle al minuto? 40-35 5 minutiQual è il numero medio di particelle rilevate al minuto?circa 3 particelle al minutoLa variabile X appena studiata è numerica e discreta perché i valori che assume sono il risultato di unconteggio.La variabile Y che, assume come valore l’altezza dei giocatori del Novara Calcio, è numerica e continua,perché i valori sono frutto di una misura.La variabile Z che assume come valore il colore degli occhi dei giocatori del Novara Calcio è unavariabile qualitativa detta mutabile, perché non assume valori numerici .Talvolta è necessario suddividere in classi, l’intervallo dei valori da rappresentare.Divideremo l’intervallo in classi della stessa ampiezza, il numero delle classi può variare tra 4 e 15,solo in casi eccezionali il numero delle classi può arrivare a 20.Ci sono regole pratiche che permettono di stimare il numero di classi in cui dividere i dati in modo daottenere una buona distribuzioni statistica di frequenze. Si può estrarre la radice quadrata del numero N di datie approssimare il risultato calcolare 1 3,322Log(N) e approssimare il risultatoSe i dati sono 80, con la prima formula si ottiene N 8.9 8 classi,

4con la seconda formula si ottiene N 1 3,322*Log(80) 7,32 7 classiEsempio 2Gli ottanta dati seguenti indicano le emissioni giornaliere di gas inquinante da un impianto industrialeespresse nella stessa unità di misura.Il Range dei valori è R 31.8-6.2 25.6Poiché i dati sono 80 decidiamo di dividere l’intervallo [6.2 , 31.8] in 7 parti uguali dette classi.L’ampiezza di ciascuna classe èa (32-6.2)/7 3,7NB: il valore maggiore è stato arrotondato per eccesso. A volte si aggiunge uno per essere certi di avere tuttii dati distribuiti nelle 7 classi.Quando la distribuzione statistica è suddivisa in classi, bisogna calcolare il valore centrale di ogni classe:nella classe [c,d[ Il valore centrale è (c d)/2ClasseValore ogramma delle frequenze assolute :i valori sull’asse x sono quelli centrali di ogni classeF%8.7512.51528.7520105100F cumulata717295268768080Grafico delle frequenze cumulate, dettoanche “ogiva”Sull’asse x vanno riportati i valori massimi di ogniclasse e sull’asse y la frequenza cumulativa dellarispettiva classeQual è il valor medio della distribuzione?

518,73Indici di posizione centrale di una distribuzione di frequenze: valori mediMODA: il dato, o la classe di dati, che ha maggiore frequenza. La moda si calcola sia con caratteriqualitativi che con caratteri quantitativi. La moda può non esistere (se tutti i dati o tutte le classi hanno la stessa frequenza) o nonessere unica ( se ci sono più dati o più classi con la massima frequenza) la moda può essere molto lontana dal centro della distribuzionela MODA è utile quando è importante conoscere quale sia il valore che si ottiene con maggiorefrequenza e si usa se il dato o la classe hanno una frequenza notevolmente superiore agli altri dati oclassi.ESEMPIO: In una città l’orario dei negozi di alimentari è libero. Uno straniero appena giunto in cittàchiede quale sia l’orario di apertura dei negozi di alimentari. Conviene rispondere indicando la MODAcioè l’orario rispettato dalla maggior parte dei negozi di alimentari.MEDIANA: è un valore che divide a metà i dati, ordinati in maniera crescente o decrescente. Lamediana si calcola con i caratteri quantitativi o con quelli qualitativi ordinabili ( ad esempio la modalitàtitolo di studio è ordinabile, la modalità colore degli occhi non è ordinabile). La MEDIANA non risente dei valori estremi perché si determina indicando il valore centrale se ladistribuzione ha un numero dispari di dati, oppure indicando la media aritmetica tra i duevalori centrali se la distribuzione ha un numero pari di dati. La MEDIANA è l’indice centrale da considerare quando c’è molta variabilità tra i dati. La MEDIANA è il valore che divide a metà l’intervallo della distribuzione statistica e corrispondeal cinquantesimo percentile e anche al secondo quartile. I quartili sono dei punti che dividonol’intervallo dei dati in quattro parti, ognuna delle quali contiene il 25% dei dati.ATTENZIONE: se la distribuzione e divisa in classi, per stimare la mediana bisogna calcolare l’area Adell’istogramma e dividerla a metà, quindi si cerca il valore a che appartiene alla classe in cui cadeA/2 e si scrive una equazione per individuare il valore di a che dimezza l’area dell’istogramma.Esempioclasseareaarea 17531570175-180630100180-185420120totale24MEDIANA 171,67aArea istogramma 5*3 5*4 5*4 5*3 5*6 5*4 120Area/2 60Osservando la colonna dell’area cumulata si vede che 60 appartienealla classe 170-175. Si scrive quindi l’equazione con incognita a

65*3 5*4 5*4 (a-170)*3 (175-a)*3 5*3 5*6 5*4 e si ottienea 171,67La MEDIA ARITMETICA è quel valore che sostituito a tutti i termini della distribuzioni lascia invariata lasomma. La media si calcola solo se i caratteri sono quantitativi. La MEDIA ARITMETICA risente dei valori estremi della distribuzione e non conviene utilizzarlaquando c’è molta variabilità tra i dati . LA MEDIA PESATA è la media aritmetica calcolata considerando i pesi ( la frequenza ) di ogni xidove xi è il dato di indice i e pi il suo pesoNel caso in cui i dati siano raggruppati in classi si usa il valore centrale di ogni classe:xi è il valore centrale della classe i-esima ed fi la frequenza della classe i-esimaLa MEDIA QUADRATICA è la radice quadrata della media aritmetica dei quadrati dei datiNel caso in cui i dati siano raggruppati in classi si usa il valore centrale di ogni classe:xi è il valore centrale della classe i-esima ed fi la frequenza della classe i-esimaIndici di variabilità di una distribuzione di frequenzeIL RANGE o CAMPO DI VARIAZIONE: la differenza tra il massimo valore dei dati e il minimo valore deidati oppure la differenza tra l’estremo superiore dell’ultima classe e l’estremo inferiore della primaclasse, se i dati sono suddivisi in classi. NB: se tutti i dati sono uguali RANGE 0Lo SCARTO è la differenza tra ogni valore della distribuzione e la media aritmetica xi - .Lo SCARTO SEMPLICE MEDIO è la media aritmetica dei valori assoluti degli scartiS La VARIANZA è il valor medio degli scarti al quadratooSe i dati sono raggruppati in classi si considera come xi il valore centrale di ogni classeoLo SCARTO QUADRATICO MEDIO o DEVIAZIONE STANDARD è la radice quadrata della varianzaQuando i dati sono suddivisi in classi, si utilizza come xi il valore centrale di ogni classe

7Il COEFFICIENTE DI VARIABILITA’ ( che si può calcolare solo se la media non è nulla) è il rapporto tra loscarto quadratico medio e la media aritmetica in valore assolutoσ/ μ e viene espresso inpercentuale. E’ un numero puro che permette di confrontare tra loro la variabilità, di diversedistribuzioni statistiche.Esempio:Giacomo ha preso questi voti: 5,7,6,8,9,7 il coeff. di variabilità è σ/ μ 1,29/7 0,18 18%Luca ha preso questi voti: 4,5,6,5,6 il coeff. di variabilità è σ/ μ 0,75/5,2 0,14 14%Marco ha preso questi voti : 7,7,7,7,7,7,7 il coeff. di variabilità è σ/ μ 0/7 0TABELLE CONSIGLIATE PER CALCOLARE LO SCARTO SEMPLICE MEDIO E LO SCARTO QUADRATICO MEDIOX Scarto Valore assoluto(xi-μ) dello scarto xi - μ Scarti alquadrato(xi-μ)2CLASSIfiXi valorecentraledellaclassexi*fi xi – μ *fi(xi-μ)2*fi-8,5 .08,572,750-452 . .4-876Tot.27189,5totSCARTO SEMPLICE MEDIO : S x1 - μ xn - μ 27/6 4,5 (6 è il numero dei dati)NSCARTO QUADRATICO MEDIO : 5,6Vediamo in dettaglio tre tipi di distribuzione statistica univariataDISTRIBUZIONE SEMPLICE: un esempioSi rileva la temperatura alle ore 12 ( mezzogiorno) in una certa località, per sette giorni consecutivi.Calcolare:media, mediana,range, scarto semplice medio, deviazione standard, coeff. di variabilitàgiorniTemperature in Clunedì-3Media μ (-3 1 0-1 2-2 3)/7 0Mediana: (dispongo i dati in ordine crescente: martedì13,-2,-1,0,1,2,3) 0mercoledì0Range: 3-(-3) 6giovedì-1S (3 1 0 1 2 2 3)/7 1,71venerdì2σ 2 (9 1 0 1 4 4 9)/7 4sabato-2σ 2 σ/ μ non si può calcolare, media nulladomenica3DISTRIBUZIONE PONDERATA: un esempioCostruire la tabella statistica e determinare la media, la mediana,la moda, il range, lo scarto semplicemedio, la varianza, lo scarto quadratico medio e il coefficiente di variabilità relativi alla rilevazionestatistica: su un campione di 100 famiglie si studia il numero di automobili di proprietà .

8Modalitàn. auto diproprietàfa0123Tot.1548298100Moda: 1 autoMedia: μ (0*15 1*48 2*29 3*8)/ 100 1.3Mediana: è la media tra il 50esimo e il 51esimo dato0.15 15% 15-1.3(1 1)/2 10.48 48% 63-0.3Range: min 0 , max 3 R 3-0 30.29 29% 920.7S [ -1.3 *15 -0.3 *48 0.7 *29 1.7 *8]0.8 8%100 1.7/100 0,678Varianza: σ2 1100 [(-1.3)2*15 (-0.3)2*48 (0.7)2*29 (1.7)2*8]/100 0.67Scarto quadratico medio σ 0.67 0.82 ; σ/ μ 0.82/1.3 0,63 63%frf%fcscartoDISTRIBUZIONE PER CLASSI: un esempioCostruire la tabella statistica delle altezze, suddivise in classi, degli alunni di una classe primaria ecalcolare: la media, la moda , la mediana, il range, la varianza,lo scarto quadratico medio il coeff. divariabilitàClassi 1803684120180la classe modale è 140-144Media: (134.5*4 142*12 147*9 160*3)/28 144.46Range : R 170-130 40Varianza:σ2 [(9.96)2*4 (2.46)2*12 (2.54)2*9 (15.54)2*3]/28 42.64Scarto quadratico medio 42.64 6.5Coeff. di variabilità σ/ μ 6.5/144.46 0,045 4,5%Mediana: l’area complessiva delle classi è 180,la metà dell’area è 90,90 sta nella classe 145-149 nella posizione a, scrivoequaz. per calcolare a36 48 (a-145)*9 (149-a)*9 6018a 2622a 145.66aLA MEDIANA è 145,66

9

1019) I voti riportati in un compito di matematica sono:2 4 7 5 4 36 8 6 6 5 47 5 3 5 7 75 5 4 6 6 56 6 7 8 8 6Costruire una tabella con le frequenze assolute, relative, percentuali e cumulate.20) I dati relativi al numero di componenti per un campione di famiglie sono riportati in tabella:N. componenti1234567totaleN. famiglie16025738147812761371501Calcola la frequenza relativa, la frequenza cumulata e lafrequenza percentuale, la deviazione standard e il coefficiente divariabilità.Quante famiglie sono formate da più di 4 persone?Qual è la percentuale di famiglie formate da più di 4 persone?21 )All’esame di stato 45 studenti hanno conseguito i voti seguenti:6283921009210092908486Costruire una tabella con le9282778488frequenza assolute e relative9686838892riportando:8284869083a) i dati divisi in 5 classi8188797691b) i dati divisi in 9 classi961009290868278936569827893666922) Si considerino i dati relativi alle altezze di 28 studenti :163 163 175 170 175 171158 171 162 173 164 180150 163 177 149 183 183168 168 178 181 147 164 174 180 158 171Dopo aver raggruppato i dati in classi di frequenza pari a 10cm ( 140-149 ) costruire i grafici dellefrequenze assolute, relative e cumulate.Si chiede inoltre :a. Quanti studenti sono alti meno di 160cm?b. Quale classe contiene il maggior numero di dati?[a. 5; b. 170-179]23) I dati relativi al peso corporeo di 28 studenti di una classe sono i seguenti:67 52 74 51 84 52 7762 52 82 58 88 59 7948 74 47 61 49 54 8145 59 50 77 51 60 48Dopo aver raggruppato in classi di ampiezza pari a 5Kg , calcolare:a)Frequenza assoluta, b)Frequenza relativa c)Frequenza percentuale d)Frequenza cumulata

11e) range, f) scarto semplice medio g) varianza h) deviazione standard i) coefficiente divariabilità24) Nella corsa dei 200m , 30 ragazzi hanno fatto registrare i tempi misurati sino ai decimi di secondo:29,331,228,537,630,926,038,037,0 22,8 35,235,8 37,729,626,936,939,629,930,036,634,1 38,2 35,028,832,431,838,134,036,037,836,1Costruire una tabella raggruppando i dati in 5 classi : determinare frequenza, frequenza relativa efrequenza percentuale, media, moda , mediana, range, scarto semplice medio, varianza,deviazionestandard, coefficiente di variabilità . Disegnare il diagramma delle frequenze. Determinare qualepercentuale dei ragazzi ha corso i 200 m in meno di 29 secondi.25) Le temperature massime in gradi Celsius registrate in una località sonoTracciare l’istogramma, il poligono dellefrequenze, il poligono delle frequenzecumulate. Determinare moda, media,mediana, deviazione standard

Capitolo zero : STATISTICA DESCRITTIVA UNIVARIATA La STATISTICA è la scienza che si occupa di fenomeni collettivi che richiedono lo studio di un grande numero di dati. Il termine STATISTICA deriva dalla parola STATO, già gli antichi Romani facevano “censimenti” per . con la seconda formula si ottiene N 1 3,322*Log(80) 7,32 7 classi .

Related Documents:

Esercizi svolti di Fisica 1 . Capitolo 8 Statica e dinamica dei fluidi Pag. 263 Capitolo 9 Termologia e calorimetria Pag. 278 Capitolo 10 Termodinamica Pag. 395 Capitolo 11 Teoria cinetica dei gas Pag. 348 . 1 Capitolo 1 Cinematica del punto Prob. 1-3

3 Come si rappresenta graficamente una tabella a doppia entrata 2 4 6 X 4 6 18 36 60 8 4 12 24 40 12 10 30 60 100 Y 20 60 120 200 Rappresentiamo graficamente la tabella proced

Capitolo 4: Beni Perfettamente Divisibili: Domanda, Offerta e Surplus. 4.1: Introduzione L’analisi contenuta in questo capitolo si discosta da quella condotta nel capitolo precedente per l’assunzione che il bene oggetto di scambio possa essere comprato e venduto in quantità di qualsiasi ammontare e non solo in quantità intere.

un risultato analitico sperimentale è sicuramente affetto da errori sistematici che, in linea di principio, possono essere corretti conoscendone le cause che li hanno prodotti, e da errori accidentali che sono valutabili e quantificabili solo mediante l'analisi statistica . VALUTAZIONE STATISTICA DEGLI ERRORI INDETERMINATI RIBADIAMO: Ripetendo una stessa analisi molte volte e

particolare distribuzione tra i tanti possibili stati dinamici in cui esse possono trovarsi. Introduzione alla Meccanica Statistica Lezione n.3 Cenni di meccanica statistica classica e quantistica-M. Bruzzi

Getting Started with STATISTICA Programming Page 7 of 67 10/21/2010 Start by Recording a Macro In STATISTICA, all analyses and their subsequent settings are recorded when you step through them interactively. For example, when you run Basic Statistics, Descriptive Statistics, all the options and output are recorded while you navigate through the .

2017 ZERO S / SR / DS / DSR 2017 ZERO S ZERO SR ZERO DS ZERO DSR TORCYCLES.COM YCLES.COM 88-08708.06 OWNER’S MANUAL OWNER’S MANUAL Zero Owner's Manual (S and

I am My Brother’s Keeper (2004) As our New Year’s celebration draws near, I once again find myself pondering the enigmatic story that our tradition places before us at this time—the story of the Binding of Isaac. Once again, I walk for those three long days with father Abraham and ponder the meaning of his journey with his son to the mountain. And once again, I find fresh meaning in the .