STATISTIKA 5. Predavanje

3y ago
75 Views
6 Downloads
869.37 KB
61 Pages
Last View : 23d ago
Last Download : 3m ago
Upload by : Francisco Tran
Transcription

STATISTIKA5. predavanjeDoc.dr. Tadeja Kraner Šumenjak

PORAZDELITVE VZORČNIHSTATISTIK Imejmo vzorec velikosti n. Na tem vzorcu imaspremenljivka X vrednosti: x1, x2, , xn.Vzorčna statistika je poljubna funkcijavzorčnih vrednosti f(x1, x2, , xn). Poznamo velikovzorčnih statistik: kvantili, mere sredine, merevariabilnosti.Nekatere vzorčne statistike so zelo pomembne.

X je številska statistična spremenljivka, za katero stanajpomembnejši vzorčni statistiki:Vzorčna aritmetična sredina: x1nnxii 1Vzorčni standardni odklon:s1n 1inxi2 ( x) 21nn 1

Če za X privzamemo normalno porazdelitevN(M, ), je x ocena za M, s pa ocena za σ. Tospoznanje posreduje matematična statistika.Posebno vlogo pri statističnem sklepanju ima zstatistikax Mzn in t-statistika, ki je znana pod imenomStudentova statistikatx Msn

Spomnimo se populacije vseh vzorcev velikosti n,vemo da je ta številka lahko ogromna. Na vsakemod teh vzorcev ima vzorčna statistika svojovrednost.Vzorčni statistiki u priredimo slučajnospremenljivko U, njeno poznavanje je potrebnoza sklepanje iz vzorca na populacijo.Pogledali bomo verjetnostno porazdelitev zanekaj najpomembnejših vzorčnih statistik.

Porazdelitev vzorčnih aritmetičnihsredin IZREKČe je slučajna spremenljivka X na populacijiporazdeljena N(M,σ), potem je slučajnaspremenljivka X na populaciji vseh vzorcevvelikosti n porazdeljena N ( M , n ) .OPOMBA: ta izrek velja, ko gre za vzorčenje zvračanjem enot. Razlika pa je zanemarljiva,če jepopulacija zelo velika, zato v praksi ne ločujemo.

Izrek nam pove, da so tudi aritmetične sredine vzorcevz n elementi porazdeljene normalno. Ob tem staaritmetična sredina osnovne množice in aritmetičnasredina aritmetičnih sredin vzorcev enaki. Standardniodklon porazdelitve aritmetičnih sredin je enakkvocientu standardnega odklona osnovne statističnemnožice in korena iz števila enot v vzorcu.

CENTRALNI LIMITNI IZREKSlučajna spremenljivka X se pri velikih vzorcih porazdeljujepribližno normalno tudi tedaj, ko verjetnostna porazdelitevslučajne spremenljivke X na osnovni populaciji ni normalna.Centralni limitni izrek lahko uporabimo v praksi, če je velikostvzorca večja od 30.

Primer Psihologi trdijo, da je v populaciji IQ porazdeljen normalnoN(100,15).Tvorimo vzorce velikosti 4. Potem velja IQN (100,7,5).115 100) P( Z 2) 0,02287,52,3% vzorcev velikosti 4 ima vzorčno aritmetično sredino nad 115.P( IQ 115)P( ZTvorimo vzorce velikosti 25 in si zastavimo enako vprašanje.

Primer Iz populacije, ki je normalno porazdeljena M 50 in σ 10 sovzorčili vzorce velikosti n 25. Pri kolikšnem odstotku vzorcevlahko pričakujemo vrednosti aritmetičnih sredin med 48,2 in51,7? V katerih mejah je 90 % vseh vrednosti?

Porazdelitev t-statistikSpoznali smo že dejstvo: če je XPosledično je spremenljivka Z N ( M , ), je XX MN (M ,N (0,1).nČe poznamo oba parametra normalne porazdelitve M inizračunamo x in nato vrednost z-statistike:Z x Mn.n)., iz vzorca velikosti n

Angleški statistik W. Gosset, znan pod psevdonimom Student,je v izrazu za z nadomestil parameter z njegovo vzorčnooceno s in tako opredelil t -statistiko:x Mt.snUgotovil je, da se pri majhnih vzorcih verjetnostna porazdelitevt-statistike bistveno loči od standardizirane normalne porazdelitve,pri velikih vzorcih pa je ta porazdelitev zelo blizu standardiziranenormalne porazdelitve.

IzrekNa populaciji vzorcev velikosti n je slučajna spremenljivkaTXMSnporazdeljena po Studentovi porazdelitvi z n-1 prostostnimi stopnjami.Zapišemo Tt ( SPn 1).

Lastnosti Gostota verjetnosti za t-porazdelitev je po oblikipodobna gostoti verjetnosti za N(0,1). Funkcija jezvezna, definirana na celotni realni osi. Jesimetrična okoli 0.Parameter imenujemo stopnje prostosti, kidoločajo njeno obliko.V limiti je Studentova porazdelitev enakastandardizirani normalni porazdelitvi.

Porazdelitev vzorčnih variancNaj bo XN ( M , ). Zamislimo si, da na vsakem vzorcuvelikosti n izračunamo vzorčno varianco s 2 :s21n( xix) 2 .n 1i1Vsak vzorec generira svojo vrednost. Tem vrednostimpriredimo slučajno spremenljivko S2 . Zanima nas njenaverjetnostna porazdelitev.

Izrek Slučajna spremenljivka X je porazdeljena normalnos povprečno vrednostjo M in standardnim odklonomσ. Na populaciji vzorcev velikosti n je porazdelitev zaS2 podana s -porazdelitvijo z n-1 prostostnimistopnjami:2n 12S22(SPn 1)

LastnostiJe zvezna porazdelitev, definirana na pozitivnemdelu realne osi. Stopnje prostosti določajo obliko porazdelitve. ZaSP 1 in SP 2 ima posebno obliko. Ko je SP majhno število, je porazdelitevasimetrična v desno, ko se SP povečuje, seasimetrija zmanjšuje. S povečevanjem SP(gre proti neskončno), postajačedalje bolj podobna normalni porazdelitviN(SP,SP0.5).

F-porazdelitevNaj bosta X in Y neodvisni spremenljivki. Če jespremenljivka X porazdeljena po zakonuspremenljivka Y porazdeljena po zakonu2(m) in2(n),je slučajna spremenljivkaZnXmYporazdeljena po zakonu F(m, n).Porazdelitev F(m, n) je določena z dvema prostostnimastopnjama m in n.

OCENJEVANJE PARAMETROV-OCENJEVANJEARITMETIČNE SREDINESpomnimo se:

Glivenkov izrek: Porazdelitvena funkcija vzorcaz naraščanjem števila enot v vzorcu z verjetnostjo1 konvergira k porazdelitveni funkciji osnovnestatistične množice.Navedeni izrek nam pove, da čim večje je število enot vvzorcu, bolj je frekvenčna porazdelitev vzorca podobnafrekvenčni porazdelitvi osnovne statistične množice.Zato se bosta pri dovolj velikem številu enot v vzorcu (nje vsaj 100) aritmetična sredina in standardni odklonvzorca le malo razlikovala od aritmetične sredine instandardnega odklona celotne množice.

S pomočjo dosedanjih ugotovitev določimo z vzorcem nenot aritmetično sredino osnovne statistične množice.To lahko naredimo na dva načina in sicer na osnovi: točkovne ocene intervalne ocene Za točkovno oceno je zaželena nepristranskost.Ocena je nepristranska, če je povprečje vseh vzorčnihocen enako ocenjevanemu parametru. Zato jex je nepristranska ocena za Ms je nepristranska ocena za

Intervalna ocena parametra Intervalna ocena parametra je t.i. interval zaupanja. To jeslučajni interval, vezan na pripadajoči slučajni vzorec.V našem primerubo to M.Definicija:Naj označuje parameter, ki ga ocenjujemo, vrednostje vnaprej predpisana verjetnost, 0 1. Interval (L1 , L2 )imenujemo interval zaupanja za parameter , če velja:P(L1 L2 ) 1.

Komentar Standardne vrednosti, ki jih uporabljamo zaverjetnost α, so: 0,05, 0,01 ali 0,001. Verjetnost1- α imenujemo zaupanje. Običajno zaupanjeizražamo v %, govorimo npr. o 95% zaupanju.L1 oz. L2 je spodnja oz. zgornja meja intervalazaupanja, L1 oz. L2 sta slučajni spremenljivki.Pri vsakem vzorcu imata drugo vrednost. Vsakslučajni vzorec generira svoj intervalzaupanja (l1,l2).

V populaciji vseh vzorcev velikosti n je odstotekintervalov, ki vsebujejo parameter Θ, enak100(1-α).Za posamezni interval zaupanja ne vemo, ali jeparameter Θ vsebovan v tem intervalu ali ne.Trdimo lahko, da je ta interval z verjetnostjo (1-α)eden tistih, ki vsebujejo parameter Θ.

INTERVAL ZAUPANJA ZA POVPREČNOVREDNOSTLočimo: Osnovna statistična množica porazdeljenanormalno po zakonu N(M, ) in je znana.Osnovna statistična množica porazdeljenanormalno po zakonu N(M, ) inni znana.Veliki vzorci.

N(M, ) inje znana Ta situacija v praksi le redko nastopa, vendar jezaradi konstrukcije intervala zaupanja najlažja. Izpeljava temeljiSpoznali smo že dejstvo: če je XPosledično je spremenljivka Z N ( M , ), je XX MN (M ,n).N (0,1).nP( zZ2z ) 12Z 1,96 pri 5% tveganju

Širino tega intervala lahko zapišemo z obrazcem:xz2nMxz2n

0.40.350.3Porazdelitev aritmetičnih sredinvzorcev.0.250.2p(x)0.15Pri 5 % tveganju ena osenčena površina0,025-ti del celotne površine.0.10.050xStopnjatveganja5%1%0,01 %Delež v celotni populacijiobeh osenčenih samo enega osenčenegadelovdela0,050,0250,010,0050,0010,0005

Če iščemo 95% interval zaupanja za aritmetičnosredino populacije, tedaj s pomočjo tabel zastandardizirano normalno porazdelitev, določimovrednost za Z tako, da bo veljalo:H(Z) 0,475Z 1,96Interval je z verjetnostjo 0,95 eden tistih, ki vsebujepovprečno vrednost celotne populacije.x 1,96nMx 1,96n5% tveganje

Če iščemo 99% interval zaupanja za aritmetičnosredino populacije, tedaj s pomočjo tabel zastandardizirano normalno porazdelitev, določimovrednost za Z tako, da bo veljalo:H(Z) 0,495Z 2,58x 2,58nMx 2,58pri 1% tveganjun

Če iščemo 99,9% interval zaupanja za aritmetičnosredino populacije, tedaj s pomočjo tabel zastandardizirano normalno porazdelitev, določimovrednost za Z tako, da bo veljalo:H(Z) 0,4995Z 3,29x 3,29nMx 3,29pri 0,1% tveganjun

Primer Izračunajmo 90% in 95% interval zaupanja zapovprečno maso zdravila v stekleničkah, pri čemerje1, n 9 in x 10,5.

N(M, ) in ni znanaStandardni odklon ni podan, ampak ga ocenimoiz podatkov. Interval zaupanja izpeljemo enakokot pod prvo točko, le da standardiziranonormalno porazdelitev nadomesti Studentovaporazdelitev z n-1 prostostnimi stopnjami:x t2snMOdčitaš pri (n-1) prostostnihstopnjah.x t2sn

Veliki vzorci Če so vzorci tako veliki, da velja centralni limitniizrek, izračunamo interval zaupanja zapovprečno vrednost takolexz2snMxz2sn

PRIMER Denimo, da želimo ugotoviti, s 5 % tveganjem,povprečno maso 21 dni starih piščancev. V tanamen smo, namesto vseh piščancev, stehtalivzorec 105 piščancev in dobili frekvenčnoporazdelitev mas prikazano v preglednici:Masa piščancev (g)nad 550 do 580nad 580 do 610nad 610 do 640nad 640 do 670nad 670 do 700nad 700 do 730nad 730 do 760nad 760 do 790nad 790 do 820Število piščancev2881816202085

Masa piščancev (g)fkxkfkxknad 550 do 580nad 580 do 610nad 610 do 640nad 640 do 670nad 670 do 700nad 700 do 730nad 730 do 760nad 760 do 790nad 790 do 65105695,86x1nf k xks21nf k xkss257,95snM695,86 1,9657,95105x 1,962x251195825695,862105x 1,96Mfk 5004805000324012551195825sn695,86 1,9657,951053358,15

Primer Izračunajmo 95% in 99% interval zaupanja zapovprečno oceno na kolokviju.Dani so rezultati za vzorec:12,45,23, 67, 68,90, 34,0, 45,77.

Primer Z vzorcem 150 zabojev smo dobili naslednje podatke:% gnilega sadjado 1nad 1 do 3nad 3 do 6nad 6 do 10nad 10 do 15 število zabojev594326175Z 1 % tveganjem ocenite povprečni procent gnilega sadja vosnovni množici. Pri tem predpostavite, da je standardniodklon osnovne množice enak standardnemu odklonuvzorca. Nalogo rešite tudi brez te predpostavke. Narišiteše gornjo frekvenčno porazdelitev!

SKLEPINa širino intervala vpliva:-zaupanje-variabilnost proučevane spremenljivke, ki joizraža s-število enot v vzorcu Če želimo, da se širina prepolovi moramo, moramozvečati število enot v vzorcu vsaj za 4-krat.V izrazu za odklon je izraz snStandardnanapaka ocene.

PARAMETRIČNI PREIZKUSI ZNAČILNOSTIParametrični preizkusi značilnosti sonamenjeni testiranju parametričnih hipotez,to je domnev o vrednosti neznanih parametrovstatistične spremenljivke X. Na primer pravilomatestiramo ničelno hipotezo H0, ki pravi, da jeparameter q q0, proti alternativni hipotezi H1, kipravi q q0 , na stopnji značilnosti testa α. Naosnovi tega pri preizkusu značilnosti ničelnohipotezo H0: bodisi zavrnemo, bodisi ne zavrnemo.

V prvem primeru rečemo, da med hipotetičnimiin eksperimentalnimi podatki obstaja značilnarazlika (ali razlika je signifikantna) in hipotezoH0 zavrnemo.V drugem primeru pa razlika med hipotetičnimiin eksperimentalnimi vrednostmi ni značilna oz.ni statistično pomembna, zato hipoteze H0 nezavrnemo.Pri testu značilnosti lahko naredimo samo t.i.napako prve vrste, to pomeni, da smo zavrnilipravilno hipotezo H0. Verjetnost za to napako jepredpisana, s stopnjo značilnosti α in znašaobičajno 0,05 ali 0,01.

ZAPOMNI SI:Pri preizkusu značilnosti H0 proti H1 , ničelnohipotezo H0 ali zavrnemo (torej sprejmemo H1) ali onjej ne odločimo!

PARAMETRIČNI PREIZKUSI ZNAČILNOSTI POTEKAJO VEDNO NANASLEDNJI NAČIN:1.Postavimo ničelno in alternativno hipotezo. Opravkaimamo bodisi z dvostranskim testomH0 (q q0)protiH1 (q q0) bodisi z enim od enostranskih testovH0 (q q0) oz. H0 (q q0) protiH1 (q q0),H0 (q q0) oz. H0 (q q0) protiH1 (q q0).2.Izberemo stopnjo značilnosti testa α (običajno 0,05 ali0,01).3.Glede na velikost vzorca ali obravnavanega problemaizberemo primerno testno statistiko U.

4.Glede na porazdelitev statistike U inparameter α določimo kritično območje testa w0,to je podmnožica realnih števil izbrana tako, daje verjetnost dogodka, da ob pravilni hipotezi H0vrednost testne statistike U leži v njej, manjšaali enaka α.5.Izračunamo eksperimentalno vrednost testnestatistike ue. Če ue pripada w0, potem hipotezoH0 zavrnemo. Če ue w0, potem hipoteze H0 nezavrnemo.

KOMENTAR Če pade izračunana vrednost za testno statistikozunaj 95% intervala, potem ničelno hipotezo pri5% tveganju zavrnemo, čeprav je gotovo, da v 5%vseh primerov neizbežno pade ven (napaka prvevrste).Kritično območje testa

Zakaj ne sprejmemo ničelne hipoteze? Zagrešimo pa lahko še eno napako, sprejmemoničelno hipotezo, ko je napačna. Verjetnost za tonapako ne poznamo. Tej napaki pravimo napakadruge vrste. To pomeni, da drži ena odalternativnih hipotez. To pomeni, da našaizračunana vrednost pripada neki drugi vzorčnidistribuciji.

TESTI, KI JIH BOMO OBRAVNAVALI: Testiranje hipotetične aritmetične sredine(standardni odklon populacije je znan ali veliki vzorcis) Testiranje hipotetične aritmetične sredine (malivzorci) Testiranje enakosti dveh aritmetičnih sredin(neodvisni vzorci) Testiranje enakosti dveh aritmetičnih sredin (odvisnivzorci) Analiza variance .

TESTIRANJE HIPOTETIČNE ARITMETIČNESREDINE (VELIKI VZORCI) PrimerStroj polni neko snov v stekleničke in sicer jenorma 50 mg na stekleničko. Zaradi slučajnihvplivov odmerki nihajo. Privzeti smemo, da soodmerki porazdeljeni normalno. Če stroj dela vskladu s predpisi, za maso odmerka veljaX N( 50mg,5mg)Zanima nas ali je M 50mg?

Izvedemo naslednji postopek. S slučajno izbiroizberemo določeno število steklenic v kontrolnivzorec. Naj bo n 25. V vsaki steklenici stehtamoodmerek in dobimo vzorčno aritmetično sredino x .Formuliramo dve hipotezi:H0 : MNičelna: M 50H1 : MAlternativna:M 50MHMHPrivzemimo, da poznamo standardni odklonpopulacije 5.

Preizkušanje statističnih domnev izhaja izpredpostavke, da je ničelna domneva pravilna. Če jeto res je porazdelitev vzorčnih aritmetičnih sredin xv kontrolnih vzorcih velikosti 25 normalna, njeno5povprečje je 50mg, standardni odklon pa1.n25To porazdelitev imenujemo ničelna porazdelitev. Zato porazdelitev velja: približno dve tretjini vzorcevvelikosti 25 ima x med 49 in 51, približno 95%vzorcev ima x med 48 in 52. Če bi za določen vzorecdobili 55, bi zagotovo zavrnili ničelno domnevo, kerizjemno malo tvegamo, ko zavrnemo to hipotezo.

Vnaprej določimo α, imenujemo tudi stopnjaznačilnosti. Na osnovi α razdelimo vrednostiza x na dve območji:Območje, kjer osnovno hipotezo zavrnemo.Območje, kjer osnovno hipotezo obdržimo.Vrednost, ki razločuje obe vrednosti se imenujekritična vrednost.

H0 zavrnemoH0 obdržimoH0 zavrnemoKritičnavrednostZa naš primer naj bo α 0,05. Kritična vrednost je z 1,96. Torejničelno domnevo obdržimo, če je x v intervalu 50 1,96 1mg.Testno statistiko z izračunamo po formuli (standardizirananormalna porazdelitev vzorčnih aritmetičnih sredin):zx MHn

z1,96 pri 5% tveganju zavrnemo H1z1,96 pri 5% tveganju sprejmemo H1Primer:Poglejmo podatke iz enega kontrolnega vzorca:61,0 51,2 47,8 49,9 50,3 49,0 50,1 49,9 47,5 51,252,1 60,1 46,6 52,1 62,2 54,2 53,1 51,1 49,9 47,953,3 53,0 49,0 49,8 50,2Upoštevajmo, da je 5mg.z51,7 501,7525Rezultati niso statistično značilni. Ničelne hipoteze nemoremo zavrniti.

Sedaj pa izhajamo iz dejstva, da standardnegaodklona populacije ne poznamo, kar je v bistvubolj realistično.Če je vzorec dovolj velik, potem upoštevamo, da jesin postopamo enako kot v prejšnjem primeru(n 100). Pri malih vzorcih pa z-statistiko nadomestiStudentova t-statistika, ki je porazdeljena poStudentovi porazdelitvi z n-1 stopnjami prostosti.tx MHsn

PRIMER Za prejšnji primer ocenimo standardni odklonpopulacije iz podatkov: s 4,026xis2s 267211672112551,7 216,197924244,0247Izračunamo testno statistikot51,7 504,026252,112

Iz tabel odčitamo testno statistiko:tkrit (24)2,064 pri 5% tveganjuSprejmemo alternativno hipotezo. Rezultati sostatistično značilni.

p-vrednost je najmanjša stopnja značilnosti prikateri še lahko zavrnemo ničelno hipotezo.Če je p-vrednost manjša od predpisane α, ničelnodomnevo zavrnemo.

Semenarna zagotavlja, da je kalivost semena95 %. Z vzorcem velikosti 100 enot smo dobilipovprečno kalivost 94 %. Varianca populacijeznaša 16. Preverite z 1 % tveganjem, če jetrditev semenarne pravilna!

Oglejmo si primer, ko želimo ugotoviti ali imajo vhlevu s piščanci pasme Hubbard po 21 dneh vzrejepovprečno maso 687 gramov, kot jo za to starostnavaja 2624678769773760824606709633633

Če za X privzamemo normalno porazdelitev N(M, ), je ocena za M, s pa ocena za σ. To spoznanje posreduje matematična statistika. Posebno vlogo pri statističnem sklepanju ima z- statistika in t-statistika, ki je znana pod imenom Studentova statistika x xM z n xM t s n

Related Documents:

Statistika adalah ilmu pengumpulan data, pengolahan, analisisnya, dan penarikan kesimpulan berdasarkan kumpulan data. Ada dua macam statistika yaitu statistika deskriptif dan statistika inferensial. Pada penelitian ini menggunakan statistika inferensial. Wahana komputer (2007, hlm.

KAJ JE STATISTIKA? Statistika je veda, ki proučuje pojave, ki se kažejo v velikem številu v določenem času in prostoru. Rečemo jim množični pojavi. Statistika je veda, ki se po eni strani ukvarja z

Statistika Ekonomi dan Bisnis (Statistika Inferensia), Buku 2”. Terkesan dari namanya yaitu Statistika Inferensia, maka materi yang dibahas dalam buku ini berfokus pada cara-cara melakukan inferensi (pendugaan dan pengujian hipotesis parameter populasi) yang didasarkan atas informasi yang diperoleh dari sampel (statistik sampel).

keilmuan, statistika seakan mendapat panggilannya untuk membantu memecahkan berbagi persoalan keilmuan yang ada. Buku ini merupakan sebuah pengantar bagi mahasiswa untuk memahami konsep-konsep dalam statistika. Buku ini menyajikan statistika deskriptif dan inferensial, Selain itu, buku ini memberikan pemahaman pada mahasiswa tentang konsep

Statistika dapat digunakan dalam berbagai bidang, antara lain : Tabel 1 Pengguna statistika Pengguna Statistika Masalah yang dihadapi Manajemen 1. Penentuan struktur gaji, pesangon, dan tunjangan karyawan 2. Penentuan jumlah persediaan barang, barang dalamproses dan barang jadi 3. Evaluasi produktivitas karyawan

Oleh karena itu dalam Statistika terdapat metoda penting dalam keputusan yaitu yang disebut Uji Hipotesis. 3. Analisis Statistika Pada dasarnya analisis Statistika dapat dibedakan atas dua macam/ tahapan, yaitu Analisis Deskriptif sebagai definisi tradisional dan Analisis Inferensial (Induktif) yang dianut dalam definisi modern.

Statistika pertama kali di temukan oleh Aristoteles dalam bukunya yang berjudul “politea”, dalam buku tersebut ia menjelaskan data tentang keadaan 158 negara yang di sebut sebagai statistika. Pada abad ke-17 di Inggris, statistika di sebut sebagai political aritmatic. Pada abad ke-18, istilah statistika dipopulerkan

Divis ADVANCED ENGINEERING MATHEMATICS 2130002 – 5th Edition Darshan Institute of Engineering and Technology Name : Roll No. : ion :