Modelos Para Dados De Contagem - O Modelo De Poisson

3y ago
12 Views
3 Downloads
355.54 KB
29 Pages
Last View : 1m ago
Last Download : 3m ago
Upload by : Kamden Hassan
Transcription

Modelos para dados de contagemO modelo de PoissonModelos para dados de contagem

Sumário1Introdução2Regressão de PoissonTaxa de IncidênciaInclusão de covariáveisInterpretação dos parâmetros3Exemplos4SuperdispersãoModelos para dados de contagem

Dados de ContagemPodemos estar interessados em modelar dados decontagem.Exemplos- Número de chamadas telefônicas por dia em uma callcenter;- Número de acidentes em uma estrada por dia;- Número de surtos epiléticos por paciente em dois anos;- Número de partos cesariais por hospital/ano;- Número de clientes chegando ao caixa de umsupermercado;- Número de gols por time na primeira rodada docampeonato brasileiro.Modelos para dados de contagem

Por que não podemos usar o modelo de regressãoestudado anteriormente? Suposição de Normalidade!Dados de contagem podem ser modelados por umadistribuição de Poisson.Discreta e representa a probabilidade de que um eventoocorra um número especificado de vezes em um intervalode tempo (espaço).Modelos para dados de contagem

A distribuição de PoissonSeja Y Poisson(λ), entãoe λ λyy 0, 1, · · ·y!E(Y ) Var (Y ) λP(Y y ) A taxa média de ocorrência (λ) é constante ao longo dotempo.A informação sobre o número de ocorrências em umperíodo nada revela sobre o número de ocorrências emoutro período.Modelos para dados de contagem

O modelo de regressão de PoissonTemos que a variável resposta Y representa dados decontagem ou taxas e X é o vetor de covariáveis.Objetivo: explicar a variação de Y através de X .Taxa de incidênciaTI Número de casos novos em determinado períodoQuantidade de pessoa-tempoQuantidade de pessoa tempo:tempo em que a população esteve sobrisco de desenvolver a doença, sendo o tempo da população igual a somados tempos de observação de cada indivíduo.Modelos para dados de contagem

Exemplos de Taxa de IncidênciaCidade X no período de 5 anosVamos calcular ataxa de incidência:31 2 4 53 12 0, 25 por anoTI Modelos para dados de contagem

Exemplos de Taxa de IncidênciaMortalidade por gênero de paciente com a doença 21691190 0, 0365/ano2465131TI M 0, 0332/ano39460, 0365RII 1, 0990, 0332TI H Modelos para dados de contagem

Taxa de IncidênciaPor que Taxa de Incidência é importante?Unidades amostrais podem ser acompanhadas pordiferentes períodos de tempos.Modelos para dados de contagem

Seja yij a contagem do número de câncer de pele para ai-ésima faixa etária na cidade j.Pergunta: A taxa de câncer de pele, ajustada por idade,difere nas diferentes cidades?A regressão de Poisson seria o modelo adequado paramodelar a taxa de incidência de eventos (contagens).Modelos para dados de contagem

Inclusão de covariáveisComo incluir covariáveis?Vamos supor uma amostra de tamanho n.E(Yi ) λi (x) i 1, · · · , n e λi 0Vamos usar uma função de ligação logarítimica:log (E(Yi )) log(λi ) β0 β1 xi1 · · · βp xipOu seja:λi eβ0 eβ1 xi1 · · · eβp xipVantagem: garantimos que λ̂i 0.Modelos para dados de contagem

Como modelamos a taxa?Taxa λ(x)conde c é a exposição (tempo, número, área, volume, etc)Com a função de ligação logarítimica: λ(x)log x 0βc log(λ(x) log(c) x 0 βNo R temos o comando offset para lidar com o log(c)(constante sem coeficiente de regressão).Modelos para dados de contagem

Interpretação dos parâmetrosNote que agora estamos considerando:log(contagem ou taxa) x 0 βOs parâmetros não possuem a mesma interpretação domodelo de regressão Normal.Fixando x2 , · · · , xp , quando passamos x1 de 0 para 1temos:x1 0 log(taxa) β2 x2 · · · βp xpx1 1 log(taxa) β1 β2 x2 · · · βp xpModelos para dados de contagem

Interpretação dos parâmetrosEntão: log RT logtaxa1taxa0 β1Vamos supor que exp(β1 ) 2. No caso em que modelos ataxa de incidência temos:RT exp(β1 ) 2Isso significa que a taxa de incidência 1 é duas vezes ataxa de incidência de 0.E no caso em que modelamos a contagem?A interpretação é similiar: a incidência de câncer de 1 éduas vezes a de 0, por exemplo.Modelos para dados de contagem

Exemplo 1Partos cesarianos por ano em 20 hospitais (4 privados e 16 ospitais0111110111cesáreas 49Modelos para dados de contagem

Exemplo 1Partos cesarianos por ano em 20 hospitais (4 privados e 16 públicos)Observe que podemos modelar tanto o número decesáreas (contagem) quanto a proporção (taxa).Seja Yi o número de cesáreas.Suponha que Yi Poisson(µi ).Vamos ajustar log(µi ) β0 β1 Partos β2 Hospital.Modelos para dados de contagem

Exemplo 1Partos cesarianos por ano em 20 hospitais (4 privados e 16 públicos)Assim para log(µi ) β0 β1 Partos β2 Hospital, 00032611,045log(µ) 1, 351 0, 0003261 Partos 1, 045 HospitalE(Y ) e1,351 e0,0003261 Partos e1,045HospitalModelos para dados de contagem

Exemplo 1Partos cesarianos por ano em 20 hospitais (4 privados e 16 públicos)Interpretando o parâmetro β2 :e1,045 2, 84O número de partos por cesárea em hospitais públicos é2,84 vezes o número de partos por cesárea em hospitaisparticular.Modelos para dados de contagem

Exemplo 1Partos cesarianos por ano em 20 hospitais (4 privados e 16 públicos)Note que:Público: µi exp(1.351) exp(0, 0003261 1000) exp(1, 045) 15, 2Particular: µi exp(1.351) exp(0, 0003261 1000) 5, 35Isso implica uma média de 15,2 cesáreas a cada 1000partos em hospitais públicos e 5,4 por 1000 partos emparticulares.Modelos para dados de contagem

Exemplo 2Perfil de Clientes (Retirado dos slides do Gilberto Paula)Dados sobre o perfil dos clientes de uma determinada loja,que foram divididos em 110 áreas de uma cidade.O número de clientes de cada área que foram à loja numperíodo fixo serão relacionados com as seguintesvariáveis em cada área (Neter et al., 1996, p. 613):-número de domicílios (em mil) (x1 );renda média anual domiciliar (em mil US ) (x2 );idade média (em anos) dos domicílios (x3 );distância ao concorrente mais próximo (x4 );distância à loja (em milhas) (x5 ).Modelos para dados de contagem

Exemplo 2Perfil de Clientes (Retirado dos slides do Gilberto Paula)Modelos para dados de contagem

Exemplo 2ModelagemYi : número de clientes da i-ésima área que foram à loja noperíodo determinado.Suponha que Yi P(λi ), onde:log(λi ) β0 β1 x1 · · · β5 x5Modelos para dados de contagem

Exemplo 2Estimativa dos parâmetrosEstimando os parâmetros do modelo, 4,27-5,54-2,096,54-7,95Modelos para dados de contagem

Exemplo 2InterpretaçõesOlhando apenas a tabela, podemos perceber que:O número esperado de clientes na loja cresce com oaumento do número de domicílios na área;O número esperado de clientes na loja diminui com oaumento da renda média e da idade média dos domicíliosbem como da distância da área à loja;Por exemplo, se aumentarmos em um ano a idade médiados domicílios:exp( 0, 004) 0.996Assim, esperamos que o número de clientes que irão àloja irá diminuir em 0.4%.Modelos para dados de contagem

Exemplo 3Câncer de pele em duas cidades em 1994Tabela: DadosIdade15-2425-3435-4445-5455-6465-7475-8485 7657538Modelos para dados de contagem

Exemplo 3Câncer de pele em duas cidades em 1994m - glm(casos idade cidade offset(log(pop)),family a-10,350,820,06E.P.0,0960,0520,0013p-valor 0,01 0,01 0,010,044Interpretação (taxa de incidência) para cidade:exp(0, 82) 2, 2705Modelos para dados de contagem

SuperdispersãoSabemos que se Y Poisson(λ) entãoE(Y ) Var (Y ) λ.Superdispersão ocorre quando há uma inedequação doModelo de Regressão de Poisson.Dizemos que houve superdispersão quandoVar (Y ) E(Y )Modelos para dados de contagem

SuperdispersãoPossíveis Causas1 Função de ligação inadequada. Nós vimos o caso dafunção de ligação logarítimica.2 Não inclusão de covariáveis importantes no preditor linear:- Desconhecidas;- Não foram medidas.3 Excesso de zeros:- Comumente existem situações com excesso de contagenszero;- horários inadequados, pessoas não contaminadas, entreoutros.Modelos para dados de contagem

SuperdispersãoSoluçãoPossível SoluçãoIncluir mais um parâmetro na modela para incorporar essa"extra variação"Modelos para dados de contagem

O modelo de regressão de Poisson Temos que a variável resposta Y representa dados de contagem ou taxas e X é o vetor de covariáveis. Objetivo: explicar a variação de Y através de X. Taxa de incidência TI Número de caso

Related Documents:

Universidad de Salamanca -Dpto. de Informática y Automática Ingeniería del Software I Modelos de proceso 3 Esquema n Clasificación de los modelos de proceso n Modelos tradicionales n Modelos evolutivos n Modelos para sistemas orientados a objetos n Modelos basados en reutilización n Procesos ágiles n Modelos para la Ingeniería Web n Aportaciones principales del tema

6 CUSTOS E FORMAÇÃO DE PREÇOS 4 – Clicar em OK para o Excel apresentar os resultados na tabela de dados. (Ver Figura 5.4.) Figura 5.3 Dados de entrada para uso da ferramenta Tabela de Dados. Figura 5.4 Resultados na tabela de dados do exemplo em análise. Numa tabela de dados, podemos trabalhar com mais de uma

En una secuencia de desarrollo de modelos los tres elementos principales son actividades: 1) que revelan el pensamiento o detonan modelos de los estudiantes; 2) en las que se exploran sus modelos; y, 3) en las que se adaptan tales modelos para aplicarse en otros contextos y para extender sus representaciones (Doerr, 2016). .

6.4. O Centro Universitário São Camilo segue o calendário civil. 6.5. O Centro Universitário São Camilo está empenhado na proteção e confidencialidade de dados pessoais e dados sensíveis que lhe são confiados pelo titular desses dados, necessárias ao cumprimento da Lei Geral de Proteção de Dados (Lei 13.709/2018). 6.6.

detalhadamente os elementos geográficos. Desta forma, os dados geográficos são produzidos a partir da relação entre os dados espaciais e os dados tabulares, a função destes dados é representar graficamente, fisicamente, quantitativamente e quali

MongoDB O que é? Banco de dados (BD) não relacional orientado a documentos Não relacional? Não existe a necessidade de criar uma estrutura de tabelas e dados antes de começar a inserir informações Bancos de Dados relacionais -Você sabe previamente o que vai inserir Normalização CREATE TABLE "NOME DA TABELA" Definição dos tipos de dados

UNIVERSIDADE DA BEIRA INTERIOR Ciˆencias Modelos Epidemiol ogicos SIR e SIS Discretos Estudo dos modelos e elabora c ao de uma ac ao de divulaga c ao na area da Biomatem atica Vers ao final ap os defesa Rabilde de Fa tima Manuel Bartolomeu Dissertac ao para obten c ao do Grau de Mestre em Matema tica para Professores (2o .

be the first trading day in May based on the following: Daily settlement prices are collected for the nearest July contract over 45 consecutive trading days before and on the business day prior to April 16th. The average price is calculated based on the collected settlement prices and then multiplied by seven percent. The resulting number, rounded to the nearest 0.5 cents per pound, or 2 cents .