Inferência Indutiva Uma Perspectiva Genuinamente Bayesiana
description
Transcript of Inferência Indutiva Uma Perspectiva Genuinamente Bayesiana
Inferência IndutivaUma Perspectiva
Genuinamente Bayesiana
Carlos Alberto de Bragança Pereira
Inferência Bayesiana 2007
Aula 1
04/19/23 2
The Statistician is the Wizard who makes "scientific"
statements about invisible states and quantities.
However, contrary to real wishes (and witches), (s)he
attaches uncertainties to h(er)is statements."
04/19/23 3
ProbabilidadesO trabalho do estatístico é iniciado no momento da
descrição dos níveis de incerteza de um cientista sobre
as quantidades de interesse (invisíveis), .
A ferramenta usada para a descrição do nível de
incerteza sobre é a Probabilidade. A Probabilidade de um estado de natureza específico,
digamos , é um índice que indica o nível de
incerteza (ou conhecimento) sobre a veracidade
da afirmação: ¨ é igual a ¨
04/19/23 4
Variáveis AleatóriasNosso objetivo é descrever nossas incertezasProbabilisticamente. Às quantidadesdesconhecidas de nosso interesse damos o nomede Variáveis Aleatórias e podem ser de 3 tipos:
-as observadas-as não observadas e-as não observáveis.
As não observáveis e de interesse damoso nome de Parâmetros.
04/19/23 5
Modelo Probabilístico
Probabilidades devem ser atribuídas a todos
os estados de natureza possíveis. Ao conjunto
de todas as afirmações probabilísticas de um
problema usamos o termo
modelo probabilístico
ou equivalentemente
distribuição de probabilidades.
04/19/23 6
Experimento & Banco de Dados
O mecanismo que transforma uma quantidade
invisível, X, em visível, x, é aqui denominado
experimento.O conjunto de quantidades obtidas após a
realização de experimentos é denominado
resultados experimentais ou
banco de dados.
04/19/23 7
a priori & a posterioriA realização de um experimento {X=x}
tem como objetivo a redução da incerteza sobre o parâmetro de interesse .
O modelo probabilístico de , definidoantes (depois) da realização do
experimento X, é denominado a priori (a posteriori) de .
04/19/23 8
AssociaçãoMuitas vezes o cientista enfrenta um dilema:
O que observar para diminuir a incertezasobre ? Ele pode estar em presença de um
conjunto de experimentos, digamosX,Y,Z,..., passíveis de serem observados.
Pode haver custos ou restrições associadosà realização dos experimentos.
Assim, o estatístico é obrigado aselecionar quais serão observados.
04/19/23 9
Associação
Para uma escolha adequada, ele devedescrever o tipo de associação que,
em sua opinião, existe entre e cada um dos experimentos.
Essa descrição também é feita pormeio de modelos probabilísticos.
Por exemplo, considere que oexperimento X vai ser realizado.
04/19/23 10
AssociaçãoPara cada valor, do parâmetro, represente por f(x|) a função de probabilidade que avalia, paracada x, a probabilidade de {X=x}. Se existempelo menos dois valores de , digamos 1 e 2,tal que f(.|1 ) f(.|2 ), então e X sãodependentes ou associados.
Neste caso é razoável realizar-se o experimentoX com o intuito de diminuir a incerteza sobre .
& X : conjuntos de valores possíveis de e X, os conhecidos espaços paramétrico e amostral.
04/19/23 11
Instrumental
Dist. a priori: P
Modelo Estatístico: {P(,x): xX, }.
Dist. Amostral: {f(x|): xX.
Verossimilhança:x{L(|x) = f(x|): } xX.
Dist a posteriori:{P(|X=x): } xX.
04/19/23 12
Exemplo 1: BioEquivalência
Uma nova droga para enxaquecatenta entrar no mercado.
O laboratório afirma que é equivalente a melhordroga da praça, cujo efeito positivo é de 75%.
Além disso a nova droga sairá mais baratopara o consumidor. Em média 60% mais barato!
Uma pesquisa com 30 pacientes foirealizada e apenas 9 desses não
responderam positivamente a nova droga.
04/19/23 13
Análise PadrãoDistribuição Amostral-Binomial (n=30, =.75):
MLE = .7, IC = [.5412;.8526] com C=95% & p-value =52.8%
10 12 14 16 18 20 22 24 26 28 30
Central
Caudas
.311
04/19/23 14
BayesianPosterior or Likelihood:
mean=.69, mode = .7, median=.691,95% cred. interval [.529;.821], Tx= [.65;.75] & ev=52.8%
0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
TX
Credibility
Caudas
Unif. Prior
.292
04/19/23 15
Planejamento de Experimentos
Quais quantidades devem ser observadas? As que podem gerar maior ganho de informação!
Decisão antes de realizar e observar. Escolha é feita com base nas expectativas sobre
resultados dos experimentos concorrentes.Essa análise de expectativas, é identificada como
o clássico Planejamento de Experimentos.
Procuram-se os planejamentos “ótimos”. Podem ser não realizáveis devido as
restrições operacionais ou de custos.
04/19/23 16
Estimação: Formulação
Obter a posteriori é o nosso objetivo maior Após coletar as informações disponíveis em
x sobre o estatístico descreve ainformação calibrada sobre a posteriori.
Como então melhor predizer ? A resposta é estudada com o nome de
teoria da estimação. Mais geralmentepela teoria da decisão. De posse da
posteriori, fxdecidimos então comomelhor predizer .
04/19/23 17
Estimação: Solução
Consideramos características de fx tais como média, mediana ou moda,
dependendo da logística usada. Esse é otrabalho de estimação pontual.
Por estimação intervalar entendemosa procura, do menor conjunto que, comprobabilidade fixada (95%), contenha
Conjunto de Credibilidade.
04/19/23 18
Teste de Significancia: Formulação
Por teste de significância entendemos
uma avaliação da consistência de uma
hipótese , sobre com o os dados, x.
Entendemos que todo procedimento estatístico
deve basear-se tão somente na posteriori fx
Por hipótese entendemos uma afirmação do tipo
“o parâmetro pertence ao subconjunto
”.
04/19/23 19
Teste de Significancia: Solução
Hipótese (não) precisa dim (=) < dim
No caso não preciso,o valor de Px é um
bom avaliador da consistência entre H & x.
Nosso foco limita-se ao caso
dim < dim das hipóteses precisas.
Introduzimos o conceito de evidência
contra ou a favor da hipótese H avaliada.
04/19/23 20
Full Bayesian Significance Test: FBST
Evidência contra a hipótese:
1-ev = Pr(Tx), onde Tx é tal que,
t Tx e fx(t) > fx .
Tx é a tangente (relativa a x) de
ev alto devemos aceitar .
Caso contrário, rejeitar !
04/19/23 21
Regras
L1-Convexidade: 0<P(A|H)<1 e P(H|H)=1.
L2-Adição:
P(A ou B|H) = P(A|H)+P(B|H) se A e B são exclusivos.
L3-Multiplicação:
P(A e B|H) = P(A|H)P(B|A e H).
Uma extensão da lei número 2 é apresentada a seguir. Entretanto não é conseqüência de conceitos simples Note que nenhuma das 3 leis pode ser deduzida das outras.
• L2’. Adição enumerável:
Seja {(,...,An,...)} um
conjunto enumerável de
eventos mutuamente
exclusivos. Então,
• P(Ai|H)=P(Ai|H)
04/19/23 22
Teorema da Probabilidade Total
x
x
HexXyYHxX
HyYxXHyY
}|Pr{}|Pr{
}|,Pr{}|Pr{
04/19/23 23
Fórmula de Bayes
H}.exy|XP{Yy|H}P{Yx|H}P{X
y|H}P{Yy|H}x,YP{X
y,H}x|YP{X
dt)t|x(f)t(g
)|x(f)(g)x|(g
04/19/23 24
Bibliography-David Blackwell (1969), Basic Statistics, McGraw-Hill.
(Theory of Games & Statisticcal Decisions)-Morris DeGroot (1986), Probability & Statistics, Adison-Wesley
(Decision Theory)-Bruno De Finetti (1972), Probability, induction, and statistics, Wiley.
(Theory of Probability, 2 volumes)- Oscar Kempthorne & L Folks (1971), Probability, Statistics &
Data Analysis, Iowa University Press.- Dev Basu (1988), Statistical Information & Likelihood: A Collection
Of Critical Essays, JK Gosh editor,Springer-Verlag. Lecture Notes in Statistics #45
- IJ Good (1983), Good Thinking, U. Minnesota Press.- Richard Barlow (1998), Engineering Reliability, SIAM- Paulino, Turkman & Murtrera (2003), Estatística Bayesiana.
Fundação Calouste Gulberkian - Lisboa