· 2010. 10. 15. · Cap tulo 1 Estat stica Descritiva 1.1 Introdu˘c~ao 1.1.1 Estat stica A...
Transcript of · 2010. 10. 15. · Cap tulo 1 Estat stica Descritiva 1.1 Introdu˘c~ao 1.1.1 Estat stica A...
-
Caṕıtulo 1
Estat́ıstica Descritiva
1.1 Introdução
1.1.1 Estat́ıstica
A palavra estat́ıstica deriva do latim ”status”e tem dois significados dis-
tintos. Frequentemente usado no plural, o termo estat́ıstica designa todo conjunto
coerente de dados numéricos relativos a um grupo de indiv́ıduos. Assim, por ex-
emplo, pode-se falar em estat́ısticas de produção industrial ou agŕıcola (quantidades
produzidas, custos de produção, preços de venda, etc), de estat́ısticas demográficas
(natalidade, mortalidade), de estat́ısticas de desemprego, de acidentes de estrada,
etc.
Por outro lado, a palavra estat́ıstica designa também, o conjunto de métodos
que permitem reunir e analisar dados de observação.
De acordo com Fisher -“A Estat́ıstica é a matemática aplicada a dados
de observação”. Ela tem por objetivo o uso de métodos cient́ıficos para coleta,
organização, resumo, apresentação e análise de dados, bem como a obtenção de
conclusões válidas a serem utilizadas nas tomadas de decisões.
Assim todo estudo estat́ıstico pode ser decomposto em pelo menos duas
fases:
- a reunião ou coleta dos dados estat́ısticos
- sua análise e interpretação.
A coleta de dados pode ser realizada de duas formas:
1
-
2
- por simples observação dos fenômenos em que se tem interesse - estudo
observacional e
- por experimentação, ou seja, provocando-se voluntariamente a aparição
de certos fenômenos controlados.
A análise estat́ıstica pode ser decomposta em duas etapas, uma dedutiva ou
descritiva e a outra indutiva. A Estat́ıstica Descritiva tem por objetivo resumir e
apresentar os dados observados sob a forma de: tabelas (descrição tabular), gráficos
(descrição gráfica) e parâmetros e suas estimativas (descrição paramétrica).
A Inferência Estat́ıstica permite estender ou generalizar dentro de certas
condições as conclusões obtidas. Frequentemente, a observação ou a experimentação
é relativa a apenas uma fração dos indiv́ıduos em que se tem interesse. As conclusões
relativas a essa fração, chamada amostra, devem, então, ser estendidas tanto quanto
posśıvel ao conjunto de indiv́ıduos que formam a “população”. Essa fase indutiva
comporta evidentemente certos riscos de erro, que podem ser medidos, usando-se a
teoria das probabilidades. Quando em um estudo trabalha-se com amostras, tem-se
uma pesquisa por amostragem. Quando se utiliza a população toda tem-se o censo.
As diferentes etapas de todo estudo estat́ıstico não são, entretanto, independentes.
1.1.2 Variáveis
Variável é uma medida ou classificação obtida de cada elemento da população
ou amostra. A representação de dados torna-se mais fácil por meio da utilização
de variáveis. É importante notar que a variável aleatória é representada por letra
maiúscula e o valor observado pela mesma letra, porém minúscula. Assim, por
exemplo, os dados apresentados na Tabela 1.1, a variável X refere-se ao peso de 24
animais do Cerrado brasileiro, em kg. Tem-se ainda que xi, i = 1, ..., 24, representa
o peso observado de um determinado animal i, por exemplo,
x1 = 250, x2 = 20, x3 = 10, ..., x24 = 60.
Outro exemplo pode ser
-
3
Tabela 1.1: Peso de 24 animais do Cerrado brasileiro, em kg.
Animal X Animal X Animal X
Anta 250 Gato-do-mato 3 Cateto 20
Ariranha 20 Gato-maracajá 6 Preá 1
Bugio-preto 10 Gato-mourisco 10 Quati 5
Cachorro-do-mato 8 Jaguatirica 15 Raposa-do-campo 8
Capivara 70 Lobo-guará 20 Suçuarana 60
Cervo 100 Lontra 10 Tamanduá-bandeira 30
Cotia 3 Onça-pintada 100 Tatu-bola 3
Gambá 1 Paca 8 Veado-do-campo 60
Y : tipos de famı́lias de algumas espécies de plantas encontradas no Parque
Nacional da Serra da Canastra
yj: Asteraceae, Bignoniaceae, Melastomataceae, j = 1, 2, 3 (famı́lias).
Os tipos de variáveis mais comumente utilizadas na descrição de dados são:
Variáveis
Quantitativas
discretascont́ınuasQualitativas
nominaisordinaisa) Variáveis quantitativas representam quantidades. Podem ser de natureza
discreta ou cont́ınua.
São de natureza discreta as variáveis que podem assumir apenas valores den-
tro do conjunto dos números naturais. Exemplo: número de frutos por ramo, número
de parasitas por hospedeiro, número de ovos por ninho, número de sementes germi-
nadas, número de insetos coletados em armadilhas, número de brotos em estudos de
cultura de tecidos, etc.
-
4
São de natureza cont́ınua as variáveis que podem assumir qualquer valor em
um intervalo. Exemplo: alturas de plantas, pesos de animais, velocidade de animais,
concentração de uma solução, biomassa de plantas ou animais, etc.
b) Variáveis qualitativas descrevem categorias, qualidades. São relativas a
dados categorizados. Exemplo: raça, sexo, cor da pele, táxon, grau de infecção, etc.
É posśıvel, às vezes, estabelecer uma correspondência dessas variáveis com
variáveis quantitativas discretas. É o caso, por exemplo, de:
sexo: masculino, feminino ⇒ xi = 0, 1, i = 1, 2
condição: morto, vivo ⇒ xi = 0, 1, i = 1, 2
graus de infecção: ⇒ xi = 0, 1, 2, 3, i = 1, 2, 3, 4.
1.1.3 Somatório
É uma notação bastante utilizada dentro da estat́ıstica. Considere, por
exemplo, a variável aleatória X, que representa o número de espécimes de zarro-
americano (Aythya affinis) coletados ao longo dos anos de 1965 a 1980, conforme a
Tabela 1.2.
Tabela 1.2: Número de espécimes de zarro-americano (Aythya affinis) coletados ao
longo dos anos de 1965 a 1980.
Ano 1965 1966 1967 1968 1969 1970 1971 1972
Números 19 28 4 13 28 36 17 30
Ano 1973 1974 1975 1976 1977 1978 1979 1980
Números 21 32 34 16 22 16 23 31
Tem-se, então, que x1 = 19, x2 = 28, ..., x16 = 31. Logo, o total de zarros-
americanos coletados de 1965 a 1980 é dado por
T = x1 + x2 + ...+ x16 =16∑i=1
xi = x. = 370
-
5
Figura 1.1: Zarro americano.
Podem ser obtidas, ainda, a soma dos quadrados e o quadrado da soma
16∑i=1
x2i = x21 + x
22 + ...+ x
216 = 9706
e (16∑i=1
xi
)2= (x1 + x2 + ...+ x16)
2 = 3702 = 136900.
Outro exemplo, seria o da Tabela 1.3 que mostra o número médio de ca-
marões-espinho coletados na báıa de Ubatuba de acordo com o local no qual o tran-
secto foi feito e com o estágio reprodutivo do camarão.
Tabela 1.3: Números médios de camarões-espinho coletados na báıa de Ubatuba
de acordo com o local no qual o transecto foi feito e com o estágio reprodutivo do
camarão.
Transecto
Estágio j = 1 j = 2 j = 3 j = 4 j = 5 j = 6 Totais
Ov́ıgero y11 = 4,0 y12 = 7,0 y13 = 4,5 y14 = 1,0 y15 = 5,5 y16 = 3,5 y1. = 25,5
Não-ov́ıgero y21 = 3,0 y22 = 6,5 y23 = 5,0 y24 = 2,0 y25 = 5,0 y26 = 3,5 y2. = 25,0
Totais y.1 = 7,0 y.2 = 13,5 y.3 = 9,5 y.4 = 3,0 y.5 = 10,5 y.6 = 7,0 y.. = 50,5
-
6
Pode-se representar cada valor observado por yij, isto é, yij é o número
de camarões-espinho referente ao i-ésimo estágio reprodutivo e j-ésimo transecto.
Assim, tem-se, por exemplo
y.. =2∑
i=1
6∑j=1
yij = y11 + · · ·+ y16 + y21 + · · ·+ y26 = 50, 5
y1. =6∑
j=1
y1j = y11 + · · ·+ y16 = 25, 5
y.2 =2∑
i=1
yi2 = y12 + y22 = 13, 5
Propriedades do somatório:
a)n∑
i=1
k = nk
b)n∑
i=1
kxi = kn∑
i=1
xi
c)n∑
i=1
(xi ± yi) =n∑
i=1
xi ±n∑
i=1
yi
d)n∑
i=1
(xi ± k) =n∑
i=1
xi ± nk.
1.2 Estat́ıstica Descritiva
Tem por objetivo resumir e apresentar dados de observação (população ou
amostra), de modo a simplificar sua interpretação por meio de descrição tabular,
gráfica ou paramétrica.
1.2.1 Variável Qualitativa – Descrição Tabular e Gráfica
Primeiro caso: Uma só variável
Seja o exemplo que se segue. Os alunos da sexta turma de Ciências Biológicas
da ESALQ/USP observaram durante dois dias o número de visitas de polinizadores
a um espécime de Heliconia rostrata. Obtiveram os resultados: das 8h às 10h, 10h
-
7
às 12h, 12h às 14h e das 14h às 16h, respectivamente, 17, 28, 18 e 19 polinizadores
visitaram a planta.
Figura 1.2: Heliconia rostrata.
A representação tabular é feita por meio de tabelas de mono-entrada ou de
classificação simples ou tabelas de frequências. As frequências podem ser absolu-
tas simples, absolutas acumuladas, relativas simples, relativas acumuladas, depen-
dendo do interesse do pesquisador. Uma tabela e mesmo um gráfico deve apresentar:
cabeçalho, corpo e rodapé.
O cabeçalho deve conter o suficiente para que sejam respondidas as questões:
o quê? (fato), onde? (lugar) e quando? (época). O corpo é apresentado por colunas
e sub-colunas dentro das quais serão registrados os dados. O rodapé é reservado
para as observações pertinentes, bem como para a identificação da fonte dos dados.
Assim, para o exemplo dado, tem-se a Tabela 1.4.
A descrição gráfica, dentre outras, pode ser feita de três formas: gráfico
de colunas (ou barras), de linhas e de setores circulares. Esses gráficos podem ser
obtidos considerando-se frequência absoluta, frequência relativa, frequência absoluta
acumulada e frequência relativa acumulada.
a) Gráfico de colunas e de linhas
Os resultados da Tabela 1.4 podem ser representados graficamente como
mostra a Figura 1.3.
-
8
Tabela 1.4: Número de visitas de polinizadores a um espécime de Heliconia rostrata
observados por alunos da sexta turma de Ciências Biológicas da ESALQ-USP no ano
de 2009, em dois dias de observação.
Intervalo Frequência Frequência Freq. abs. Freq. rel.
(xi) absoluta (fi) relativa (f′i) acumulada acumulada
08:00-10:00 17 0,207 17 0,207
10:00-12:00 28 0,341 45 0,548
12:00-14:00 18 0,220 63 0,768
14:00-16:00 19 0,232 82 1,000
82 1,000 - -
08:00−10:00 10:00−12:00 12:00−14:00 14:00−16:00
Horário
Nú
me
ro d
e v
isita
s
05
10
15
20
25
30
05
10
15
20
25
30
Horário
Nú
me
ro d
e v
isita
s
08:00−10:00 10:00−12:00 12:00−14:00 14:00−16:00
Figura 1.3: Gráficos de colunas e de linhas para o número de polinizadores observa-
dos.
b) Gráfico de setores circulares
É a representação gráfica, em um ćırculo, por meio de setores. É utilizado,
principalmente, quando se pretende uma visualização em relação ao total. Para cons-
-
9
trúı-lo, divide-se o ćırculo em setores, cujas áreas serão proporcionais às frequências.
Essa divisão pode ser feita por regra de três. Assim, no exemplo dado
82 visitas− 360o
x1 = 74o37′48′′
17 visitas− x1
82 visitas− 360o
x2 = 122o58′48′′
28 visitas− x2
x3 = 79o01′12′′, x4 = 83
o24′36′′.
08:00−10:0010:00−12:00
12:00−14:00
14:00−16:00
34,1% 20,7%
22,0% 23,2%
Figura 1.4: Gráfico de setores circulares para o número de polinizadores observados.
Segundo caso: duas variáveis
Se no exemplo de visitas de polinizadores a um espécime de Heliconia ros-
trata, além da variável “ńıvel”, também, for considerada a variável “dia de coleta”, os
resultados obtidos podem ser representados em uma tabela de dupla-entrada, como
a Tabela 1.5.
A descrição gráfica pode ser feita por meio dos gráficos de colunas e de
linhas, dentre outras, agrupando-se as colunas por dia de coleta ou por intervalos de
coletas, conforme é mostrado na Figura 1.5.
-
10
Tabela 1.5: Número de visitas de polinizadores a um espécime de Heliconia rostrata
observados por alunos da sexta turma de Ciências Biológicas da ESALQ-USP no ano
de 2009, em dois dias de observação.
Hora Primeiro dia Segundo dia Total
08:00-10:00 9 8 17
10:00-12:00 13 15 28
12:00-14:00 9 9 18
14:00-16:00 10 9 19
Total 41 41 82
Primeiro dia Segundo dia
05
1015
8−10
10−12
12−14
14−16
8−10
10−12
12−14 14−16
08:00−10:00 10:00−12:00 12:00−14:00 14:00−16:00
05
1015
1
2
1
2
1 2
1
222
Figura 1.5: Gráficos de colunas para o número de polinizadores observados.
1.2.2 Variável Quantitativa Discreta – Descrição Tabular e
Gráfica
Primeiro caso: Uma só variável
a) Tabela Primitiva ou Tabela de Dados Brutos – É a tabela inicial dos
dados, geralmente, sem qualquer critério que permita informações “estat́ısticas”.
Assim, por exemplo, em uma pesquisa em sala de aula pode-se solicitar a quinze
alunos que digam o número de pessoas que moram em suas casas, enfatizando que a
-
11
Tabela 1.6: Um exemplo de tabela de frequências.
xi fi
x1 n1
x2 n2
· · · · · ·
xV nV
Total N =∑
i fi
“honestidade”moral cient́ıfica da coleta de dados pode ser mais importante do que
o próprio método estat́ıstico adotado na análise desses dados. À medida que os
alunos vão dando a informação solicitada, os dados vão “entrando”, sem um critério
espećıfico.
Outro exemplos seriam dados coletados no campo, como, por exemplo,
número de sementes germinadas, número de plantas doentes, etc.
b) Rol – É a tabela de dados dispostos em ordem, geralmente, crescente (ou
decrescente)
Apesar de pouco informativa apresenta algumas vantagens sobre a tabela
primitiva, pois facilmente se obtêm os valores de
- limite inferior: l ou LI
- limite superior: L ou LS
- amplitude total: A = L− l ou A = LS − LIApresenta desvantagens quando o conjunto de dados é grande.
c) Tabela de Frequências – As duas tabelas anteriores são usadas, em geral,
apenas para “controle”do pesquisador. Quando a pesquisa é publicada, a tabela
de frequências é a que deve ser apresentada: espaço de publicação, quantidade de
informação, etc. Esse tipo de tabela contém, no caso mais simples duas colunas,
uma com os valores observados (xi) e a outra com as frequências absolutas (fi),
como mostrado na Tabela 1.6. Podem também, ser inclúıdas colunas com frequências
-
12
Tabela 1.7: Número de pessoas que moram nas casas de 15 alunos amostrados.
.
xi fi ai a′i pi Fi
3 3 3 15 0,2 0,2
4 4 7 12 0,27 0,47
5 5 12 8 0,33 0,80
6 1 13 3 0,07 0,87
7 1 14 2 0,07 0,94
8 1 15 1 0,07 1,00
absolutas acumuladas, frequências relativas, frequências relativas acumuladas.
Suponha que na pesquisa com os quinze alunos sobre o número de pes-
soas que moram em suas casas, os resultados obtidos foram aqueles apresentados na
Tabela 1.7 em que ai é a frequência acumulada direta do valor xi, a′i é a frequência
acumulada inversa do valor xi, pi é a frequência relativafiN
do valor xi e Fi é a
frequência relativa acumulada direta do valor xi.
Será visto, posteriormente, que a frequência relativa é um “bom”estimador
de probabilidade e que Fi é um “bom”estimador da função acumulada de probabili-
dade.
Graficamente as variáveis quantitativas discretas são descritas por meio de
gráficos de linhas e de barras.
Segundo caso: Duas ou mais variáveis
Exemplo: Na mesma pesquisa com os 15 alunos, pode-se solicitar para infor-
marem dentre os moradores quantos são “assalariados”, obtendo-se os dados brutos,
o rol das n-uplas, ordenando-se por uma das variáveis e uma tabela de dupla-entrada,
em que a variável aleatória X representa o número de moradores por residência e
a variável aleatória Y representa o número de assalariados, conforme mostrado na
Tabela 1.8.
-
13
Tabela 1.8: Tabela de frequências, classificada de acordo com o número de pessoas
que moram nas casas de 15 alunos amostrados e número de assalariados.
X
Y 2 3 4 5 6 Totais (f.j)
1 1 1 1 1 0 4
2 0 1 3 2 1 7
3 0 1 2 1 0 4
Totais (fi.) 1 3 6 4 1 15
Note que as frequências marginais de X reproduzem a tabela já constrúıda
quando se considerou apenas a variável X. De modo análogo pode ser feito para a
variável Y . Além disso,
∑ij
fij =∑i
fi =∑j
fj = N = número de dados
A tabela de dupla entrada pode ser constrúıda com frequências relativas.
1.2.3 Variável Quantitativa Cont́ınua – Descrição Tabular e
Gráfica
Primeiro caso: Uma só variável
a) Tabela primitiva ou tabela de dados brutos
Exemplo: Os dados da Tabela 1.9 referem-se a peso de 50 colmos de cana-
de-açúcar (em g).
b) Rol – Ordenando-se os dados obtêm-se os limites inferior e superior e a
amplitude total.
l = LI = 10, 20
L = LS = 22, 10
A = 22, 10− 10, 20 = 11, 90.
-
14
Tabela 1.9: Peso de 50 colmos de cana-de-açúcar (em g).
14,11 16,12 17,78 13,54 17,59 17,09 17,26 20,35 13,34 20,08
14,77 13,61 14,85 17,76 17,46 16,08 14,14 15,06 20,67 17,60
15,26 14,17 16,39 12,00 15,55 14,78 20,48 20,04 16,78 13,59
19,70 19,56 19,18 19,21 15,94 19,12 20,90 17,11 14,06 19,38
19,36 16,07 22,10 14,62 18,05 10,20 16,51 20,39 15,63 14,30
c) Tabela de classes
Note que ao contrário das variáveis discretas, as variáveis cont́ınuas apresen-
tam muitos valores diferentes. Desse modo, uma tabela de frequências teria muitas
linhas e seria, portanto, pouco explicativa. Para contornar esse problema, usam-se,
para descrever as variáveis cont́ınuas, tabelas de classes ou tabelas de intervalos.
Faz-se, então, a partição do rol em intervalos de amplitude, geralmente, iguais de-
nominadas classes.
O número ideal de classes de uma tabela depende, muitas vezes, mais do
bom senso do pesquisador do que de regras ŕıgidas pré-estabelecidas. Não há uma
fórmula exata. Boas aproximações podem ser obtidas por:
(i)
k =
≤ 5 se N ≤ 25≃ √N se N > 25(ii) Sturges k ≃ 1 + 3, 22 log(N).
A amplitude de cada classe é obtida por n =A
k. No exemplo dado, tem-se
k =√50 ≈ 7 e h = 22, 10− 10, 20
7= 1, 7
Os gráficos mais comumente usados para descrever as variáveis quantitativas
cont́ınuas, são histograma e poĺıgono de frequência, usando-se frequências absolutas,
e ogivas de Galton crescente ou decrescente, usando-se frequências acumuladas.
O histograma é constitúıdo de uma sequência de retângulos justapostos em
-
15
Tabela 1.10: Tabela de frequências simples (fi), simples acumuladas crescentes (ai),
simples acumuladas decrescentes (a′i), relativas simples (P̂i), relativas acumuladas
(Fi) para os dados da Tabela 1.9, mi representa o ponto médio do intervalo.
Peso mi fi ai a′i P̂i Fi
10,0 ⊢ 12,0 11,0 1 1 50 0,02 0,02
12,0 ⊢ 14,0 13,0 5 6 49 0,10 0,12
14,0 ⊢ 16,0 15,0 14 20 44 0,28 0,40
16,0 ⊢ 18,0 17,0 14 34 30 0,28 0,68
18,0 ⊢ 20,0 19,0 8 42 16 0,16 0,84
20,0 ⊢ 22,0 21,0 7 49 8 0,14 0,98
22,0 ⊢ 24,0 23,0 1 50 1 0,02 1,00
que cada retângulo tem como base a amplitude de classe e como altura a freqüência
da classe que descreve. O poĺıgono de frequências consiste de uma linha poligo-
nal fechada que une os pontos Pi(mi, fi), i = 1 · · · , k. Para “fechar”o poĺıgono
de frequências, supõe-se uma classe imediatamente anterior e outra imediatamente
posterior, ambas com frequências nulas e procede-se de modo análogo.
Pesos de colmos de cana−de−açúcar
Freq
uênc
ias
0 10 20 30 40
01
23
4
05
1015
4 12 20 28 36
Figura 1.6: Histograma e ogivas de Galton para os dados de pesos de colmos de
cana-de-açúcar.
-
16
A ogiva de Galton crescente consiste de uma linha poligonal que une os
pontos Pi(Li, ai), enquanto que a ogiva de Galton decrescente consiste de uma linha
poligonal que une os pontos Pi(li, a′i).
O histograma e as ogivas de Galton para os dados de pesos de colmos de
cana-de-açúcar, estão representados na Figura 1.6.
1.3 Descrição paramétrica
1.3.1 Introdução
Os dados relativos a uma variável quantitativa, apresentados em uma tabela,
dão visão geral do problema em estudo. Entretanto, é extremamente conveniente
proceder a uma descrição dos dados usando-se medidas que mostrem, de maneira
bastante concisa, certas caracteŕısticas da amostra.
As medidas de tendência central, também chamadas medidas de posição,
estabelecem o valor em torno do qual os dados se distribuem. Estão entre elas:
média aritmética, média geométrica, média harmônica, média quadrática, mediana,
quartis, decis, percentis e moda.
As medidas de dispersão permitem quantificar a variabilidade dos valores
observados, ao redor de um parâmetro de posição. Estão entre elas: amplitude total,
variância, desvio-padrão, erro-padrão da média, coeficiente de variação (medida de
dispersão relativa), desvio-quartil, desvio semi-quart́ılico e desvio quartil reduzido.
As medidas de assimetria medem o grau de simetria de uma distribuição en-
quanto que as medidas de curtose medem o grau de achatamento de uma distribuição.
Estão entre elas: coeficientes de Pearson e coeficientes de Fisher.
Uma distribuição pode ser: simétrica, assimétrica positiva ou assimétrica
negativa e, ainda, leptocúrtica, mesocúrtica ou platicúrtica.
Existem, ainda, as medidas de associação que envolvem a dispersão de pon-
tos referentes a duas variáveis, e podem ser citadas: covariância e coeficiente de
correlação.
-
17
Resta lembrar que para a maioria dos parâmetros, deve-se considerar, sepa-
radamente, o caso de séries estat́ısticas (uma simples enumeração das observações)
e aquele das distribuições de frequências considerando-se tabelas de frequências e de
classes de frequências.
É prefeŕıvel, geralmente, proceder à redução paramétrica dos dados, dire-
tamente, a partir dos valores observados, mesmo se as distribuições de frequências
foram estabelecidas, por exemplo, em vista da representação gráfica dos resultados.
Em particular, é preciso evitar efetuar a redução dos dados a partir de distribuições
grupadas em classes.
1.3.2 Medidas de tendência central ou de posição
Estabelecem o valor em torno do qual os dados se distribuem.
1.3.2.1 Média aritmética
Primeiro caso: Dados não agrupados
Dado um conjunto de N valores
ΩX = {x1, x2, . . . , xN}
define-se a média aritmética como
x̄ =x1 + x2 + . . .+ xN
N.
Os śımbolos x̄, m̂ ou µ̂ representam estimativas da média m ou µ da popu-
lação. Os śımbolos m e µ representam os parâmetros da população.
Como exemplo, sejam os dados de produção de cana-de açúcar da Tabela
1.9. Tem-se:50∑i=1
xi = 839, 69 N = 50 x̄ = 16, 8g.
-
18
Segundo caso: Dados colocados sob a forma de tabelas de frequências
Seja a Tabela 1.11 de frequências.
Tabela 1.11: Tabela de frequências
xi fi xifi
x1 f1 x1f1
· · · · · · · · ·
xk fk xkfk
Totais N =k∑
i=1
fi
k∑i=1
xifi
A média aritmética é obtida por
m̂ = x̄ =
k∑i=1
xifi
k∑i=1
fi
.
Tabela 1.12: Número de moradores por residência, de 15 alunos amostrados.
xi fi xifi
3 3 9
4 4 16
5 5 25
6 1 6
7 1 7
8 1 8
Totais 15 71
Exemplo: Considerando-se o exemplo do número de moradores por
residência, de 15 alunos amostrados, pode-se construir a Tabela 1.12, a partir da
-
19
qual se obtém a média aritmética
x̄ =71
15= 4, 7 moradores por residência.
Terceiro caso: Dados colocados sob a forma de tabelas de classes de frequências
Seja a Tabela 1.13 de classes de frequências. A média aritmética é obtida
Tabela 1.13: Tabela de classes de frequências.
Classes mi fi mifi
c1 ⊢ c2 m1 f1 m1f1c2 ⊢ c3 m2 f2 m2f2· · · · · · · · · · · ·
ck ⊢ ck+1 mk fk mkfk
Totais N =k∑
i=1
fi
k∑i=1
mifi
por
x̄ =
k∑i=1
mifi
N,
em que mi é o ponto médio da classe e N =k∑
i=1
fi.
Propriedades da média aritmética:
1)N∑i=1
(xi − x̄) = 0
As diferenças di = xi−x̄ são chamadas desvios, discrepâncias ou afastamento
de cada xi em relação a x̄.
2)∑N
i=1 (xi − x̄)2 = 0 é mı́nima, isto é, a soma dos quadrados dos desvios
de cada observação xi em relação a uma medida de posição k é a menor posśıvel
quando k é a média aritmética.
-
20
Exemplo: Considere os dados de peso de 50 colmos de cana-de-açúcar da
Tabela 1.9 com a Tabela 1.14 de classes de frequências. A média aritmética é obtida
Tabela 1.14: Tabela de classes de frequências para os dados da Tabela 1.9.
Peso mi fi mifi
10,0 ⊢ 12,0 11,0 1 11,0
12,0 ⊢ 14,0 13,0 5 65,0
14,0 ⊢ 16,0 15,0 14 210,0
16,0 ⊢ 18,0 17,0 14 238.0
18,0 ⊢ 20,0 19,0 8 152,0
20,0 ⊢ 22,0 21,0 7 147,0
22,0 ⊢ 24,0 23,0 1 23,00
Totais 50 846
por
x̄ =846
50= 17g.
1.3.2.2 Mediana
É um parâmetro de posição tal que a metade das observações lhe são infe-
riores (ou iguais) e a outra metade superiores (ou iguais).
Primeiro caso: dados não-agrupados
Feita a ordenação dos n dados a mediana é dada por
md = xn+12
se n é ı́mpar, e
md =xn
2+ xn
2+1
2se n é par.
Exemplo: Um estudo foi conduzido com adolescentes mulheres que sofriam
de bulimia e os resultados das medidas de entrada calórica diária (kcal/kg) estão na
-
21
Tabela 1.15. A mediana é dada por
md =x12 + x13
2=
21, 6 + 22, 9
2= 22, 25
Tabela 1.15: Medidas de entrada calórica diária (kcal/kg) de 24 adolescentes mulhe-
res.
15,9 18,9 25,1 16,0 19,6 25,2
16,5 21,5 25,6 17,0 21,6 28,0
17,6 22,9 28,7 18,1 23,6 29,2
18,4 24,1 30,9 18,9 24,5 30,6
Outro exemplo: As alturas (cm) de nove alunos do terceiro ano do curso de
Ciências Biológicas da ESALQ/USP, 2009 foram
X: { 172; 180; 183; 183; 185; 187; 189; 189; 191}.
A mediana é dada por
md = x5 = 185.
Segundo caso: dados colocados sob a forma de tabelas de frequências
Distribuição do número de moradores por residência, de 15 alunos sorteados
no terceiro ano de Ciências Biológicas, 2009
xi fi a′i
3 3 3
4 4 7
5 5 12
6 1 13
7 1 14
8 1 15
md = x 15+12
= x8 = 5
-
22
Terceiro caso: dados colocados em uma tabela de classes de frequências
Um modo de se obter a mediana é por meio de um processo gráfico,
utilizando-se a Ogiva de Galton. No exemplo de dados de bulimia tem-se a Ogiva
de Galton.
Figura 1.7: Ogiva de Galton crescente para os dados de bulimia
Tabela 1.16: Tabela de classes de frequências para os dados da Tabela 1.15.
Peso mi fi
15,9 ⊢ 18,9 17,4 7
18,9 ⊢ 21,9 20,4 5
21,9 ⊢ 24,9 23,4 4
24,9 ⊢ 27,9 23,4 3
27,9 ⊢ 30,9 26,4 4
30,9 ⊢ 33,9 29,4 1
Totais 24
Outro modo de se obter a mediana é usando-se a fórmula
md = lmd +(N2−∑
fi)h
fmd
-
23
em que lmd é o limite inferior da classe mediana,∑
fi é a soma das frequências
anteriores à classe mediana, h é a amplitude da classe mediana e fmd é frequência
da classe mediana.
Para os dados de bulimia da Tabela 1.15, com tabela de classes de frequências
na Tabela 1.16, tem-se
md = 20, 4 +242− 75
· 3 = 23, 4.
1.3.2.3 Moda
É o elemento de uma série de dados que ocorre com maior frequência.
Primeiro caso: dados não-agrupados
No exemplo de dados não agrupados de bulimia (Tabela 1.15), a moda é
igual a 18,9, pois aparece duas vezes enquanto que as outras observações apare-
cem apenas uma vez. Para o exemplo de alturas de alunos, as modas são 183 e 189cm.
Segundo caso: dados agrupados em uma tabela de frequências
Para o exemplo de número de moradores por residência, de 15 alunos do ter-
ceiro ano de Ciências Biológicas, 2009, a moda é Mo = 5 (é o valor xi correspondente
à maior frequência fi)
xi 3 4 5 6 7 8
fi 3 4 5 1 1 1
Terceiro caso: dados agrupados em uma tabela de classes de frequências
Uma maneira de se obter a moda é por meio de um processo gráfico,
utilizando-se o histograma de frequências simples. No exemplo de cana-de-açúcar,
tem-se Mo = 18, 23, conforme Figura 1.8.
Outro modo de se obter a moda é usando-se a fórmula de Czuber
Mo = l +∆1
∆1 +∆2.h
-
24
Figura 1.8: Histograma dos pesos de colmo de açúcar com cálculo da moda.
em que l é o limite inferior da classe modal, ∆1 é a diferença entre a frequência
da classe modal e a imediatamente anterior, ∆2 é a diferença entre a frequência da
classe modal e a imediatamente posterior e h é a amplitude da classe.
Para os dados da Tabela 1.15 com Tabela 1.16 de classes de frequências,
tem-se
Mo = 15, 9 +7
7 + 2.3 = 18, 23.
1.3.2.4 Média geométrica
Dado o conjunto de N valores ΩX = {x1, x2, . . . , xN}, se os dados forem não agrupa-
dos, a média geométrica é obtida por
x̄g = n√x1.x2 . . . xN =
n
√√√√ N∏i=1
xi.
Se os dados estiverem em uma tabela de classes de frequências, então,
x̄g =n
√√√√ N∏i=1
xfii
sendo xi a média da classe i com frequência fi.
Exemplo: Durante o primeiro semestre do ano de 1970 a relação
x =preço de gasolina
preço do óleo diesel
-
25
foi x1 = 2, 50 e no segundo semestre foi x2 = 2, 00. Então,
mgx =√2× 2, 5 =
√5 = 2, 236
Note que se y = 1x⇒ y1 = 12,5 e y2 =
12. Logo,
mgy =
√1
2, 5× 1
2=
√1
5= 0, 447 =
1
mgx.
Se fosse utilizada a média aritmética, ter-se-ia
x̄ ̸= 1ȳ.
1.3.2.5 Média harmônica
É utilizada no cálculo de velocidades médias e custo médio de bens comprados com
uma quantia fixa. Dado o conjunto de N valores ΩX = {x1, x2, . . . , xN}, para dados
não agrupados, a média harmônica é
x̄h =N
1x1
+ 1x2
+ . . .+ 1xN
=N∑Ni=1
1xi
isto é, é o inverso da média aritmética dos inversos dos valores.
Para dados em tabelas de frequências
x̄h =N∑ki=1
fixi
.
Exemplo: As cidades A, B e C são equidistantes umas das outras. Um
motorista viaja de A para B a 30km/h de B para C a 60 km/h e de C para A a 120
km/h. Qual a velocidade média desenvolvida no percurso?
x̄h =3
130
+ 160
+ 1120
= 51, 428km/h.
-
26
1.3.2.6 Média quadrática
É utilizada, principalmente, na determinação de diâmetro de árvores de secção ou
área média. Dado o conjunto de valores ΩX = {x1, x2, . . . , xN}, para dados não-
agrupados, a média quadrática é
x̄q =
√x21 + x
22 + . . .+ x
2N
N=
√∑x2i
N.
Para dados em tabelas de frequências,
x̄q =
√1
N
∑fix2i .
1.3.2.7 Separatrizes: Decis, Quartis e Percentis
Quartis dividem um conjunto de dados ordenados em quatro partes iguais, enquanto
que os decis em dez partes iguais e os percentis em cem partes iguais. Assim, têm-se
três quartis (Q1, Q2, Q3), nove decis (D1, D2, ...,D9) e noventa e nove percentis (P1,
P2,...,P99). Tem-se, ainda, que Md = Q2 = D5 = P50.
O processo gráfico utilizado para a determinação dessas separatrizes é seme-
lhante ao utilizado para a mediana, a partir da Ogiva de Galton. Quanto às fórmulas
tem-se:
Q1 =lQ1 + (
N4−∑
fi)
fQ1 .h.
1.3.2.8 Relação entre média, mediana e moda
Em uma distribuição simétrica observa-se que
x̄ = md = mo.
-
27
Figura 1.9: Exemplo de uma distribuição simétrica
Em uma distribuição assimétrica positiva observa-se que x̄ > md > mo
enquanto que na assimétrica negativa x̄ < md < mo.
1.3.3 Medidas de dispersão
1.3.3.1 Introdução
As medidas de tendência central, embora de extrema importância, não são suficientes
para o estudo completo das distribuições.
Exemplo inicial: Em um ensaio de cana-de-açúcar em que se testaram três
variedades foram obtidas as produções:
variedade A: 86,0 87,0 88,0 88,0 88,0 89,0 90,0
variedade B: 84,0 86,0 88,0 88,0 88,0 90,0 92,0
variedade C: 87,0 87,0 88,0 88,0 88,0 89,0 89,0.
Verifica-se que:
x̄A = x̄B = x̄C = 88, 0∑
x2 = 54218 s2 = 1, 67
mdA = mdB = mdC = 88, 0∑
x2 = 54248 s2 = 6, 67
moA = moB = moC = 88, 0∑
x2 = 54212 s2 = 0, 67.
-
28
Tornam-se necessárias, portanto, outras medidas para se fazer a escolha de
uma determinada variedade. Um novo critério, então, poderia ser: a variedade mais
regular, isto é, a variedade cujas produções apresentam menor dispersão.
1.3.3.2 Amplitude total
É a mais rudimentar das medidas de dispersão. É a diferença entre o maior e o
menor dos valores de uma série de dados.
A = xmax − xmin
No exemplo dado:
AA = 4, 0 AB = 8, 0 AC = 2, 0
Tem a desvantagem de levar em consideração apenas os valores extremos.
1.3.3.3 Desvio (di) em relação à média
Primeiro caso: dados não agrupados
di = xi − x̄ na amostra
e
di = xi − µ na população
Segundo caso: dados em tabelas de classes de frequências
di = mi − x̄
Fato:∑
di =∑
(xi − x̄) =∑
xi − nx̄ = 0
1.3.3.4 Variância
É a mais importante das medidas de variação e é definida como a média dos
quadrados dos desvios.
-
29
Primeiro caso: dados não agrupados
População: σ2 =
∑(xi − µ)2
n=
1
n
[∑x2 − (
∑x)2
n
]
Amostra: s2 =
∑(xi − x̄)2
n− 1=
1
n− 1
[∑x2 − (
∑x)2
n
]Nota: Perde-se um grau de liberdade ao estimar-se σ2 com base na
estimativa da média.
No exemplo de peso das três variedades de cana-de-açúcar:
s2A = 1, 67 s2B = 6, 67 s
2C = 0, 67
Poder-se-ia, portanto, nesse caso escolher a variedade C.
No exemplo de dados de produção de cana-de-açúcar (t/ha), da Tabela 1.9,
tem-se
∑x2 = 14445, 64
∑x = 839, 69
s2 =1
50− 1(14445, 64− 839, 69
2
50
)= 7, 02g2
Segundo caso: dados em tabelas de frequências
σ2 =1
n
∑fi(xi − µ)2 =
1
n
[∑fix
2i −
(∑
fixi)2
n
]
s2 = 1n−1
∑fi(xi − x̄)2 =
1
n− 1
[∑fix
2i −
(∑
fixi)2
n
]
Exemplo: Distribuição do número de moradores por residência
-
30
xi fi fixi fix2i
3 3 9 27
4 4 16 64
5 5 25 125
6 1 6 36
7 1 7 49
8 1 8 64
15 71 365
s2 =1
14
[365− 71
2
15
]= 2, 07
Terceiro caso: dados em tabelas de classes de frequências
s2 =1
n− 1
k∑i=1
fi(mi − x̄)2 =1
n− 1
[∑fim
2i −
(∑
fimi)2
n
]sendo mi é o ponto médio da classe i e n =
∑fi
Em outro exemplo de dados de produção de cana-de-açúcar (t/ha) tem-se:
mi fi mifi m2i fi
74,0 ⊢ 79,2 76,6 4 306,4 23470,24
79,2 ⊢ 84,4 81,8 5 409,0 33456,20
84,4 ⊢ 89,6 87,05 14 1218,0 105966,00
89,6 ⊢ 94,8 92,2 7 645,4 59505,88
94,8 ⊢ 100,0 97,4 2 194,8 18973,52
100,0 ⊢ 105,2 102,6 4 410,4 42107,04
3184,0 283478,88
s2 =1
35
[283478, 88− 3184, 0
2
36
]=
1871, 7689
35= 53, 4791 ≃ 53, 48t/ha
-
31
1.3.3.5 Desvio-padrão
Observando-se a fórmula para o cálculo da variância, vê-se que o numerador é uma
soma de quadrados. Assim, se a unidade foi, por exemplo, metro (m), tem-se que
a variância será dada em m2. Para se voltar à variável original, necessita-se, então,
extrair a raiz quadrada da variância que é o desvio-padrão. Assim, tem-se:
População: σ =√σ2
Amostra: s =√s2
s =√53, 48 = 7, 32 dados de cana-de-açúcar agrupados
s =√2, 07 = 1, 44 dados de habitantes por residência
1.3.3.6 Coeficiente de variação
Trata-se de uma medida relativa de dispersão, útil para a comparação em termos
relativos do grau de concentração em torno da média de séries distintas. É dado por:
População: CV =σ
µou CV (%) = 100 · σ
µ
Amostra: CV =s
x̄ou CV (%) = 100 · s
x̄Para efeitos práticos, costuma-se considerar que CV superior a 50% indica
alto grau de dispersão e, consequentemente, pequena representabilidade da média.
Enquanto que para valores inferiores a 50% a média será tanto mais representativa
do fato quanto menor for o seu CV. O coeficiente de variação mede o desvio-padrão
em unidades da média.
Assim se temos duas amostras de peso (em kg) de gado Canchim aos 8 meses
Amostra A: 347, 380, 328, 410, 380, 348, 329, 320, 330, 305
Amostra B: 350, 343, 325, 348, 334, 327, 317, 342, 341, 330
x̄A = 347, 7 x̄B = 335, 7
s2A = 1067, 79 s2B = 116, 9
sA = 32, 68 sB = 10, 81
CVA = 0, 094 CVB = 0, 032
-
32
Portanto, vê-se que a dispersão relativa da amostra B é menor do que a da
amostra A.
1.3.3.7 Erro-padrão da média
Obtido por
σ(x̄) =σ√n
para população
s(x̄) =s√n
para amostra
Pode ser verificado que médias e desvios-padrão são por si mesmos sujeitos
à variação e formam populações de médias e de desvios-padrão.
Espera-se que médias sejam menos variáveis que observações individuais.
Assim, o erro-padrão da média é uma medida de dispersão de um conjunto de
médias, utilizando-se apenas uma média. Nos exemplos dados, tem-se:
s(x̄) =7, 09√36
= 1, 182 para dados de cana-de-açúcar não-agrupados
s(x̄) =3, 31√36
= 0, 552 para dados de cana-de-açúcar agrupados
s(x̄) =1, 44√15
= 0, 372 para dados de habitantes por residência
-
Caṕıtulo 2
PROBABILIDADES
2.1 Conceituação
2.1.1 Experimento Aleatório (E)
É aquele que repetido sob as mesmas condições pode levar a resultados
diferentes, isto é, não se pode prever seu resultado, em razão do fato de que todos
os fatores que determinam o resultado não podem ser medidos ou controlados.
Exemplos:
E1: Lançar uma moeda e observar o resultado da face voltada para cima.
E2: Lançar duas moedas e observar o resultado das faces voltadas para cima.
E3: Lançar dez moedas e observar o número de caras.
E4: Lançar um dado e observar o número mostrado na face de cima.
E5: Lançar dois dados e observar o número mostrado na face de cima.
E6: Lançar dois dados e observar a soma dos números mostrados na face de
cima.
E7: Plantar 10 sementes de feijão e observar o número de sementes germi-
nadas.
E8: Fazer o cruzamento de dois animais e observar o sexo do animal que
nasceu.
Analisando esses experimentos verifica-se:
a) Cada experimento poderá ser repetido sob as mesmas condições in-
definidamente.
33
-
34
b) Não se conhece um particular valor do experimento “a priori”, porém,
podem-se descrever todos os posśıveis resultados - as possibilidades.
c) Quando o experimento for repetido um grande número de vezes, surgirá
uma regularidade, isto é, haverá uma estabilidade da fração f =s
n(frequência re-
lativa), em que o número n é o número de repetições e s é o número de sucessos
de um particular resultado estabelecido antes da realização. Essa caracteŕıstica é
fundamental para o cálculo da probabilidade de um certo evento. Assim,
n
f
2.1.2 Espaço Amostral
É o conjunto de todos os resultados posśıveis associados a um experimento,
representado por S. Sendo S um conjunto, ele poderá ser finito ou infinito. Nos
exemplos dados
a) E1 : S1 = {k, c} em que c = cara, k = coroa
b) E2 : S2 = {(c, c), (c, k), (k, c), (k, k)}
c) E3 : S3 = {0, 1, 2, ..., 10}
d) E4 : S4 = {1, 2, 3, 4, 5, 6}
e) E5 : S5 = {(1, 1), (1, 2), (1, 3), ..., (6, 6)}
f) E6 : S6 = {2, 3, 4, ..., 12}
g) E7 : S7 = {0, 1, 2, ..., 10}
h) E8 : S8 ={fêmea, macho}
-
35
2.1.3 Evento
É um subconjunto de S, ou seja, um conjunto de resultados de um experi-
mento. Nos exemplos dados
a) A1: sair cara ⇒ A1 = {c}
b) B1: sair pelo menos uma cara ⇒ B1 = {(c, c), (k, c), (c, k)}
c) C1: não sair cara ⇒ C1 = {0}
d) D1: sair o três ⇒ D1 = {3}
e) X1: sair o par (5, 6) ⇒ X1 = {(5, 6)}
f) F1: sair soma onze ⇒ F1 = {(5, 6), (6, 5)}
g) G1: pelo menos 8 sementes germinaram ⇒ G1 = {1, 2, 3, ..., 8}
h) H1: nascer macho ⇒ H1={macho}.
Tipos de Eventos
Evento Imposśıvel – aquele que nunca ocorre. Representado por ∅. Por
exemplo, no jogo de dois dados sair soma 13.
∅ = {13}
Evento Simples ou Elementar – é aquele que contém apenas um dos
elementos do espaço amostral. Exemplos: A1, C1, D1, H1.
Evento Certo – é o próprio espaço amostral S.
A = S
Evento Complementar – Dado um evento A de um espaço amostral S,
define-se o evento complementar de A, como o subconjunto de todos os elementos
de S que não estão em A, isto é,
Ā = {x : x ∈ S e /∈ A}
-
36
Propriedades
a) A ∪ Ā = S
b) A ∩ Ā = ∅
Exemplo: Em E4 = {1, 2, 3, 4, 5, 6}, podem-se definir os eventos comple-
mentares
A: sair face par ⇒ A = {2, 4, 6}
Ā: sair face ı́mpar ⇒ Ā = {1, 3, 5}.
Eventos Mutuamente Exclusivos
Dois eventos A1 e A2 são mutuamente exclusivos, se eles não podem ocorrer
simultaneamente, isto é, A1∩A2 = ∅. Exemplo: Em E4, podem-se definir os eventos
mutuamente exclusivos
A1: sair o número 2, A1 = {2}
A2: sair número ı́mpar, A2 = {1, 3, 5}
A1 ∩ A2 = ∅.
Eventos Independentes
Dois eventos A1 e A2 são dependentes, se a ocorrência de um deles depende
de que o outro tenha ocorrido, ou não. Dois eventos A1 e A2 são independentes, se
a ocorrência de um deles independe de que o outro tenha ocorrido, ou não.
Exemplo: Seja
-
37
E: Retirar 2 bolas de uma urna com 2 bolas brancas e uma preta, sem
reposição.
Os eventos
A1: A primeira bola é branca e
A2: A segunda bola é branca
são dependentes, pois a chance de ocorrência da segunda bola branca muda, depen-
dendo da cor da primeira bola.
2.2 Definição de Probabilidade
Dado um espaço amostral S, a probabilidade de um evento A, representada
por P (A), é uma função definida em S, que associa um valor numérico ao evento A,
satisfazendo os axiomas:
a) 0 ≤ P (A) ≤ 1
b) P (S) = 1
c) Se A e B são eventos mutuamente exclusivos (A ∩B = ∅), então:
P (A ∪B) = P (A) + P (B).
Nos problemas práticos o valor P (A) pode ser obtido por
P (A) =tamanho de A
tamanho de S.
Exemplos
1) Joga-se um dado. Qual a probabilidade de sair pelo menos 3?
Solução: Dado que S = {1, 2, 3, 4, 5, 6} e A = {3, 4, 5, 6}, então
P (A) =4
6=
2
3.
2) Uma urna contém 5 bolas brancas, 7 pretas e 3 vermelhas. Tiram-se 5
bolas de uma vez. Calcule as probabilidades dos eventos que se seguem.
a) Sáırem 3 bolas brancas e 2 vermelhas.
-
38
p1 =C35C
23
C515=
10
1001.
b) Não sair nenhuma bola branca.
p2 =C510C515
=12
143.
c) Sair pelo menos uma preta.
p3 = 1− P (nenhuma bola preta) = 1−C58C515
=421
429.
2.3 Teoremas
1. Se ∅ é o conjunto vazio, então P (∅) = 0.
Prova:
A e ∅ são disjuntos, pois A ∩ ∅ = ∅
P (A ∪ ∅) = P (A) + P (∅)
P (A) = P (A) + P (∅), pois A ∪ ∅ = A
Logo, P (∅) = 0.
2. Se Ā é o complemento de A, então P (Ā) = 1− P (A).
Prova:
Como A ∪ Ā = S e A ∩ Ā = ∅, então
P (A ∪ Ā) = P (A) + P (Ā) por (c),
P (S) = P (A) + P (Ā) e por (b)
1 = P (A) + P (Ā) ⇒ P (Ā) = 1− P (A).
-
39
3. Se A ⊂ B,então P (A) ≤ P (B).
Prova:
Pelo Diagrama de Venn, B = A ∪ (B ∩ Ā) e, portanto,
P (B) = P (A) + P (B ∩ Ā) por (c), mas
P (B ∩ Ā) ≥ 0 por (a), então,
P (B) ≥ P (A) ou P (A) ≤ P (B).
4. Se A e B são dois eventos quaisquer, então:
P (A ∪B) = P (A) + P (B)− P (A ∩B)
i) Se A e B são mutuamente exclusivos, P (A ∩ B) = 0 e decorre imediata-
mente pelo axioma (c)
P (A ∪B) = P (A) + P (B)
ii) Se A ∩B ̸= ∅
Pelo diagrama de Venn, A ∪B = A ∪ (Ā ∩B).
Logo, como A e Ā ∩B são mutuamente exclusivos
P (A ∪B) = P (A) + P (Ā ∩B), mas
-
40
B = (B ∩ A) ∪ (B ∩ Ā).
Logo, P (B) = P (B∩A)+P (B∩Ā), pois (B∩A) e (B∩Ā) são mutuamente
exclusivos. Então,
P (B ∩ Ā) = P (B)− P (B ∩ A) e, portanto,
P (A ∪B) = P (A) + P (B)− P (B ∩ A).
5. Se A e B são dois eventos quaisquer, então:
P (A ∩B) = P (Ā ∪ B̄) e P (A ∪B) = P (Ā ∩ B̄)
2.4 Espaços amostrais finitos equiprováveis
Quando a cada ponto amostral de um espaço amostral está associada a
mesma probabilidade, o espaço amostral chama-se equiprovável ou uniforme. Em
particular, se S contém n pontos, a probabilidade de cada ponto será igual a1
n.
Por outro lado, se um evento A contém r pontos, então,
P (A) = r1
n=
r
n.
Esse método de avaliar P (A) é frequentemente colocado da seguinte forma
P (A) =número de elementos de A
número de elementos do espaço amostral
ou
P (A) =número de casos favoráveis
número total de casos=
n(A)
n(S).
-
41
2.5 Probabilidade Condicional, Teorema do Pro-
duto, Eventos Independentes
Exemplo inicial: Uma urna contém duas bolas brancas e três bolas verdes.
Retiram-se duas bolas 1 a 1. Sejam os seguintes eventos:
A: a primeira bola é branca
B: a segunda bola é branca
Considere o experimento:
1) Com reposição da primeira bola
P (A) =2
5e P (B) =
P (B|A) = 2
5
P (B|Ā) = 25
2) Sem reposição da primeira bola
P (A) =2
5e P (B) =
P (B|A) = 1
4
P (B|Ā) = 24=
1
2
Observações:
i) P (B|A) é a probabilidade de B dado que ocorreu A.
ii) P (B|Ā) é a probabilidade de B dado que não ocorreu A.
iii) Note que no primeiro caso (com reposição) a ocorrência do evento B não
depende de que A tenha, ou não, ocorrido.
P (B|A) = P (B|Ā) = 25= P (B).
iv) Note que no segundo caso (sem reposição) a ocorrência do evento B
depende de que A tenha, ou não, ocorrido.
P (B|A) = 14̸= P (B|Ā) = 1
2.
-
42
Outro exemplo: Considere o experimento E e os eventos A e B
E: lançar um dado honesto
A: ocorrer face par
B: ocorrer face 2
Então, sem dúvida P (A) =1
2e P (B) =
1
6.
Suponha que o dado tenha sido lançado e que já tenha ocorrido face par.
Nessas condições, qual a probabilidade de ocorrer face 2, isto é, P (B|A) =?
O espaço amostral S′agora está reduzido de S para A.
S′= {2, 4, 6} = A
P (B|A) = n(B)n(S ′)
=n(B)
n(A)=
1
3.
Definição: Dados os eventos A e B de um espaço amostral S, define-se a
probabilidade condicional de B dado que ocorreu A, por
P (B|A) = P (A ∩B)P (A)
com P (A) ̸= 0, pois A já ocorreu.
P (B|A) =
n(A ∩B)n(S)
n(A)
n(S)
=n(A ∩B)n(A)
.
No exemplo, A = {2, 4, 6} e B = {2}, e, portanto,
A ∩B = {2} ⇒ m(A ∩B) = 1
m(A) = 3 ⇒ P (B|A) = 13.
Dessa definição decorre o
Teorema do Produto: “A probabilidade de ocorrência de dois eventos A
e B, do mesmo espaço amostral é igual ao produto da probabilidade de um deles
pela probabilidade condicional do outro, dado o primeiro.”
-
43
P (B|A) = P (A ∩B)P (A)
⇒ P (A ∩B) = P (A)P (B|A)
ou
P (A|B) = P (A ∩B)P (B)
⇒ P (A ∩B) = P (B)P (A|B).
No exemplo da urna, considere o evento
C: ambas as bolas são brancas.
Então,
P (C) = P (A ∩B) = P (A) · P (B|A)
Note que:
1) Com reposição da primeira bola
P (A ∩B) = P (B)P (B|A), em que P (B|A) = P (B)
P (A ∩B) = P (A) · P (B) = 25· 25=
4
25
2) Sem reposição da segunda bola
P (B|A) ̸= P (B)
P (A ∩B) = P (A) · P (B|A) = 25· 14=
1
10
Definição: Um evento A é independente de um evento B se a probabilidade
de A ocorrer não é influenciada pelo fato de B ter ocorrido, ou não, ou seja, se
P (A) = P (A|B).
É evidente que, se A é independente de B, B é independente de A. Assim
P (B) = P (B|A).
Considerando o teorema do produto, se A e B são independentes, então
P (A ∩B) = P (A) · P (B).
Observação: Dados k eventos A1, A2, ..., Ak diz-se que eles são indepen-
dentes se eles forem independentes 2 a 2, 3 a 3,..., k a k.
-
44
Exemplos:
1) Em um lote de 12 peças, 4 são defeituosas; 2 peças são retiradas uma
após a outra, sem reposição. Qual a probabilidade de que ambas sejam boas?
Solução:
A: a primeira peça é boa
B: a segunda peça é boa
P (A ∩B) = P (A) · P (B|A) = 812
7
11=
14
33
2) Em um certo colégio, 25% dos estudantes foram reprovados em
matemática, 15% em qúımica e 10% em matemática e qúımica ao mesmo tempo,
isto é,
P (A) =1
4, P (B) =
15
100=
3
20e P (A ∩B) = 1
10.
Um estudante é aleatoriamente escolhido.
a) Se ele foi reprovado em qúımica, qual é a probabilidade de ele ter sido
reprovado em matemática?
P (A|B) =
1
103
20
=2
3.
b) Se ele foi reprovado em matemática qual é a probabilidade de ele ter sido
reprovado em qúımica?
P (B|A) =
1
101
4
=4
10=
2
5.
c) Qual a probabilidade de ele ter sido reprovado em qúımica ou matemática?
P (A ∪B) = P (A) + P (B)− P (A ∩B) = 0, 25 + 0, 15− 0, 10 = 0, 30.
-
45
Um outro exemplo do Teorema da Soma
Lança-se um dado honesto. Qual a probabilidade de ocorrer
a) Face menor do que 5 ou face par?
A = {1, 2, 3, 4} ⇒ P (A) = 46
B = {2, 4, 6} ⇒ P (B) = 36
A ∪B = {1, 2, 3, 4, 6}
A ∩B = {2, 4} ⇒ P (A ∩B) = 26
P (A ∪B) = P (A) + P (B)− P (A ∩B) = 56
b) Face menor do que 5 ou face maior que 5?
A = {1, 2, 3, 4} ⇒ P (A) = 46
C = {6} ⇒ P (C) = 16
A ∪ C = {1, 2, 3, 4, 6}
A ∩ C = ∅ ⇒ P (A ∩ C) = 0
P (A ∪ C) = 46+
1
6=
5
6
c) Face par ou face ı́mpar?
B = {2, 4, 6} ⇒ P (B) = 36
D = {1, 3, 5} ⇒ P (D) = 36
B ∪D = S ⇒ P (S) = 1
B ∩D = ∅
P (B ∪D) = 1
-
46
2.6 Teorema de Bayes ou das probabilidades co-
nhecidas “a priori”
Definição: Sejam A1, A2, ..., An, n eventos mutuamente exclusivos, tais que
A1 ∪ A2 ∪ ... ∪ An = S
Sejam P (Ai) as probabilidades conhecidas dos vários eventos e B um evento
qualquer de S tal que conhecemos todas as probabilidades condicionais P (B|Ai).Então, para cada i, tem-se:
P (Ai|B) =P (Ai ∩B)
P (B)=
P (Ai ∩B)P (A1 ∩B) + ...+ P (An ∩B)
=P (Ai)P (B|Ai)
P (A1)P (B|A1) + ...+ P (An)P (B|An)
Exemplos
1) Em uma gaiola metálica 4% dos coelhos machos e 1% das fêmeas pesam
mais do que 1,8 kg. Por outro lado, 60% dos coelhos são fêmeas. Se um coelho
escolhido aleatoriamente pesa mais de 1,8 kg, qual a probabilidade de ser fêmea?
Solução:
Logo, podem-se considerar os eventos:
A1 : coelho fêmea
A2 : coelho macho
B : coelho pesa mais de 1,8 kg
-
47
e as probabilidades
P (A1) = 0, 6, P (B|A1) = 0, 01
P (A2) = 0, 4, P (B|A2) = 0, 04
P (A1|B) =0, 6 · 0, 01
0, 6 · 0, 01 + 0, 4 · 0, 04=
0, 006
0, 022=
3
11.
2) Uma cĺınica envia amostras de equinos para 3 laboratórios de análises A,
B e C nas seguintes proporções 0,2; 0,3 e 0,5, respectivamente. A probabilidade de
cada um dos laboratórios elaborar uma análise errada é de, respectivamente,1
2,1
3e
1
6.
Logo, podem-se considerar os eventos:
A1 : análise feita pelo laboratório A
A2 : análise feita pelo laboratório B
A3 : análise feita pelo laboratório C
B : realizar uma análise errada
e as probabilidades
P (A1) = 0, 2 P (B|A1) =1
2
P (A2) = 0, 3 P (B|A2) =1
3
P (A3) = 0, 5 P (B|A3) =1
6.
a) Uma análise resultou errada, qual a probabilidade de ter sido feita pelo
laboratório A? Pelo B? Pelo C?
P (A1|B) =0, 2 · 1
2
0, 2 · 12+ 0, 3 · 1
3+ 0, 5 · 1
6
=0, 11, 7
6
= 0, 3529
P (A2|B) = 0, 3529 P (A3|B) = 0, 2941
b) Qual a probabilidade de um exame executado resultar errado?
-
48
P (B) = P (A ∩B1) + P (A ∩B2) + P (A ∩B3)
= P (A1) · P (B|A1) + P (A2) · P (B|A2) + P (A3) · P (B|A3) =1, 7
6= 0, 2833.
3) Uma urna A contém 1 bola preta e 1 vermelha. Uma urna B contém 2
bolas pretas e 3 vermelhas. Uma bola é escolhida ao acaso na urna A e colocada na
urna B. Uma bola é, então, extráıda, ao acaso, da urna B. Qual a probablidade de
que a primeira bola seja vermelha, sabendo-se que a segunda foi preta?
Solução:
Sejam os eventos e as respectivas probabilidades
A1 : a bola de A para B foi preta ∴ P (A1) =1
2
A2 : a bola de A para B foi vermelha ∴ P (A2) =1
2
X: a bola tirada de B é preta
∴ P (X|A1) =3
6=
1
2e P (X|A2) =
2
6.
Logo,
P (A2|X) =
1
2· 26
1
2· 26+
1
2· 36
=2
5.
4) O caráter pescoço pelado das galinhas é dado por um fator genético
dominante Na. Um animal de constituição genética NaNa ou Nana, tem pescoço
pelado, mas terá pescoço coberto se tiver a constituição nana. Tendo um galo
de pescoço pelado sido cruzado com galinhas de pescoço coberto, foram obtidos 5
pintos, todos de pescoço pelado. Qual a probabilidade de que o galo seja puro para
o fator Na?
-
49
Solução:
Sejam os eventos:
A1 : galo puro NaNa
A2 : galo de constituição genética Nana
B : 5 pintos Nana
e as probabilidades
P (A1) =1
2, P (B|A1) = 1
P (A2) =1
2, P (B|A2) =
(1
2
)5.
Logo,
P (A1|B) =
1
2· 1
1
2· 1 + 1
2· 132
=32
33= 0, 97.
2.7 Exerćıcios
1) Considere o experimento E: Lançar um dado e uma moeda. Pede-se:
a) Construa o espaço amostral
b) Enumere os seguintes eventos
A = {coroa, marcado por número ı́mpar}
B = {cara, marcado por número ı́mpar}
C = {múltiplos de 3}
c) Expresse os eventos
I) B
II) A ou B ocorrerem
III) B e C ocorrerem
IV) A∪B
d) Quais dos eventos A, B e C são mutuamente exclusivos?
-
50
2) Determine a probabilidade de:
a) Sair um número par no lançamento de um dado não-viciado.
b) Sair um rei ao se extrair uma carta de um baralho.
c) Sair soma 5 no lançamento de dois dados.
3) Um grupo de 15 elementos apresenta a seguinte composição:
Homens Mulheres
Menores 5 3
Adultos 5 2
Um elemento é escolhido ao acaso. Pergunta-se:
a) Qual a probabilidade de ser homem?
b) Qual a probabilidade de ser adulto?
c) Qual a probabilidade de ser menor e mulher?
d) Sabendo-se que o elemento escolhido é adulto, qual a probabilidade de ser
homem?
e) Dado que a escolha é mulher, qual a probabilidade de ser menor?
4) Considere que existam numa população animais de genótipos dos tipos
BB, Bb e bb, sendo os indiv́ıduos BB e Bb pretos e os do tipo bb brancos. As
probabilidades dos 6 tipos de acasalamento estão resumidas na tabela a seguir:
BB Bb bb
BB4
25
5
25
6
25
Bb -3
25
4
25
bb - -3
25
-
51
Dado que um descendente é branco, quais as probabilidades dos diversos
cruzamentos?
5) Denomina-se “screening program” a avaliação total de uma população
sobre determinada doença. Para se ter essa avaliação, cada indiv́ıduo é submetido
ao mesmo teste cĺınico. Em um destes programas foram apurados os resultados que
se seguem:
Doença Positivo (A) Negativo (B) Total
Presente (B) 950 50 1000
Ausente (B) 10 990 1000
Total 960 1040 2000
Calcular as probabilidades condicionais apropriadas e responder se este teste
cĺınico é apropriado e se o programa deve ou não ser executado.
Informa-se que:
a) P (A|B): quanto maior, mais senśıvel será o teste
b) P (A|B): quanto menor, mais espećıfico será o teste
c) P (B|A): falsos positivos
d) P (B|A): falsos negativos
Observação: Por (a) e (b) ter-se-á a resposta à primeira pergunta e por (c)
e (d) a resposta à segunda pergunta.
Num laboratório, após um experimento com reação em cadeia de polimerase
(PCR), foram obtidos dez tubos de ensaio, numerados de 1 a 10. Sabe-se que em
três deles a reação não ocorreu como o esperado.
1) Considerando o experimento com reposição, e os evendos:
A = o primeiro tubo contém reação que não ocorreu como o esperado
B = o segundo tubo contém reação que não ocorreu como o esperado
-
52
1.1. A e B são independentes?
1.2. A e B são mutuamente exclusivos?
1.2. Determine P (A), P (B), P (A∩B) e P (A
∪B)
2) Refaça o item (1) considerando o experimento com reposição.
-
Caṕıtulo 3
Variáveis Aleatórias3.1 Definição
Define-se uma variável aleatória como uma função X, que associa a cada ele-
mento s ∈ S um número real X(s), ou seja, associa valores numéricos aos resultados
de um experimento.
Exemplo 1:
E: lançamento de duas moedas
X: números de caras obtidos nas duas moedas
S = {(c, c); (c, k); (k, c); (k, k)}
X = {0, 1, 2}
53
-
54
Assim, uma variável aleatória tem domı́nio em S e contradomı́nio em ℜ.
Uma variável aleatória pode ser: discreta ou cont́ınua. Será discreta se o número
posśıvel de valores de X (seu contradomı́nio) for finito ou infinito numerável. Será
cont́ınua se o seu contradomı́nio for um intervalo ou uma coleção de intervalos. No
exemplo, X é uma variável discreta.
3.2 Variáveis Aleatórias Discretas
3.2.1 Função de Probabilidade
A probabilidade de que a variável aleatória X assuma o valor x, é a função
de probabilidade de X representada por P (X = x) ou simplesmente P (x). A função
P (X = x) determina a distribuição de probabilidades da variável aleatória e deve
satisfazer os axiomas:
a) 0 6 P (xi) 6 1b)∑
i P (xi) = 1
No exemplo 1, tem-se a distribuição de probabilidade de X:
X = x 0 1 2
P(X = x) 14
12
14
Graficamente
x
P(x)
0 1 2
1/41/2
Exemplo 2:
E2 : lançar dois dados e observar a soma dos números obtidos.
X = x 2 3 4 5 6 7 8 9 10 11 12
P(X = x) 136
236
336
436
536
636
536
436
336
236
136
-
55
Graficamente
x
P(x)
2 3 4 5 6 7 8 9 10 11 12
1/36
2/36
3/36
4/36
5/36
6/36
3.2.2 Função de Distribuição Acumulada
Define-se Função de Distribuição Acumulada da variável aleatória X, no
ponto x, como sendo a probabilidade de que X assuma um valor menor do que ou
igual a x, isto é,
F (x) = P (X 6 x)
Propriedades:
a) F (x) =∑
xi6x P (xi)
b) F (−∞) = 0
c) F (∞) = 1
d) P (a < X 6 b) = F (b)− F (a)e) P (a 6 X 6 b) = F (b)− F (a) + F (X = a)f) P (a < X < b) = F (b)− F (a)− F (X = b)
No exemplo 1:
X = x 0 1 2
P(X = x) 14
12
14
F(x) 14
341
Exemplo 3:
E3: lançar um dado e observar o número da face superior
X = x 1 2 3 4 5 6
P(X = x) 16
16
16
16
16
16
F(x) 16
26
36
46
56
66
-
56
x
F(x)
1 2
1/43/4
1
x
P(x)
1 2 3 4 5 6
1/6
x
F(x)
1 2 3 4 5 6
1/62/6
3/64/6
5/61
3.3 Variável Aleatória Cont́ınua
Função Densidade de Probabilidade
Seja X uma v.a. cont́ınua. A função densidade de probabilidade f(x) é uma
função que satisfaz às seguintes condições:
a) f(x) ≥ 0
b)∫Rf(x)dx = 1
Além disso,
P (a < X < b) =∫ baf(x)dx
Propriedades:
a) P (X = x0) =∫ x0x0
f(x)dx = 0
b)
P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b)
=
∫ ba
f(x)dx
-
57
Verifica-se que f(x), densidade de probabilidade, não é probabilidade.
Somente quando a função for integrada entre dois limites, ela produzirá uma
probabilidade que será a área sob a curva da função entre x = a e x = b, para a < b.
Exemplo 4
Seja X uma v.a.c. com função densidade de probabilidade (f.d.p)
f(x) =
2x se 0 < x < 10 para outros valoresf(x) é f.d.p., pois
a) f(x) ≥ 0
b)∫∞−∞ f(x)dx =
∫ 102xdx = [x2]10 = 1
Exemplo 5
Uma v.a. tem a seguinte função densidade de probabilidade
f(x) =
0 se x < 0
kx2 se 0 < x < 1
0 se x ≥ 1
Pede-se:
a) Determinar k
b) Fazer o gráfico de f(x)
c) Obter P (0 < X < 12)
Solução:
a)
k
∫ 10
x2dx = k
[x3
3
]10
=k
3= 1 ⇒ k = 3
∴ f(x) = 3x2 para 0 < x < 1
-
58
b)
c)
P (0 < X <1
2) = 3
∫ 12
0
x2dx = 3
[x3
3
]1/20
=
[1
2
]3=
1
8
3.4 Parâmetros
De uma maneira geral, as distribuições teóricas podem ser caracterizadas
por parâmetros análogos àqueles da estat́ıstica descritiva.
3.4.1 Esperança Matemática, Valor Esperado ou Média de
uma variável aleatória
Define-se esperança matemática de uma v.a.d. X, como
µx = E(X) = ΣxiP (xi)
e de uma v.a.c., como
µx = E(X) =
∫ ∞−∞
xf(x)dx.
Exemplo 6:
E1: lançar duas moedas
X: número de caras
xi 0 1 2
P (xi)1
4
1
2
1
4
µx = 0 ·1
4+ 1 · 1
2+ 2 · 1
4= 1
Espera-se que para um número grande de jogadas ocorra em média uma
cara.
Exemplo 7:
E1: lançar dois dados
-
59
X: soma dos números mostrados na face de cima
xi 2 3 4 5 6 7 8 9 10 11 12
P (xi)1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
µx =1
36[2 + 6 + 12 + 20 + 30 + 42 + 40 + 36 + 30 + 22 + 12] =
252
36= 7
Exemplo 8:
f(x) =
2x, para 0 < x < 10, para outros valoresµx = E(X) =
∫ 102x2dx =
[2x3
3
]10
=2
3
Exemplo 9:
f(x) =
3x2, para 0 < x < 10, para outros valoresµx = E(X) =
∫ 103x3dx =
[3x4
4
]10
=3
4
Propriedades da Média (Esperança):
1. A média de uma constante é a própria constante.
E(K) =∑i
KP (xi) = K∑
P (xi) = K
E(K) =
∫ ∞−∞
Kf(x)dx = K
∫ ∞−∞
f(x)dx = K
2. Multiplicando-se uma v.a. X por uma constante, sua média fica multipli-
cada por essa constante.
E(KX) =∑
KxiP (xi) = K∑
xiP (xi) = KE(X)
E(KX) =
∫ ∞−∞
Kxf(x)dx = K
∫ ∞−∞
xf(x)dx = KE(X)
-
60
3. E(X ± Y ) = E(X)± E(Y )
4. E(X ±K) = E(X)±K
5. E(X − µx) = E(X)− µx = 0
6. E(XY ) = E(X) · E(Y ) se X e Y forem independentes
3.4.2 Variância
Define-se variância de uma v.a., como:
σ2x = Var(X) = E[X − E(X)]2
logo
σ2x = Var(X) = Σ(xi − µx)2P (xi) se X v.a.d.
e
σ2x = Var(X) =
∫ ∞−∞
(x− µx)2f(x)dx se X v.a.c.
Exemplo 10:
E: Lançar duas moedas
X: Número de caras
E(X) = 1
Var(X) = (0− 1)2 · 14+ (1− 1)2 · 1
2+ (2− 1)2 · 1
4= 1
2
Exemplo 11:
f(x) =
2x, para 0 < x < 10, para outros valores
-
61
E(X) = 23
Var(X) = 2
∫ 10
(x− 2
3
)2xdx = 2
∫ 10
(x2 − 4
3x+
4
9
)xdx = 2
∫ 10
(x3 − 4
3x2 +
4
9x
)dx
= 2
(x4
4− 4
3· x
3
3+
4
9· x
2
2
)10
= 2
(1
4− 4
9+
4
18
)= 2
(9− 16 + 8
36
)=
1
18
Propriedades da Variância:
1) A variância de uma constante é zero.
Var(K) = E{(K − E(K))2} = E[K −K] = 0
2) Multiplicando-se uma v.a por uma constante, sua variância fica multipli-
cada pelo quadrado da constante.
Var(KX) = E{[KX − E(KX)]2} = K2E{X − E(X)}2 = K2Var(X)
3) Somando-se ou subtraindo-se uma constante K a uma v.a., sua variância
não se altera.
Var(X ±K) = E{[(X ±K)− E(X ±K)]2} = E{[X ±K − E(X)±K]2}
= E{[X − E(X)]2} = Var(X)
4) Var(X) = E{[X − E(X)]2} = E{X2 − 2XE(X) + [E(X)]2}
= E(X2)− 2[E(X)]2 + [E(X)]2 = E(X2)− [E(X)]2
Obs.: Em muitos casos essa propriedade facilita grandemente o cálculo da
variância.
Exerćıcios
-
62
1) Seja X uma v.a.c. com f.d.p
f(x) =
k(x+ 3), para 1 ≤ x ≤ 80, para outros valores de xPede-se:
a) Determinar k
b) P (2 < X < 6)
c) P (X ≤ 3)
d) P (X ≥ 3)
e) E(X)
f) E(X2)
g) σ2x
2) Considere a distribuição de probabilidade da v.a.d. X, em que X= número
de pontos obtidos quando se lança um dado uma só vez. Pede-se:
a) Gráfico da função de probabilidade
b) E(X) = µx
c) E(X2)
d) σ2x = E(X2)− [E(X)]2
3) Sejam as variáveis aleatórias discretas:
X = número de tubos cuja reação não ocorreu como o esperado na amostra
escolhida
Y = número de tubos cuja reação ocorreu com sucesso na amostra escolhida
3.1. Determine as distribuições de probabilidade de X e Y, considerando o experi-
mento com reposição e, em seguida, sem reposição.
3.2. Compare E[X] nos casos com e sem reposição.
3.3. Idem (3.2) para E[Y ], Var[X] e Var[Y ].
-
63
3.4. Compare E[X] + E[Y ] com o tamanho da amostra retirada. (n = 2)
4) Sabendo-se que sob certas condições, o ciclo vital da praga A, que atua
na cana-de-açúcar, pode ser descrito por:
f(x) =
6(x− x2), se x ∈ [0; 1]0, caso contrário4.1. Verifique se f(x) pode ser estudada como uma função densidade de probabili-
dades.
4.2. Esboce um gráfico para f(x).
4.3. Determine E[X] e Var[X].
4.4. Determine e identifique no gráfico da função: a) P (0 < x < 1/4)
b) P (1/4 < x < 3/4)
c) P (x > 3/4).
-
Caṕıtulo 4
Distribuições de probabilidade
4.1 Definição
Entre as variáveis aleatórias existem algumas que se destacam por sua im-
portância quanto à representatividade de grande parte de fenômenos biológicos.
Assim, por exemplo, sabe-se que variáveis como peso, altura, idade, etc têm
distribuição normal de probabilidade enquanto que o número de sementes germi-
nadas pode ter distribuição binomial; o número de insetos presos em uma armadilha
luminosa e o número de reações nocivas motivadas pela injeção de certo soro podem
ter a distribuição de Poisson.
São estudadas, a seguir, algumas distribuições de v.a. mais utilizadas. Den-
tre as v.a.d., serão vistas:
- Distribuição de Bernoulli
- Distribuição Binomial
- Distribuição Poisson
Dentre as de v.a.c, podem ser consideradas:
- Distribuição Normal
- Distribuição de χ2-quadrado
- Distribuição t de Student
- Distribuição F de Snedecor
65
-
66
4.2 Distribuição de Bernoulli
4.2.1 Definição
Um experimento de Bernoulli é aquele ao qual podem ser associados apenas
dois resultados: sucesso (se acontecer o evento de interesse) ou fracasso (se não
acontecer o evento de interesse). Tem-se, então, uma v.a.d. X que assume valor 1
caso ocorra o evento A (sucesso) e o valor 0 caso não ocorra (insucesso ou fracasso),
com probabilidades, respectivamente, p = P (X = 1) e q = 1 − p = P (X = 0), isto
é, a distribuição de probabilidade de X é
X = x x1 = 0 x2 = 1
P (X = x) q = 1− p p
sendo que q + p = 1− p− p = 1.
Exemplos:
E1: Planta-se uma semente de feijão
A: a semente germina com probabilidade p
Ā: a semente não germina com probabilidade 1− p
E2: Lança-se um dado honesto e observa-se o valor da face voltada para
cima
A: virar face 3, x2 = 1 e P(X = x2) =1
6
Ā: virar face diferente de 3, x1 = 0 e P(X = x1) =5
6.
Observa-se que no experimento E1 a probabilidade “p” não é conhecida “a
priori”. Em alguns casos desse tipo, obtêm-se informações sobre estimativas de “p”
em revisões de bibliografia ou estima-se “p” experimentalmente.
4.2.2 Média, Variância e Desvio-Padrão
São obtidos por
-
67
µx = µ = E(X) = Σ2i=1xiP (xi) = 0 · q + 1 · p = p
σ2 = Var(X) = E[X − E(X)]2 = E(X2)− [E(X)]2
E(X2) = Σ2i=1x2iP (xi) = 0
2 · q + 12 · p = p
σ2 = p− p2 = p(1− p) = p · q
σx =√
σ2x =√pq.
Em E2 tem-se
µx = 0.5
6+ 1.
1
6=
1
6
σ2x =
(0− 1
6
)2.5
6+
(1− 1
6
)2.1
6=
1
6
(1− 1
6
)2=
5
36
σx =
√5
36=
√5
6
4.3 Distribuição Binomial
4.3.1 Definição
Seja uma sequência de n ensaios independentes e repetidos de Bernoulli.
Então se a v.a. X representa o número de sucessos nesses n ensaios, diz-se que X
tem distribuição binomial de probabilidades com parâmetros n e p e com função de
probabilidade dada por:
P (X = x) = Cxnpxqn−x
Vê-se que P (X = x) é f.d.p., pois
a) P (X = x) ≥ 0,∀x
b)∑
P (X = x) =n∑
x=0
Cxnpxqn−x = C0np
0qn + C1np1qn−1 + . . .+ Cnnp
nq0
= (p+ q)n = 1
Exemplo:
Um recipiente contém um grande número de sementes de feijão para as
quais o fornecedor garante um poder de germinação de 0,8. Se 5 dessas sementes são
plantadas, determine:
-
68
a) A distribuição de probabilidades para a variável
X: números de sementes germinadas.
Distribuição de Probabilidade de X
X = xi P (X = xi) P (X = xi)
0 0,00032 P (0) = C50 (0, 8)0(0, 2)5
1 0,00640 P (1) = C51 (0, 8)1(0, 2)4
2 0,05120 P (2) = C52 (0, 8)2(0, 2)3
3 0,20480 P (3) = C53 (0, 8)3(0, 2)2
4 0,40960 P (4) = C54 (0, 8)4(0, 2)1
5 0,32768 P (5) = C55 (0, 8)5(0, 2)0
b) A probabilidade de que germinem no máximo 4 sementes.
P [X ≤ 4] = P (0) + P (1) + P (2) + P (3) + P (4) = 0, 67232 ou
P [X ≤ 4] = 1− P (X = 5) = 1− 0, 32768 = 0, 67232.
4.3.2 Média, Variância e Desvio-Padrão
Como X v.a.d. binomial nada mais é do que a soma de n variáveis indepen-
dentes do tipo Bernoulli, tem-se:
µx = µ = E(X) = ΣxP (X = x) = np
σ2 = E[X − E(X)]2 = E(X2)− [E(X)]2 = npq
σx =√
σ2x =√npq
No exemplo dado
µx = 5 · 0, 8 = 4 germinações
σ2x = 5 · 0, 8 · 0, 2 = 0, 8 germinações ao quadrado
σx =√0, 8 = 0, 894 germinações.
-
69
No mesmo exemplo, ainda suponha que o agricultor precisa obter 100 mudas.
Qual o número mı́nimo de sementes que ele deve plantar? Qual a variabilidade do
número de sementes germinadas?
µ = np ⇒ 100 = n · 0, 8 ⇒ n = 125
σ2x = npq = 125 · 0, 8 · 0, 2 = 20
σx = 4, 47 ≃ 5
Exerćıcios
1) Certo tratamento quando aplicado a bovinos com certa enfermidade cura
60% dos casos. Tendo dois bovinos sob esse tratamento, qual a probabilidade:
a) de que os dois morram
b) de que os dois sejam curados
c) de que um seja curado e o outro não.
Qual o número médio de curas e qual sua variabilidade?
Distribuição de Probabilidade de X
X = xi 0 1 2
P (X = xi) 0,16 0,48 0,36
em que X: número de sobreviventes, p = 0, 6, q = 1− 0, 6 = 0, 4 e n = 2.
Solução:
a) P (X = 0) = C02 (0, 6)0(0, 4)2 = 0, 16
b) P (X = 2) = C22 (0, 6)2(0, 4)1 = 0, 48
c) P (X = 1) = C12 (0, 6)1(0, 4)1 = 0, 36
µ = np = 2 · 0, 6 = 1, 2 curas
σ2 = npq = 2 · 0, 6 · 0, 4 = 0, 48 curas2
σ =√0, 48 = 0, 6928 curas.
-
70
2) Certa doença dada em pintos tem uma fatalidade de 30%. Em 6 casos
dessa doença, estabeleça a distribuição de probabilidade da v.a
X: número de sobreviventes
Baseado nessa distribuição, calcule:
a) a probabilidade de que todos sobrevivam
b) a probabilidade de que nenhum sobreviva
c) a probabilidade de que os dois sobrevivam
d) a probabilidade de que pelo menos dois sobrevivam
e) a probabilidade de que no mı́nimo quatro morram
f) o número médio de sobreviventes
g) a variância e o desvio-padrão do número de sobreviventes.
h) Se um produtor de frangos quer obter no final de um determinado peŕıodo
150 frangos, baseado na incidência dessa doença, qual o número mı́nimo de pintos
que ele deve comprar? Qual a variabilidade desse número?
Distribuição de Probabilidade de X
X = xi 0 1 2 3 4 5 6
P (X = xi) 0,00073 0,01021 0,05954 0,18522 0,32414 0,30253 0,11764
p = 0, 7 q = 0, 3 n = 6
Solução:
a) P (X = 6) = 0, 11764
b) P (X = 0) = 0, 00073
c) P (X = 2) = 0, 05954
d) P (X ≥ 2) = 1− P (X = 0)− P (X = 1) = 0, 98906
e) P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) = 0, 07048
f) µ = np = 6 · 0, 7 = 4, 2
g) σ2 = npq = 6 · 0, 7 · 0, 3 = 1, 26 σ =√1, 26 = 1, 12
h) 150 = n · 0, 7 ⇒ n = 214 frangos
σ2 = npq = 214 · 0, 7 · 0, 3 = 45 ⇒ σ = 6, 7.
-
71
4.4 Distribuição de Poisson
4.4.1 Definição
Existem experimentos, nos quais o número de sucessos é conhecido ou facil-
mente determinável mas o número de insucessos não pode ser determinado. É o que
acontece quando se tem interesse no número de insetos presos em uma armadilha
luminosa ou no número de ácaros que atacam determinada cultura ou no número de
brotos por explante.
SeX é a variável aleatória discreta tal que sua distribuição de probabilidades
é do tipo
P (X = x) =λxe−λ
x!, x = 0, 1, 2, . . . , λ > 0
então, X tem distribuição de Poisson com parâmetro λ (λ é o número médio de
sucessos). Verifica-se que P (X = x) representa uma leǵıtima distribuição de proba-
bilidade, pois:
a) P (X = x) ≥ 0, ∀x
b)∑∞
x=0
λxe−λ
x!= e−λ
∞∑x=0
λx
x!= e−λ
[1+
1
1!λ+
1
2!λ2+
1
3!λ3+. . .
]= e−λeλ = 1.
4.4.2 Média, Variância e Desvio-padrão
São obtidos por:
µX = E(X) =∞∑x=0
xλxe−λ
x!= e−λ
∞∑x=1
xλx−1λ
x(x− 1)!= e−λ
∞∑x=1
λx−1
(x− 1)!.λ = e−λ.eλ.λ = λ
σ2X = E(X2)− [E(X)]2
E(X2) =∞∑x=0
x2e−λλx
x!=
∞∑x=1
x2e−λλx
x!=
∞∑x=1
xe−λλx
(x− 1)!=
∞∑x=1
(x− 1 + 1) e−λλx
(x− 1)!
=∞∑x=1
e−λλx
(x− 1)!+
∞∑x=1
(x− 1) e−λλx
(x− 1)!= λ+
∞∑x=2
xe−λλx
(x− 2)!= λ+ λ2
σ2X = λ+ λ2 − λ2 = λ
σX =√
σ2X =√λ.
-
72
Exemplo:
Em um determinado hospital veterinário existem em média 3 diagnósticos
de cães raivosos. Qual a probabilidade de que ocorram 2 diagnósticos no próximo
mês?
P (X = 2) =32.e−3
2!= 0, 2240.
4.4.3 Relação entre as distribuições Binomial e de Poisson
Na distribuição Binomial se n é grande, mas a probabilidade p de ocorrência
de um evento é proxima de zero, de modo que q = 1− p, é próximo de 1, o evento se
diz um evento raro. Na prática, considera-se como raro um evento em que o número
de provas é no mı́nimo 50 e np é menor do que 5. Em tais casos, a distribuição
binomial é muito bem aproximada pela distribuição de Poisson com λ = np. Tal
resultado já era de se esperar pois, fazendo λ = npn tem-se pn =λ
ne se λ é pequeno
e n tende para infinito, então, p → 0 e q → 1.
Considerando-se a função de distribuição de probabilidade da variável
aleatória discreta X binomial
P (X = x) = Cxnpxqn−x =
n!
x!(n− x)!px(1− p)n−x
=n(n− 1)(n− 2) . . . (n− x+ 1)
x!px(1− p)n−x
e, fazendo-se p =λ
n, tem-se:
P (X = x) =n(n− 1)(n− 2) . . . (n− x+ 1)
x!
(λ
n
)x(1− λ
n
)n−x=
n(n− 1)(n− 2) . . . (n− x+ 1)nx
λx
x!
(1− λ
n
)n(1− λ
n
)−x= 1
(1− 1
n
)(1− 2
n
). . .
(1− x− 1
n
)λx
x!
(1− λ
n
)n(1− λ
n
)−xQuando n → ∞, enquanto x e λ permanecem constantes, tem-se:
limn→∞ 1
(1− 1
n
)(1− 2
n
). . .
(1− x− 1
n
)= 1,
-
73
limn→∞
(1− λ
x
)n= 1 e limn→∞
(1− λ
n
)n= e−λ.
Portanto, sob as condições limites dadas, tem-se:
B(X;n, p) ⇒ e−λλx
x!,
para X = 0, 1, 2, . . ., isto é,
limn→∞
P (x = x) =e−λλx
x!
que é a função densidade de probabilidade de uma variável aleatória discreta com
distribuição de Poisson.
Exemplo:
A probabilidade de um indiv́ıduo sofrer uma reação nociva resultante da
aplicação de uma determinada vacina é 0,001. Determinar a probabilidade de entre
2000 indiv́ıduos:
a)Nenhum sofrer reação
b) Mais do que 2 sofrerem a reação
Solução
a) Por Poisson
λ = np = 2000.0, 001 = 2
P (X = 0) = e−220
0!=
1
e2= 0, 1353
Pela Binomial
P (X = 0) = C02000(0, 001)0(0.999)2000 = 0, 1353
b) Por Poisson
P (X > 2) = 1− e−220
0!− e−22
1
1!− e−22
2
2!
= 1− 0, 1353− 0, 2706 = 0, 3235
Pela Binomial
-
74
P (X = 1) = C12000(0, 001)1(0.999)1999 = 0, 2707
P (X = 2) = C22000(0, 001)1(0.999)1998 = 0, 2708
P (X > 2) = 1− 0, 1352− 0, 2707− 0, 2708 = 0, 3233.
4.5 Distribuição Normal
4.5.1 Introdução
A distribuição normal tem sido considerada como a mais importante das
distribuições de variável aleatória cont́ınua e, é básica para o desenvolvimento de
testes estat́ısticos tais como, o teste “t”, o teste “F” e o teste “χ2” e outros.
Dentro do campo de Ciências são consideradas variáveis normalmente dis-
tribúıdas as variáveis: altura, peso, idade, produção, total de leite, quantidade de
ração consumida, diâmetro à altura do peito, biomassa, etc.
A equação matemática da curva normal foi desenvolvida por De Moivre em
1773 e, posteriormente, Gauss (1775-1855) também obteve a equação de um estudo
de erros em medidas repetidas da mesma variável, e devido a ele, ela é chamada
também distribuição de Gauss.
4.5.2 Definição
Uma variável aleatória cont́ınua X tem distribuição normal se sua função
densidade de probabilidade for dada por:
f(x) =1
σ√2π
e−(x− µ)2
2σ2 ,−∞ < x < ∞
em que µ e σ são parâmetros que devem satisfazer às condições −∞ < x < ∞ e
σ > 0. Além disso, será provado que µ e σ correspondem, respectivamente, à média
e ao desvio-padrão da distribuição, e então, representa-se X ∼ N(µ, σ2).
Como f(x) é uma função densidade de probabilidade, então,
a)f(x) ≥ 0, ∀x, pois 1σ√2π
> 0 e e−(x− µ)2
2σ2 > 0
-
75
b)∫∞−∞ f(x)dx = 1
Prova: ∫ ∞−∞
f(x)dx =1
σ√2π
∫ ∞−∞
e−(x− µ)2
2σ2 dx,
fazendo-sex− µσ
= z ⇒ dx = σdz, quando x → ∞ ⇒ z → ∞ e x → −∞ ⇒ z →
−∞.
Logo,
∫ ∞−∞
f(x)dx =1
σ√2π
∫ ∞−∞
e−z2
2 σdz =1√2π
∫ ∞−∞
e−z2
2 dz
e como g(z) = e−z2
2 é uma função par, pois g(z) = g(−z),
tem-se: ∫ ∞−∞
f(x)dx =1√2π
2
∫ ∞0
e−z2
2 dz.
Fazendo-sez2
2= t ⇒ 2zdz
2= dt ⇒ dz = t
−1/2√2dt, quando z = 0 ⇒ t = 0 e
z → ∞ ⇒ t → ∞.
Logo,∫ ∞−∞
f(x)dx =1√2π
2√2
∫ ∞0
t−1/2e−tdt =1√π
∫ ∞0
t−1/2e−tdt =1√πΓ(
1
2) =
1√π
√π = 1
pois Γ(α+ 1) =∫∞0
xαe−xdx. Portanto,∫ ∞−∞
f(x)dx = 1.
4.5.3 Parâmetros: média, variância e desvio-padrão
Se X é uma v.a.c. com distribuição normal de parâmetros µ e σ, isto é,
X ∼ N(µ, σ2)