· 2010. 10. 15. · Cap tulo 1 Estat stica Descritiva 1.1 Introdu˘c~ao 1.1.1 Estat stica A...

Caṕıtulo 1

Estat́ıstica Descritiva

1.1 Introdução

1.1.1 Estat́ıstica

A palavra estat́ıstica deriva do latim ”status”e tem dois significados dis-

tintos. Frequentemente usado no plural, o termo estat́ıstica designa todo conjunto

coerente de dados numéricos relativos a um grupo de indiv́ıduos. Assim, por ex-

emplo, pode-se falar em estat́ısticas de produção industrial ou agŕıcola (quantidades

produzidas, custos de produção, preços de venda, etc), de estat́ısticas demográficas

(natalidade, mortalidade), de estat́ısticas de desemprego, de acidentes de estrada,

etc.

Por outro lado, a palavra estat́ıstica designa também, o conjunto de métodos

que permitem reunir e analisar dados de observação.

De acordo com Fisher -“A Estat́ıstica é a matemática aplicada a dados

de observação”. Ela tem por objetivo o uso de métodos cient́ıficos para coleta,

organização, resumo, apresentação e análise de dados, bem como a obtenção de

conclusões válidas a serem utilizadas nas tomadas de decisões.

Assim todo estudo estat́ıstico pode ser decomposto em pelo menos duas

fases:

- a reunião ou coleta dos dados estat́ısticos

- sua análise e interpretação.

A coleta de dados pode ser realizada de duas formas:

1

2

- por simples observação dos fenômenos em que se tem interesse - estudo

observacional e

- por experimentação, ou seja, provocando-se voluntariamente a aparição

de certos fenômenos controlados.

A análise estat́ıstica pode ser decomposta em duas etapas, uma dedutiva ou

descritiva e a outra indutiva. A Estat́ıstica Descritiva tem por objetivo resumir e

apresentar os dados observados sob a forma de: tabelas (descrição tabular), gráficos

(descrição gráfica) e parâmetros e suas estimativas (descrição paramétrica).

A Inferência Estat́ıstica permite estender ou generalizar dentro de certas

condições as conclusões obtidas. Frequentemente, a observação ou a experimentação

é relativa a apenas uma fração dos indiv́ıduos em que se tem interesse. As conclusões

relativas a essa fração, chamada amostra, devem, então, ser estendidas tanto quanto

posśıvel ao conjunto de indiv́ıduos que formam a “população”. Essa fase indutiva

comporta evidentemente certos riscos de erro, que podem ser medidos, usando-se a

teoria das probabilidades. Quando em um estudo trabalha-se com amostras, tem-se

uma pesquisa por amostragem. Quando se utiliza a população toda tem-se o censo.

As diferentes etapas de todo estudo estat́ıstico não são, entretanto, independentes.

1.1.2 Variáveis

Variável é uma medida ou classificação obtida de cada elemento da população

ou amostra. A representação de dados torna-se mais fácil por meio da utilização

de variáveis. É importante notar que a variável aleatória é representada por letra

maiúscula e o valor observado pela mesma letra, porém minúscula. Assim, por

exemplo, os dados apresentados na Tabela 1.1, a variável X refere-se ao peso de 24

animais do Cerrado brasileiro, em kg. Tem-se ainda que xi, i = 1, ..., 24, representa

o peso observado de um determinado animal i, por exemplo,

x1 = 250, x2 = 20, x3 = 10, ..., x24 = 60.

Outro exemplo pode ser

3

Tabela 1.1: Peso de 24 animais do Cerrado brasileiro, em kg.

Animal X Animal X Animal X

Anta 250 Gato-do-mato 3 Cateto 20

Ariranha 20 Gato-maracajá 6 Preá 1

Bugio-preto 10 Gato-mourisco 10 Quati 5

Cachorro-do-mato 8 Jaguatirica 15 Raposa-do-campo 8

Capivara 70 Lobo-guará 20 Suçuarana 60

Cervo 100 Lontra 10 Tamanduá-bandeira 30

Cotia 3 Onça-pintada 100 Tatu-bola 3

Gambá 1 Paca 8 Veado-do-campo 60

Y : tipos de famı́lias de algumas espécies de plantas encontradas no Parque

Nacional da Serra da Canastra

yj: Asteraceae, Bignoniaceae, Melastomataceae, j = 1, 2, 3 (famı́lias).

Os tipos de variáveis mais comumente utilizadas na descrição de dados são:

Variáveis

Quantitativas

discretascont́ınuasQualitativas

nominaisordinaisa) Variáveis quantitativas representam quantidades. Podem ser de natureza

discreta ou cont́ınua.

São de natureza discreta as variáveis que podem assumir apenas valores den-

tro do conjunto dos números naturais. Exemplo: número de frutos por ramo, número

de parasitas por hospedeiro, número de ovos por ninho, número de sementes germi-

nadas, número de insetos coletados em armadilhas, número de brotos em estudos de

cultura de tecidos, etc.

4

São de natureza cont́ınua as variáveis que podem assumir qualquer valor em

um intervalo. Exemplo: alturas de plantas, pesos de animais, velocidade de animais,

concentração de uma solução, biomassa de plantas ou animais, etc.

b) Variáveis qualitativas descrevem categorias, qualidades. São relativas a

dados categorizados. Exemplo: raça, sexo, cor da pele, táxon, grau de infecção, etc.

É posśıvel, às vezes, estabelecer uma correspondência dessas variáveis com

variáveis quantitativas discretas. É o caso, por exemplo, de:

sexo: masculino, feminino ⇒ xi = 0, 1, i = 1, 2

condição: morto, vivo ⇒ xi = 0, 1, i = 1, 2

graus de infecção: ⇒ xi = 0, 1, 2, 3, i = 1, 2, 3, 4.

1.1.3 Somatório

É uma notação bastante utilizada dentro da estat́ıstica. Considere, por

exemplo, a variável aleatória X, que representa o número de espécimes de zarro-

americano (Aythya affinis) coletados ao longo dos anos de 1965 a 1980, conforme a

Tabela 1.2.

Tabela 1.2: Número de espécimes de zarro-americano (Aythya affinis) coletados ao

longo dos anos de 1965 a 1980.

Ano 1965 1966 1967 1968 1969 1970 1971 1972

Números 19 28 4 13 28 36 17 30

Ano 1973 1974 1975 1976 1977 1978 1979 1980

Números 21 32 34 16 22 16 23 31

Tem-se, então, que x1 = 19, x2 = 28, ..., x16 = 31. Logo, o total de zarros-

americanos coletados de 1965 a 1980 é dado por

T = x1 + x2 + ...+ x16 =16∑i=1

xi = x. = 370

5

Figura 1.1: Zarro americano.

Podem ser obtidas, ainda, a soma dos quadrados e o quadrado da soma

16∑i=1

x2i = x21 + x

22 + ...+ x

216 = 9706

e (16∑i=1

xi

)2= (x1 + x2 + ...+ x16)

2 = 3702 = 136900.

Outro exemplo, seria o da Tabela 1.3 que mostra o número médio de ca-

marões-espinho coletados na báıa de Ubatuba de acordo com o local no qual o tran-

secto foi feito e com o estágio reprodutivo do camarão.

Tabela 1.3: Números médios de camarões-espinho coletados na báıa de Ubatuba

de acordo com o local no qual o transecto foi feito e com o estágio reprodutivo do

camarão.

Transecto

Estágio j = 1 j = 2 j = 3 j = 4 j = 5 j = 6 Totais

Ov́ıgero y11 = 4,0 y12 = 7,0 y13 = 4,5 y14 = 1,0 y15 = 5,5 y16 = 3,5 y1. = 25,5

Não-ov́ıgero y21 = 3,0 y22 = 6,5 y23 = 5,0 y24 = 2,0 y25 = 5,0 y26 = 3,5 y2. = 25,0

Totais y.1 = 7,0 y.2 = 13,5 y.3 = 9,5 y.4 = 3,0 y.5 = 10,5 y.6 = 7,0 y.. = 50,5

6

Pode-se representar cada valor observado por yij, isto é, yij é o número

de camarões-espinho referente ao i-ésimo estágio reprodutivo e j-ésimo transecto.

Assim, tem-se, por exemplo

y.. =2∑

i=1

6∑j=1

yij = y11 + · · ·+ y16 + y21 + · · ·+ y26 = 50, 5

y1. =6∑

j=1

y1j = y11 + · · ·+ y16 = 25, 5

y.2 =2∑

i=1

yi2 = y12 + y22 = 13, 5

Propriedades do somatório:

a)n∑

i=1

k = nk

b)n∑

i=1

kxi = kn∑

i=1

xi

c)n∑

i=1

(xi ± yi) =n∑

i=1

xi ±n∑

i=1

yi

d)n∑

i=1

(xi ± k) =n∑

i=1

xi ± nk.

1.2 Estat́ıstica Descritiva

Tem por objetivo resumir e apresentar dados de observação (população ou

amostra), de modo a simplificar sua interpretação por meio de descrição tabular,

gráfica ou paramétrica.

1.2.1 Variável Qualitativa – Descrição Tabular e Gráfica

Primeiro caso: Uma só variável

Seja o exemplo que se segue. Os alunos da sexta turma de Ciências Biológicas

da ESALQ/USP observaram durante dois dias o número de visitas de polinizadores

a um espécime de Heliconia rostrata. Obtiveram os resultados: das 8h às 10h, 10h

7

às 12h, 12h às 14h e das 14h às 16h, respectivamente, 17, 28, 18 e 19 polinizadores

visitaram a planta.

Figura 1.2: Heliconia rostrata.

A representação tabular é feita por meio de tabelas de mono-entrada ou de

classificação simples ou tabelas de frequências. As frequências podem ser absolu-

tas simples, absolutas acumuladas, relativas simples, relativas acumuladas, depen-

dendo do interesse do pesquisador. Uma tabela e mesmo um gráfico deve apresentar:

cabeçalho, corpo e rodapé.

O cabeçalho deve conter o suficiente para que sejam respondidas as questões:

o quê? (fato), onde? (lugar) e quando? (época). O corpo é apresentado por colunas

e sub-colunas dentro das quais serão registrados os dados. O rodapé é reservado

para as observações pertinentes, bem como para a identificação da fonte dos dados.

Assim, para o exemplo dado, tem-se a Tabela 1.4.

A descrição gráfica, dentre outras, pode ser feita de três formas: gráfico

de colunas (ou barras), de linhas e de setores circulares. Esses gráficos podem ser

obtidos considerando-se frequência absoluta, frequência relativa, frequência absoluta

acumulada e frequência relativa acumulada.

a) Gráfico de colunas e de linhas

Os resultados da Tabela 1.4 podem ser representados graficamente como

mostra a Figura 1.3.

8

Tabela 1.4: Número de visitas de polinizadores a um espécime de Heliconia rostrata

observados por alunos da sexta turma de Ciências Biológicas da ESALQ-USP no ano

de 2009, em dois dias de observação.

Intervalo Frequência Frequência Freq. abs. Freq. rel.

(xi) absoluta (fi) relativa (f′i) acumulada acumulada

08:00-10:00 17 0,207 17 0,207

10:00-12:00 28 0,341 45 0,548

12:00-14:00 18 0,220 63 0,768

14:00-16:00 19 0,232 82 1,000

82 1,000 - -

08:00−10:00 10:00−12:00 12:00−14:00 14:00−16:00

Horário

Nú

me

ro d

e v

isita

s

05

10

15

20

25

30

05

10

15

20

25

30

Horário

Nú

me

ro d

e v

isita

s

08:00−10:00 10:00−12:00 12:00−14:00 14:00−16:00

Figura 1.3: Gráficos de colunas e de linhas para o número de polinizadores observa-

dos.

b) Gráfico de setores circulares

É a representação gráfica, em um ćırculo, por meio de setores. É utilizado,

principalmente, quando se pretende uma visualização em relação ao total. Para cons-

9

trúı-lo, divide-se o ćırculo em setores, cujas áreas serão proporcionais às frequências.

Essa divisão pode ser feita por regra de três. Assim, no exemplo dado

82 visitas− 360o

x1 = 74o37′48′′

17 visitas− x1

82 visitas− 360o

x2 = 122o58′48′′

28 visitas− x2

x3 = 79o01′12′′, x4 = 83

o24′36′′.

08:00−10:0010:00−12:00

12:00−14:00

14:00−16:00

34,1% 20,7%

22,0% 23,2%

Figura 1.4: Gráfico de setores circulares para o número de polinizadores observados.

Segundo caso: duas variáveis

Se no exemplo de visitas de polinizadores a um espécime de Heliconia ros-

trata, além da variável “ńıvel”, também, for considerada a variável “dia de coleta”, os

resultados obtidos podem ser representados em uma tabela de dupla-entrada, como

a Tabela 1.5.

A descrição gráfica pode ser feita por meio dos gráficos de colunas e de

linhas, dentre outras, agrupando-se as colunas por dia de coleta ou por intervalos de

coletas, conforme é mostrado na Figura 1.5.

10

Tabela 1.5: Número de visitas de polinizadores a um espécime de Heliconia rostrata

observados por alunos da sexta turma de Ciências Biológicas da ESALQ-USP no ano

de 2009, em dois dias de observação.

Hora Primeiro dia Segundo dia Total

08:00-10:00 9 8 17

10:00-12:00 13 15 28

12:00-14:00 9 9 18

14:00-16:00 10 9 19

Total 41 41 82

Primeiro dia Segundo dia

05

1015

8−10

10−12

12−14

14−16

8−10

10−12

12−14 14−16

08:00−10:00 10:00−12:00 12:00−14:00 14:00−16:00

05

1015

1

2

1

2

1 2

1

222

Figura 1.5: Gráficos de colunas para o número de polinizadores observados.

1.2.2 Variável Quantitativa Discreta – Descrição Tabular e

Gráfica


a) Tabela Primitiva ou Tabela de Dados Brutos – É a tabela inicial dos

dados, geralmente, sem qualquer critério que permita informações “estat́ısticas”.

Assim, por exemplo, em uma pesquisa em sala de aula pode-se solicitar a quinze

alunos que digam o número de pessoas que moram em suas casas, enfatizando que a

11

Tabela 1.6: Um exemplo de tabela de frequências.

xi fi

x1 n1

x2 n2

· · · · · ·

xV nV

Total N =∑

i fi

“honestidade”moral cient́ıfica da coleta de dados pode ser mais importante do que

o próprio método estat́ıstico adotado na análise desses dados. À medida que os

alunos vão dando a informação solicitada, os dados vão “entrando”, sem um critério

espećıfico.

Outro exemplos seriam dados coletados no campo, como, por exemplo,

número de sementes germinadas, número de plantas doentes, etc.

b) Rol – É a tabela de dados dispostos em ordem, geralmente, crescente (ou

decrescente)

Apesar de pouco informativa apresenta algumas vantagens sobre a tabela

primitiva, pois facilmente se obtêm os valores de

- limite inferior: l ou LI

- limite superior: L ou LS

- amplitude total: A = L− l ou A = LS − LIApresenta desvantagens quando o conjunto de dados é grande.

c) Tabela de Frequências – As duas tabelas anteriores são usadas, em geral,

apenas para “controle”do pesquisador. Quando a pesquisa é publicada, a tabela

de frequências é a que deve ser apresentada: espaço de publicação, quantidade de

informação, etc. Esse tipo de tabela contém, no caso mais simples duas colunas,

uma com os valores observados (xi) e a outra com as frequências absolutas (fi),

como mostrado na Tabela 1.6. Podem também, ser inclúıdas colunas com frequências

12

Tabela 1.7: Número de pessoas que moram nas casas de 15 alunos amostrados.

.

xi fi ai a′i pi Fi

3 3 3 15 0,2 0,2

4 4 7 12 0,27 0,47

5 5 12 8 0,33 0,80

6 1 13 3 0,07 0,87

7 1 14 2 0,07 0,94

8 1 15 1 0,07 1,00

absolutas acumuladas, frequências relativas, frequências relativas acumuladas.

Suponha que na pesquisa com os quinze alunos sobre o número de pes-

soas que moram em suas casas, os resultados obtidos foram aqueles apresentados na

Tabela 1.7 em que ai é a frequência acumulada direta do valor xi, a′i é a frequência

acumulada inversa do valor xi, pi é a frequência relativafiN

do valor xi e Fi é a

frequência relativa acumulada direta do valor xi.

Será visto, posteriormente, que a frequência relativa é um “bom”estimador

de probabilidade e que Fi é um “bom”estimador da função acumulada de probabili-

dade.

Graficamente as variáveis quantitativas discretas são descritas por meio de

gráficos de linhas e de barras.

Segundo caso: Duas ou mais variáveis

Exemplo: Na mesma pesquisa com os 15 alunos, pode-se solicitar para infor-

marem dentre os moradores quantos são “assalariados”, obtendo-se os dados brutos,

o rol das n-uplas, ordenando-se por uma das variáveis e uma tabela de dupla-entrada,

em que a variável aleatória X representa o número de moradores por residência e

a variável aleatória Y representa o número de assalariados, conforme mostrado na

Tabela 1.8.

13

Tabela 1.8: Tabela de frequências, classificada de acordo com o número de pessoas

que moram nas casas de 15 alunos amostrados e número de assalariados.

X

Y 2 3 4 5 6 Totais (f.j)

1 1 1 1 1 0 4

2 0 1 3 2 1 7

3 0 1 2 1 0 4

Totais (fi.) 1 3 6 4 1 15

Note que as frequências marginais de X reproduzem a tabela já constrúıda

quando se considerou apenas a variável X. De modo análogo pode ser feito para a

variável Y . Além disso,

∑ij

fij =∑i

fi =∑j

fj = N = número de dados

A tabela de dupla entrada pode ser constrúıda com frequências relativas.

1.2.3 Variável Quantitativa Cont́ınua – Descrição Tabular e

Gráfica


a) Tabela primitiva ou tabela de dados brutos

Exemplo: Os dados da Tabela 1.9 referem-se a peso de 50 colmos de cana-

de-açúcar (em g).

b) Rol – Ordenando-se os dados obtêm-se os limites inferior e superior e a

amplitude total.

l = LI = 10, 20

L = LS = 22, 10

A = 22, 10− 10, 20 = 11, 90.

14

Tabela 1.9: Peso de 50 colmos de cana-de-açúcar (em g).

14,11 16,12 17,78 13,54 17,59 17,09 17,26 20,35 13,34 20,08

14,77 13,61 14,85 17,76 17,46 16,08 14,14 15,06 20,67 17,60

15,26 14,17 16,39 12,00 15,55 14,78 20,48 20,04 16,78 13,59

19,70 19,56 19,18 19,21 15,94 19,12 20,90 17,11 14,06 19,38

19,36 16,07 22,10 14,62 18,05 10,20 16,51 20,39 15,63 14,30

c) Tabela de classes

Note que ao contrário das variáveis discretas, as variáveis cont́ınuas apresen-

tam muitos valores diferentes. Desse modo, uma tabela de frequências teria muitas

linhas e seria, portanto, pouco explicativa. Para contornar esse problema, usam-se,

para descrever as variáveis cont́ınuas, tabelas de classes ou tabelas de intervalos.

Faz-se, então, a partição do rol em intervalos de amplitude, geralmente, iguais de-

nominadas classes.

O número ideal de classes de uma tabela depende, muitas vezes, mais do

bom senso do pesquisador do que de regras ŕıgidas pré-estabelecidas. Não há uma

fórmula exata. Boas aproximações podem ser obtidas por:

(i)

k =

≤ 5 se N ≤ 25≃ √N se N > 25(ii) Sturges k ≃ 1 + 3, 22 log(N).

A amplitude de cada classe é obtida por n =A

k. No exemplo dado, tem-se

k =√50 ≈ 7 e h = 22, 10− 10, 20

7= 1, 7

Os gráficos mais comumente usados para descrever as variáveis quantitativas

cont́ınuas, são histograma e poĺıgono de frequência, usando-se frequências absolutas,

e ogivas de Galton crescente ou decrescente, usando-se frequências acumuladas.

O histograma é constitúıdo de uma sequência de retângulos justapostos em

15

Tabela 1.10: Tabela de frequências simples (fi), simples acumuladas crescentes (ai),

simples acumuladas decrescentes (a′i), relativas simples (P̂i), relativas acumuladas

(Fi) para os dados da Tabela 1.9, mi representa o ponto médio do intervalo.

Peso mi fi ai a′i P̂i Fi

10,0 ⊢ 12,0 11,0 1 1 50 0,02 0,02

12,0 ⊢ 14,0 13,0 5 6 49 0,10 0,12

14,0 ⊢ 16,0 15,0 14 20 44 0,28 0,40

16,0 ⊢ 18,0 17,0 14 34 30 0,28 0,68

18,0 ⊢ 20,0 19,0 8 42 16 0,16 0,84

20,0 ⊢ 22,0 21,0 7 49 8 0,14 0,98

22,0 ⊢ 24,0 23,0 1 50 1 0,02 1,00

que cada retângulo tem como base a amplitude de classe e como altura a freqüência

da classe que descreve. O poĺıgono de frequências consiste de uma linha poligo-

nal fechada que une os pontos Pi(mi, fi), i = 1 · · · , k. Para “fechar”o poĺıgono

de frequências, supõe-se uma classe imediatamente anterior e outra imediatamente

posterior, ambas com frequências nulas e procede-se de modo análogo.

Pesos de colmos de cana−de−açúcar

Freq

uênc

ias

0 10 20 30 40

01

23

4

05

1015

4 12 20 28 36

Figura 1.6: Histograma e ogivas de Galton para os dados de pesos de colmos de

cana-de-açúcar.

16

A ogiva de Galton crescente consiste de uma linha poligonal que une os

pontos Pi(Li, ai), enquanto que a ogiva de Galton decrescente consiste de uma linha

poligonal que une os pontos Pi(li, a′i).

O histograma e as ogivas de Galton para os dados de pesos de colmos de

cana-de-açúcar, estão representados na Figura 1.6.

1.3 Descrição paramétrica

1.3.1 Introdução

Os dados relativos a uma variável quantitativa, apresentados em uma tabela,

dão visão geral do problema em estudo. Entretanto, é extremamente conveniente

proceder a uma descrição dos dados usando-se medidas que mostrem, de maneira

bastante concisa, certas caracteŕısticas da amostra.

As medidas de tendência central, também chamadas medidas de posição,

estabelecem o valor em torno do qual os dados se distribuem. Estão entre elas:

média aritmética, média geométrica, média harmônica, média quadrática, mediana,

quartis, decis, percentis e moda.

As medidas de dispersão permitem quantificar a variabilidade dos valores

observados, ao redor de um parâmetro de posição. Estão entre elas: amplitude total,

variância, desvio-padrão, erro-padrão da média, coeficiente de variação (medida de

dispersão relativa), desvio-quartil, desvio semi-quart́ılico e desvio quartil reduzido.

As medidas de assimetria medem o grau de simetria de uma distribuição en-

quanto que as medidas de curtose medem o grau de achatamento de uma distribuição.

Estão entre elas: coeficientes de Pearson e coeficientes de Fisher.

Uma distribuição pode ser: simétrica, assimétrica positiva ou assimétrica

negativa e, ainda, leptocúrtica, mesocúrtica ou platicúrtica.

Existem, ainda, as medidas de associação que envolvem a dispersão de pon-

tos referentes a duas variáveis, e podem ser citadas: covariância e coeficiente de

correlação.

17

Resta lembrar que para a maioria dos parâmetros, deve-se considerar, sepa-

radamente, o caso de séries estat́ısticas (uma simples enumeração das observações)

e aquele das distribuições de frequências considerando-se tabelas de frequências e de

classes de frequências.

É prefeŕıvel, geralmente, proceder à redução paramétrica dos dados, dire-

tamente, a partir dos valores observados, mesmo se as distribuições de frequências

foram estabelecidas, por exemplo, em vista da representação gráfica dos resultados.

Em particular, é preciso evitar efetuar a redução dos dados a partir de distribuições

grupadas em classes.

1.3.2 Medidas de tendência central ou de posição

Estabelecem o valor em torno do qual os dados se distribuem.

1.3.2.1 Média aritmética

Primeiro caso: Dados não agrupados

Dado um conjunto de N valores

ΩX = {x1, x2, . . . , xN}

define-se a média aritmética como

x̄ =x1 + x2 + . . .+ xN

N.

Os śımbolos x̄, m̂ ou µ̂ representam estimativas da média m ou µ da popu-

lação. Os śımbolos m e µ representam os parâmetros da população.

Como exemplo, sejam os dados de produção de cana-de açúcar da Tabela

1.9. Tem-se:50∑i=1

xi = 839, 69 N = 50 x̄ = 16, 8g.

18

Segundo caso: Dados colocados sob a forma de tabelas de frequências

Seja a Tabela 1.11 de frequências.

Tabela 1.11: Tabela de frequências

xi fi xifi

x1 f1 x1f1

· · · · · · · · ·

xk fk xkfk

Totais N =k∑

i=1

fi

k∑i=1

xifi

A média aritmética é obtida por

m̂ = x̄ =

k∑i=1

xifi

k∑i=1

fi

.

Tabela 1.12: Número de moradores por residência, de 15 alunos amostrados.

xi fi xifi

3 3 9

4 4 16

5 5 25

6 1 6

7 1 7

8 1 8

Totais 15 71

Exemplo: Considerando-se o exemplo do número de moradores por

residência, de 15 alunos amostrados, pode-se construir a Tabela 1.12, a partir da

19

qual se obtém a média aritmética

x̄ =71

15= 4, 7 moradores por residência.

Terceiro caso: Dados colocados sob a forma de tabelas de classes de frequências

Seja a Tabela 1.13 de classes de frequências. A média aritmética é obtida

Tabela 1.13: Tabela de classes de frequências.

Classes mi fi mifi

c1 ⊢ c2 m1 f1 m1f1c2 ⊢ c3 m2 f2 m2f2· · · · · · · · · · · ·

ck ⊢ ck+1 mk fk mkfk

Totais N =k∑

i=1

fi

k∑i=1

mifi

por

x̄ =

k∑i=1

mifi

N,

em que mi é o ponto médio da classe e N =k∑

i=1

fi.

Propriedades da média aritmética:

1)N∑i=1

(xi − x̄) = 0

As diferenças di = xi−x̄ são chamadas desvios, discrepâncias ou afastamento

de cada xi em relação a x̄.

2)∑N

i=1 (xi − x̄)2 = 0 é mı́nima, isto é, a soma dos quadrados dos desvios

de cada observação xi em relação a uma medida de posição k é a menor posśıvel

quando k é a média aritmética.

20

Exemplo: Considere os dados de peso de 50 colmos de cana-de-açúcar da

Tabela 1.9 com a Tabela 1.14 de classes de frequências. A média aritmética é obtida

Tabela 1.14: Tabela de classes de frequências para os dados da Tabela 1.9.

Peso mi fi mifi

10,0 ⊢ 12,0 11,0 1 11,0

12,0 ⊢ 14,0 13,0 5 65,0

14,0 ⊢ 16,0 15,0 14 210,0

16,0 ⊢ 18,0 17,0 14 238.0

18,0 ⊢ 20,0 19,0 8 152,0

20,0 ⊢ 22,0 21,0 7 147,0

22,0 ⊢ 24,0 23,0 1 23,00

Totais 50 846

por

x̄ =846

50= 17g.

1.3.2.2 Mediana

É um parâmetro de posição tal que a metade das observações lhe são infe-

riores (ou iguais) e a outra metade superiores (ou iguais).

Primeiro caso: dados não-agrupados

Feita a ordenação dos n dados a mediana é dada por

md = xn+12

se n é ı́mpar, e

md =xn

2+ xn

2+1

2se n é par.

Exemplo: Um estudo foi conduzido com adolescentes mulheres que sofriam

de bulimia e os resultados das medidas de entrada calórica diária (kcal/kg) estão na

21

Tabela 1.15. A mediana é dada por

md =x12 + x13

2=

21, 6 + 22, 9

2= 22, 25

Tabela 1.15: Medidas de entrada calórica diária (kcal/kg) de 24 adolescentes mulhe-

res.

15,9 18,9 25,1 16,0 19,6 25,2

16,5 21,5 25,6 17,0 21,6 28,0

17,6 22,9 28,7 18,1 23,6 29,2

18,4 24,1 30,9 18,9 24,5 30,6

Outro exemplo: As alturas (cm) de nove alunos do terceiro ano do curso de

Ciências Biológicas da ESALQ/USP, 2009 foram

X: { 172; 180; 183; 183; 185; 187; 189; 189; 191}.

A mediana é dada por

md = x5 = 185.

Segundo caso: dados colocados sob a forma de tabelas de frequências

Distribuição do número de moradores por residência, de 15 alunos sorteados

no terceiro ano de Ciências Biológicas, 2009

xi fi a′i

3 3 3

4 4 7

5 5 12

6 1 13

7 1 14

8 1 15

md = x 15+12

= x8 = 5

22

Terceiro caso: dados colocados em uma tabela de classes de frequências

Um modo de se obter a mediana é por meio de um processo gráfico,

utilizando-se a Ogiva de Galton. No exemplo de dados de bulimia tem-se a Ogiva

de Galton.

Figura 1.7: Ogiva de Galton crescente para os dados de bulimia

Tabela 1.16: Tabela de classes de frequências para os dados da Tabela 1.15.

Peso mi fi

15,9 ⊢ 18,9 17,4 7

18,9 ⊢ 21,9 20,4 5

21,9 ⊢ 24,9 23,4 4

24,9 ⊢ 27,9 23,4 3

27,9 ⊢ 30,9 26,4 4

30,9 ⊢ 33,9 29,4 1

Totais 24

Outro modo de se obter a mediana é usando-se a fórmula

md = lmd +(N2−∑

fi)h

fmd

23

em que lmd é o limite inferior da classe mediana,∑

fi é a soma das frequências

anteriores à classe mediana, h é a amplitude da classe mediana e fmd é frequência

da classe mediana.

Para os dados de bulimia da Tabela 1.15, com tabela de classes de frequências

na Tabela 1.16, tem-se

md = 20, 4 +242− 75

· 3 = 23, 4.

1.3.2.3 Moda

É o elemento de uma série de dados que ocorre com maior frequência.

Primeiro caso: dados não-agrupados

No exemplo de dados não agrupados de bulimia (Tabela 1.15), a moda é

igual a 18,9, pois aparece duas vezes enquanto que as outras observações apare-

cem apenas uma vez. Para o exemplo de alturas de alunos, as modas são 183 e 189cm.

Segundo caso: dados agrupados em uma tabela de frequências

Para o exemplo de número de moradores por residência, de 15 alunos do ter-

ceiro ano de Ciências Biológicas, 2009, a moda é Mo = 5 (é o valor xi correspondente

à maior frequência fi)

xi 3 4 5 6 7 8

fi 3 4 5 1 1 1

Terceiro caso: dados agrupados em uma tabela de classes de frequências

Uma maneira de se obter a moda é por meio de um processo gráfico,

utilizando-se o histograma de frequências simples. No exemplo de cana-de-açúcar,

tem-se Mo = 18, 23, conforme Figura 1.8.

Outro modo de se obter a moda é usando-se a fórmula de Czuber

Mo = l +∆1

∆1 +∆2.h

24

Figura 1.8: Histograma dos pesos de colmo de açúcar com cálculo da moda.

em que l é o limite inferior da classe modal, ∆1 é a diferença entre a frequência

da classe modal e a imediatamente anterior, ∆2 é a diferença entre a frequência da

classe modal e a imediatamente posterior e h é a amplitude da classe.

Para os dados da Tabela 1.15 com Tabela 1.16 de classes de frequências,

tem-se

Mo = 15, 9 +7

7 + 2.3 = 18, 23.

1.3.2.4 Média geométrica

Dado o conjunto de N valores ΩX = {x1, x2, . . . , xN}, se os dados forem não agrupa-

dos, a média geométrica é obtida por

x̄g = n√x1.x2 . . . xN =

n

√√√√ N∏i=1

xi.

Se os dados estiverem em uma tabela de classes de frequências, então,

x̄g =n

√√√√ N∏i=1

xfii

sendo xi a média da classe i com frequência fi.

Exemplo: Durante o primeiro semestre do ano de 1970 a relação

x =preço de gasolina

preço do óleo diesel

25

foi x1 = 2, 50 e no segundo semestre foi x2 = 2, 00. Então,

mgx =√2× 2, 5 =

√5 = 2, 236

Note que se y = 1x⇒ y1 = 12,5 e y2 =

12. Logo,

mgy =

√1

2, 5× 1

2=

√1

5= 0, 447 =

1

mgx.

Se fosse utilizada a média aritmética, ter-se-ia

x̄ ̸= 1ȳ.

1.3.2.5 Média harmônica

É utilizada no cálculo de velocidades médias e custo médio de bens comprados com

uma quantia fixa. Dado o conjunto de N valores ΩX = {x1, x2, . . . , xN}, para dados

não agrupados, a média harmônica é

x̄h =N

1x1

+ 1x2

+ . . .+ 1xN

=N∑Ni=1

1xi

isto é, é o inverso da média aritmética dos inversos dos valores.

Para dados em tabelas de frequências

x̄h =N∑ki=1

fixi

.

Exemplo: As cidades A, B e C são equidistantes umas das outras. Um

motorista viaja de A para B a 30km/h de B para C a 60 km/h e de C para A a 120

km/h. Qual a velocidade média desenvolvida no percurso?

x̄h =3

130

+ 160

+ 1120

= 51, 428km/h.

26

1.3.2.6 Média quadrática

É utilizada, principalmente, na determinação de diâmetro de árvores de secção ou

área média. Dado o conjunto de valores ΩX = {x1, x2, . . . , xN}, para dados não-

agrupados, a média quadrática é

x̄q =

√x21 + x

22 + . . .+ x

2N

N=

√∑x2i

N.

Para dados em tabelas de frequências,

x̄q =

√1

N

∑fix2i .

1.3.2.7 Separatrizes: Decis, Quartis e Percentis

Quartis dividem um conjunto de dados ordenados em quatro partes iguais, enquanto

que os decis em dez partes iguais e os percentis em cem partes iguais. Assim, têm-se

três quartis (Q1, Q2, Q3), nove decis (D1, D2, ...,D9) e noventa e nove percentis (P1,

P2,...,P99). Tem-se, ainda, que Md = Q2 = D5 = P50.

O processo gráfico utilizado para a determinação dessas separatrizes é seme-

lhante ao utilizado para a mediana, a partir da Ogiva de Galton. Quanto às fórmulas

tem-se:

Q1 =lQ1 + (

N4−∑

fi)

fQ1 .h.

1.3.2.8 Relação entre média, mediana e moda

Em uma distribuição simétrica observa-se que

x̄ = md = mo.

27

Figura 1.9: Exemplo de uma distribuição simétrica

Em uma distribuição assimétrica positiva observa-se que x̄ > md > mo

enquanto que na assimétrica negativa x̄ < md < mo.

1.3.3 Medidas de dispersão

1.3.3.1 Introdução

As medidas de tendência central, embora de extrema importância, não são suficientes

para o estudo completo das distribuições.

Exemplo inicial: Em um ensaio de cana-de-açúcar em que se testaram três

variedades foram obtidas as produções:

variedade A: 86,0 87,0 88,0 88,0 88,0 89,0 90,0

variedade B: 84,0 86,0 88,0 88,0 88,0 90,0 92,0

variedade C: 87,0 87,0 88,0 88,0 88,0 89,0 89,0.

Verifica-se que:

x̄A = x̄B = x̄C = 88, 0∑

x2 = 54218 s2 = 1, 67

mdA = mdB = mdC = 88, 0∑

x2 = 54248 s2 = 6, 67

moA = moB = moC = 88, 0∑

x2 = 54212 s2 = 0, 67.

28

Tornam-se necessárias, portanto, outras medidas para se fazer a escolha de

uma determinada variedade. Um novo critério, então, poderia ser: a variedade mais

regular, isto é, a variedade cujas produções apresentam menor dispersão.

1.3.3.2 Amplitude total

É a mais rudimentar das medidas de dispersão. É a diferença entre o maior e o

menor dos valores de uma série de dados.

A = xmax − xmin

No exemplo dado:

AA = 4, 0 AB = 8, 0 AC = 2, 0

Tem a desvantagem de levar em consideração apenas os valores extremos.

1.3.3.3 Desvio (di) em relação à média

Primeiro caso: dados não agrupados

di = xi − x̄ na amostra

e

di = xi − µ na população

Segundo caso: dados em tabelas de classes de frequências

di = mi − x̄

Fato:∑

di =∑

(xi − x̄) =∑

xi − nx̄ = 0

1.3.3.4 Variância

É a mais importante das medidas de variação e é definida como a média dos

quadrados dos desvios.

29

Primeiro caso: dados não agrupados

População: σ2 =

∑(xi − µ)2

n=

1

n

[∑x2 − (

∑x)2

n

]

Amostra: s2 =

∑(xi − x̄)2

n− 1=

1

n− 1

[∑x2 − (

∑x)2

n

]Nota: Perde-se um grau de liberdade ao estimar-se σ2 com base na

estimativa da média.

No exemplo de peso das três variedades de cana-de-açúcar:

s2A = 1, 67 s2B = 6, 67 s

2C = 0, 67

Poder-se-ia, portanto, nesse caso escolher a variedade C.

No exemplo de dados de produção de cana-de-açúcar (t/ha), da Tabela 1.9,

tem-se

∑x2 = 14445, 64

∑x = 839, 69

s2 =1

50− 1(14445, 64− 839, 69

2

50

)= 7, 02g2

Segundo caso: dados em tabelas de frequências

σ2 =1

n

∑fi(xi − µ)2 =

1

n

[∑fix

2i −

(∑

fixi)2

n

]

s2 = 1n−1

∑fi(xi − x̄)2 =

1

n− 1

[∑fix

2i −

(∑

fixi)2

n

]

Exemplo: Distribuição do número de moradores por residência

30

xi fi fixi fix2i

3 3 9 27

4 4 16 64

5 5 25 125

6 1 6 36

7 1 7 49

8 1 8 64

15 71 365

s2 =1

14

[365− 71

2

15

]= 2, 07

Terceiro caso: dados em tabelas de classes de frequências

s2 =1

n− 1

k∑i=1

fi(mi − x̄)2 =1

n− 1

[∑fim

2i −

(∑

fimi)2

n

]sendo mi é o ponto médio da classe i e n =

∑fi

Em outro exemplo de dados de produção de cana-de-açúcar (t/ha) tem-se:

mi fi mifi m2i fi

74,0 ⊢ 79,2 76,6 4 306,4 23470,24

79,2 ⊢ 84,4 81,8 5 409,0 33456,20

84,4 ⊢ 89,6 87,05 14 1218,0 105966,00

89,6 ⊢ 94,8 92,2 7 645,4 59505,88

94,8 ⊢ 100,0 97,4 2 194,8 18973,52

100,0 ⊢ 105,2 102,6 4 410,4 42107,04

3184,0 283478,88

s2 =1

35

[283478, 88− 3184, 0

2

36

]=

1871, 7689

35= 53, 4791 ≃ 53, 48t/ha

31

1.3.3.5 Desvio-padrão

Observando-se a fórmula para o cálculo da variância, vê-se que o numerador é uma

soma de quadrados. Assim, se a unidade foi, por exemplo, metro (m), tem-se que

a variância será dada em m2. Para se voltar à variável original, necessita-se, então,

extrair a raiz quadrada da variância que é o desvio-padrão. Assim, tem-se:

População: σ =√σ2

Amostra: s =√s2

s =√53, 48 = 7, 32 dados de cana-de-açúcar agrupados

s =√2, 07 = 1, 44 dados de habitantes por residência

1.3.3.6 Coeficiente de variação

Trata-se de uma medida relativa de dispersão, útil para a comparação em termos

relativos do grau de concentração em torno da média de séries distintas. É dado por:

População: CV =σ

µou CV (%) = 100 · σ

µ

Amostra: CV =s

x̄ou CV (%) = 100 · s

x̄Para efeitos práticos, costuma-se considerar que CV superior a 50% indica

alto grau de dispersão e, consequentemente, pequena representabilidade da média.

Enquanto que para valores inferiores a 50% a média será tanto mais representativa

do fato quanto menor for o seu CV. O coeficiente de variação mede o desvio-padrão

em unidades da média.

Assim se temos duas amostras de peso (em kg) de gado Canchim aos 8 meses

Amostra A: 347, 380, 328, 410, 380, 348, 329, 320, 330, 305

Amostra B: 350, 343, 325, 348, 334, 327, 317, 342, 341, 330

x̄A = 347, 7 x̄B = 335, 7

s2A = 1067, 79 s2B = 116, 9

sA = 32, 68 sB = 10, 81

CVA = 0, 094 CVB = 0, 032

32

Portanto, vê-se que a dispersão relativa da amostra B é menor do que a da

amostra A.

1.3.3.7 Erro-padrão da média

Obtido por

σ(x̄) =σ√n

para população

s(x̄) =s√n

para amostra

Pode ser verificado que médias e desvios-padrão são por si mesmos sujeitos

à variação e formam populações de médias e de desvios-padrão.

Espera-se que médias sejam menos variáveis que observações individuais.

Assim, o erro-padrão da média é uma medida de dispersão de um conjunto de

médias, utilizando-se apenas uma média. Nos exemplos dados, tem-se:

s(x̄) =7, 09√36

= 1, 182 para dados de cana-de-açúcar não-agrupados

s(x̄) =3, 31√36

= 0, 552 para dados de cana-de-açúcar agrupados

s(x̄) =1, 44√15

= 0, 372 para dados de habitantes por residência

Caṕıtulo 2

PROBABILIDADES

2.1 Conceituação

2.1.1 Experimento Aleatório (E)

É aquele que repetido sob as mesmas condições pode levar a resultados

diferentes, isto é, não se pode prever seu resultado, em razão do fato de que todos

os fatores que determinam o resultado não podem ser medidos ou controlados.

Exemplos:

E1: Lançar uma moeda e observar o resultado da face voltada para cima.

E2: Lançar duas moedas e observar o resultado das faces voltadas para cima.

E3: Lançar dez moedas e observar o número de caras.

E4: Lançar um dado e observar o número mostrado na face de cima.

E5: Lançar dois dados e observar o número mostrado na face de cima.

E6: Lançar dois dados e observar a soma dos números mostrados na face de

cima.

E7: Plantar 10 sementes de feijão e observar o número de sementes germi-

nadas.

E8: Fazer o cruzamento de dois animais e observar o sexo do animal que

nasceu.

Analisando esses experimentos verifica-se:

a) Cada experimento poderá ser repetido sob as mesmas condições in-

definidamente.

33

34

b) Não se conhece um particular valor do experimento “a priori”, porém,

podem-se descrever todos os posśıveis resultados - as possibilidades.

c) Quando o experimento for repetido um grande número de vezes, surgirá

uma regularidade, isto é, haverá uma estabilidade da fração f =s

n(frequência re-

lativa), em que o número n é o número de repetições e s é o número de sucessos

de um particular resultado estabelecido antes da realização. Essa caracteŕıstica é

fundamental para o cálculo da probabilidade de um certo evento. Assim,

n

f

2.1.2 Espaço Amostral

É o conjunto de todos os resultados posśıveis associados a um experimento,

representado por S. Sendo S um conjunto, ele poderá ser finito ou infinito. Nos

exemplos dados

a) E1 : S1 = {k, c} em que c = cara, k = coroa

b) E2 : S2 = {(c, c), (c, k), (k, c), (k, k)}

c) E3 : S3 = {0, 1, 2, ..., 10}

d) E4 : S4 = {1, 2, 3, 4, 5, 6}

e) E5 : S5 = {(1, 1), (1, 2), (1, 3), ..., (6, 6)}

f) E6 : S6 = {2, 3, 4, ..., 12}

g) E7 : S7 = {0, 1, 2, ..., 10}

h) E8 : S8 ={fêmea, macho}

35

2.1.3 Evento

É um subconjunto de S, ou seja, um conjunto de resultados de um experi-

mento. Nos exemplos dados

a) A1: sair cara ⇒ A1 = {c}

b) B1: sair pelo menos uma cara ⇒ B1 = {(c, c), (k, c), (c, k)}

c) C1: não sair cara ⇒ C1 = {0}

d) D1: sair o três ⇒ D1 = {3}

e) X1: sair o par (5, 6) ⇒ X1 = {(5, 6)}

f) F1: sair soma onze ⇒ F1 = {(5, 6), (6, 5)}

g) G1: pelo menos 8 sementes germinaram ⇒ G1 = {1, 2, 3, ..., 8}

h) H1: nascer macho ⇒ H1={macho}.

Tipos de Eventos

Evento Imposśıvel – aquele que nunca ocorre. Representado por ∅. Por

exemplo, no jogo de dois dados sair soma 13.

∅ = {13}

Evento Simples ou Elementar – é aquele que contém apenas um dos

elementos do espaço amostral. Exemplos: A1, C1, D1, H1.

Evento Certo – é o próprio espaço amostral S.

A = S

Evento Complementar – Dado um evento A de um espaço amostral S,

define-se o evento complementar de A, como o subconjunto de todos os elementos

de S que não estão em A, isto é,

Ā = {x : x ∈ S e /∈ A}

36

Propriedades

a) A ∪ Ā = S

b) A ∩ Ā = ∅

Exemplo: Em E4 = {1, 2, 3, 4, 5, 6}, podem-se definir os eventos comple-

mentares

A: sair face par ⇒ A = {2, 4, 6}

Ā: sair face ı́mpar ⇒ Ā = {1, 3, 5}.

Eventos Mutuamente Exclusivos

Dois eventos A1 e A2 são mutuamente exclusivos, se eles não podem ocorrer

simultaneamente, isto é, A1∩A2 = ∅. Exemplo: Em E4, podem-se definir os eventos

mutuamente exclusivos

A1: sair o número 2, A1 = {2}

A2: sair número ı́mpar, A2 = {1, 3, 5}

A1 ∩ A2 = ∅.

Eventos Independentes

Dois eventos A1 e A2 são dependentes, se a ocorrência de um deles depende

de que o outro tenha ocorrido, ou não. Dois eventos A1 e A2 são independentes, se

a ocorrência de um deles independe de que o outro tenha ocorrido, ou não.

Exemplo: Seja

37

E: Retirar 2 bolas de uma urna com 2 bolas brancas e uma preta, sem

reposição.

Os eventos

A1: A primeira bola é branca e

A2: A segunda bola é branca

são dependentes, pois a chance de ocorrência da segunda bola branca muda, depen-

dendo da cor da primeira bola.

2.2 Definição de Probabilidade

Dado um espaço amostral S, a probabilidade de um evento A, representada

por P (A), é uma função definida em S, que associa um valor numérico ao evento A,

satisfazendo os axiomas:

a) 0 ≤ P (A) ≤ 1

b) P (S) = 1

c) Se A e B são eventos mutuamente exclusivos (A ∩B = ∅), então:

P (A ∪B) = P (A) + P (B).

Nos problemas práticos o valor P (A) pode ser obtido por

P (A) =tamanho de A

tamanho de S.

Exemplos

1) Joga-se um dado. Qual a probabilidade de sair pelo menos 3?

Solução: Dado que S = {1, 2, 3, 4, 5, 6} e A = {3, 4, 5, 6}, então

P (A) =4

6=

2

3.

2) Uma urna contém 5 bolas brancas, 7 pretas e 3 vermelhas. Tiram-se 5

bolas de uma vez. Calcule as probabilidades dos eventos que se seguem.

a) Sáırem 3 bolas brancas e 2 vermelhas.

38

p1 =C35C

23

C515=

10

1001.

b) Não sair nenhuma bola branca.

p2 =C510C515

=12

143.

c) Sair pelo menos uma preta.

p3 = 1− P (nenhuma bola preta) = 1−C58C515

=421

429.

2.3 Teoremas

1. Se ∅ é o conjunto vazio, então P (∅) = 0.

Prova:

A e ∅ são disjuntos, pois A ∩ ∅ = ∅

P (A ∪ ∅) = P (A) + P (∅)

P (A) = P (A) + P (∅), pois A ∪ ∅ = A

Logo, P (∅) = 0.

2. Se Ā é o complemento de A, então P (Ā) = 1− P (A).

Prova:

Como A ∪ Ā = S e A ∩ Ā = ∅, então

P (A ∪ Ā) = P (A) + P (Ā) por (c),

P (S) = P (A) + P (Ā) e por (b)

1 = P (A) + P (Ā) ⇒ P (Ā) = 1− P (A).

39

3. Se A ⊂ B,então P (A) ≤ P (B).

Prova:

Pelo Diagrama de Venn, B = A ∪ (B ∩ Ā) e, portanto,

P (B) = P (A) + P (B ∩ Ā) por (c), mas

P (B ∩ Ā) ≥ 0 por (a), então,

P (B) ≥ P (A) ou P (A) ≤ P (B).

4. Se A e B são dois eventos quaisquer, então:

P (A ∪B) = P (A) + P (B)− P (A ∩B)

i) Se A e B são mutuamente exclusivos, P (A ∩ B) = 0 e decorre imediata-

mente pelo axioma (c)

P (A ∪B) = P (A) + P (B)

ii) Se A ∩B ̸= ∅

Pelo diagrama de Venn, A ∪B = A ∪ (Ā ∩B).

Logo, como A e Ā ∩B são mutuamente exclusivos

P (A ∪B) = P (A) + P (Ā ∩B), mas

40

B = (B ∩ A) ∪ (B ∩ Ā).

Logo, P (B) = P (B∩A)+P (B∩Ā), pois (B∩A) e (B∩Ā) são mutuamente

exclusivos. Então,

P (B ∩ Ā) = P (B)− P (B ∩ A) e, portanto,

P (A ∪B) = P (A) + P (B)− P (B ∩ A).

5. Se A e B são dois eventos quaisquer, então:

P (A ∩B) = P (Ā ∪ B̄) e P (A ∪B) = P (Ā ∩ B̄)

2.4 Espaços amostrais finitos equiprováveis

Quando a cada ponto amostral de um espaço amostral está associada a

mesma probabilidade, o espaço amostral chama-se equiprovável ou uniforme. Em

particular, se S contém n pontos, a probabilidade de cada ponto será igual a1

n.

Por outro lado, se um evento A contém r pontos, então,

P (A) = r1

n=

r

n.

Esse método de avaliar P (A) é frequentemente colocado da seguinte forma

P (A) =número de elementos de A

número de elementos do espaço amostral

ou

P (A) =número de casos favoráveis

número total de casos=

n(A)

n(S).

41

2.5 Probabilidade Condicional, Teorema do Pro-

duto, Eventos Independentes

Exemplo inicial: Uma urna contém duas bolas brancas e três bolas verdes.

Retiram-se duas bolas 1 a 1. Sejam os seguintes eventos:

A: a primeira bola é branca

B: a segunda bola é branca

Considere o experimento:

1) Com reposição da primeira bola

P (A) =2

5e P (B) =

P (B|A) = 2

5

P (B|Ā) = 25

2) Sem reposição da primeira bola

P (A) =2

5e P (B) =

P (B|A) = 1

4

P (B|Ā) = 24=

1

2

Observações:

i) P (B|A) é a probabilidade de B dado que ocorreu A.

ii) P (B|Ā) é a probabilidade de B dado que não ocorreu A.

iii) Note que no primeiro caso (com reposição) a ocorrência do evento B não

depende de que A tenha, ou não, ocorrido.

P (B|A) = P (B|Ā) = 25= P (B).

iv) Note que no segundo caso (sem reposição) a ocorrência do evento B

depende de que A tenha, ou não, ocorrido.

P (B|A) = 14̸= P (B|Ā) = 1

2.

42

Outro exemplo: Considere o experimento E e os eventos A e B

E: lançar um dado honesto

A: ocorrer face par

B: ocorrer face 2

Então, sem dúvida P (A) =1

2e P (B) =

1

6.

Suponha que o dado tenha sido lançado e que já tenha ocorrido face par.

Nessas condições, qual a probabilidade de ocorrer face 2, isto é, P (B|A) =?

O espaço amostral S′agora está reduzido de S para A.

S′= {2, 4, 6} = A

P (B|A) = n(B)n(S ′)

=n(B)

n(A)=

1

3.

Definição: Dados os eventos A e B de um espaço amostral S, define-se a

probabilidade condicional de B dado que ocorreu A, por

P (B|A) = P (A ∩B)P (A)

com P (A) ̸= 0, pois A já ocorreu.

P (B|A) =

n(A ∩B)n(S)

n(A)

n(S)

=n(A ∩B)n(A)

.

No exemplo, A = {2, 4, 6} e B = {2}, e, portanto,

A ∩B = {2} ⇒ m(A ∩B) = 1

m(A) = 3 ⇒ P (B|A) = 13.

Dessa definição decorre o

Teorema do Produto: “A probabilidade de ocorrência de dois eventos A

e B, do mesmo espaço amostral é igual ao produto da probabilidade de um deles

pela probabilidade condicional do outro, dado o primeiro.”

43

P (B|A) = P (A ∩B)P (A)

⇒ P (A ∩B) = P (A)P (B|A)

ou

P (A|B) = P (A ∩B)P (B)

⇒ P (A ∩B) = P (B)P (A|B).

No exemplo da urna, considere o evento

C: ambas as bolas são brancas.

Então,

P (C) = P (A ∩B) = P (A) · P (B|A)

Note que:

1) Com reposição da primeira bola

P (A ∩B) = P (B)P (B|A), em que P (B|A) = P (B)

P (A ∩B) = P (A) · P (B) = 25· 25=

4

25

2) Sem reposição da segunda bola

P (B|A) ̸= P (B)

P (A ∩B) = P (A) · P (B|A) = 25· 14=

1

10

Definição: Um evento A é independente de um evento B se a probabilidade

de A ocorrer não é influenciada pelo fato de B ter ocorrido, ou não, ou seja, se

P (A) = P (A|B).

É evidente que, se A é independente de B, B é independente de A. Assim

P (B) = P (B|A).

Considerando o teorema do produto, se A e B são independentes, então

P (A ∩B) = P (A) · P (B).

Observação: Dados k eventos A1, A2, ..., Ak diz-se que eles são indepen-

dentes se eles forem independentes 2 a 2, 3 a 3,..., k a k.

44

Exemplos:

1) Em um lote de 12 peças, 4 são defeituosas; 2 peças são retiradas uma

após a outra, sem reposição. Qual a probabilidade de que ambas sejam boas?

Solução:

A: a primeira peça é boa

B: a segunda peça é boa

P (A ∩B) = P (A) · P (B|A) = 812

7

11=

14

33

2) Em um certo colégio, 25% dos estudantes foram reprovados em

matemática, 15% em qúımica e 10% em matemática e qúımica ao mesmo tempo,

isto é,

P (A) =1

4, P (B) =

15

100=

3

20e P (A ∩B) = 1

10.

Um estudante é aleatoriamente escolhido.

a) Se ele foi reprovado em qúımica, qual é a probabilidade de ele ter sido

reprovado em matemática?

P (A|B) =

1

103

20

=2

3.

b) Se ele foi reprovado em matemática qual é a probabilidade de ele ter sido

reprovado em qúımica?

P (B|A) =

1

101

4

=4

10=

2

5.

c) Qual a probabilidade de ele ter sido reprovado em qúımica ou matemática?

P (A ∪B) = P (A) + P (B)− P (A ∩B) = 0, 25 + 0, 15− 0, 10 = 0, 30.

45

Um outro exemplo do Teorema da Soma

Lança-se um dado honesto. Qual a probabilidade de ocorrer

a) Face menor do que 5 ou face par?

A = {1, 2, 3, 4} ⇒ P (A) = 46

B = {2, 4, 6} ⇒ P (B) = 36

A ∪B = {1, 2, 3, 4, 6}

A ∩B = {2, 4} ⇒ P (A ∩B) = 26

P (A ∪B) = P (A) + P (B)− P (A ∩B) = 56

b) Face menor do que 5 ou face maior que 5?

A = {1, 2, 3, 4} ⇒ P (A) = 46

C = {6} ⇒ P (C) = 16

A ∪ C = {1, 2, 3, 4, 6}

A ∩ C = ∅ ⇒ P (A ∩ C) = 0

P (A ∪ C) = 46+

1

6=

5

6

c) Face par ou face ı́mpar?

B = {2, 4, 6} ⇒ P (B) = 36

D = {1, 3, 5} ⇒ P (D) = 36

B ∪D = S ⇒ P (S) = 1

B ∩D = ∅

P (B ∪D) = 1

46

2.6 Teorema de Bayes ou das probabilidades co-

nhecidas “a priori”

Definição: Sejam A1, A2, ..., An, n eventos mutuamente exclusivos, tais que

A1 ∪ A2 ∪ ... ∪ An = S

Sejam P (Ai) as probabilidades conhecidas dos vários eventos e B um evento

qualquer de S tal que conhecemos todas as probabilidades condicionais P (B|Ai).Então, para cada i, tem-se:

P (Ai|B) =P (Ai ∩B)

P (B)=

P (Ai ∩B)P (A1 ∩B) + ...+ P (An ∩B)

=P (Ai)P (B|Ai)

P (A1)P (B|A1) + ...+ P (An)P (B|An)

Exemplos

1) Em uma gaiola metálica 4% dos coelhos machos e 1% das fêmeas pesam

mais do que 1,8 kg. Por outro lado, 60% dos coelhos são fêmeas. Se um coelho

escolhido aleatoriamente pesa mais de 1,8 kg, qual a probabilidade de ser fêmea?

Solução:

Logo, podem-se considerar os eventos:

A1 : coelho fêmea

A2 : coelho macho

B : coelho pesa mais de 1,8 kg

47

e as probabilidades

P (A1) = 0, 6, P (B|A1) = 0, 01

P (A2) = 0, 4, P (B|A2) = 0, 04

P (A1|B) =0, 6 · 0, 01

0, 6 · 0, 01 + 0, 4 · 0, 04=

0, 006

0, 022=

3

11.

2) Uma cĺınica envia amostras de equinos para 3 laboratórios de análises A,

B e C nas seguintes proporções 0,2; 0,3 e 0,5, respectivamente. A probabilidade de

cada um dos laboratórios elaborar uma análise errada é de, respectivamente,1

2,1

3e

1

6.

Logo, podem-se considerar os eventos:

A1 : análise feita pelo laboratório A

A2 : análise feita pelo laboratório B

A3 : análise feita pelo laboratório C

B : realizar uma análise errada

e as probabilidades

P (A1) = 0, 2 P (B|A1) =1

2

P (A2) = 0, 3 P (B|A2) =1

3

P (A3) = 0, 5 P (B|A3) =1

6.

a) Uma análise resultou errada, qual a probabilidade de ter sido feita pelo

laboratório A? Pelo B? Pelo C?

P (A1|B) =0, 2 · 1

2

0, 2 · 12+ 0, 3 · 1

3+ 0, 5 · 1

6

=0, 11, 7

6

= 0, 3529

P (A2|B) = 0, 3529 P (A3|B) = 0, 2941

b) Qual a probabilidade de um exame executado resultar errado?

48

P (B) = P (A ∩B1) + P (A ∩B2) + P (A ∩B3)

= P (A1) · P (B|A1) + P (A2) · P (B|A2) + P (A3) · P (B|A3) =1, 7

6= 0, 2833.

3) Uma urna A contém 1 bola preta e 1 vermelha. Uma urna B contém 2

bolas pretas e 3 vermelhas. Uma bola é escolhida ao acaso na urna A e colocada na

urna B. Uma bola é, então, extráıda, ao acaso, da urna B. Qual a probablidade de

que a primeira bola seja vermelha, sabendo-se que a segunda foi preta?

Solução:

Sejam os eventos e as respectivas probabilidades

A1 : a bola de A para B foi preta ∴ P (A1) =1

2

A2 : a bola de A para B foi vermelha ∴ P (A2) =1

2

X: a bola tirada de B é preta

∴ P (X|A1) =3

6=

1

2e P (X|A2) =

2

6.

Logo,

P (A2|X) =

1

2· 26

1

2· 26+

1

2· 36

=2

5.

4) O caráter pescoço pelado das galinhas é dado por um fator genético

dominante Na. Um animal de constituição genética NaNa ou Nana, tem pescoço

pelado, mas terá pescoço coberto se tiver a constituição nana. Tendo um galo

de pescoço pelado sido cruzado com galinhas de pescoço coberto, foram obtidos 5

pintos, todos de pescoço pelado. Qual a probabilidade de que o galo seja puro para

o fator Na?

49

Solução:

Sejam os eventos:

A1 : galo puro NaNa

A2 : galo de constituição genética Nana

B : 5 pintos Nana

e as probabilidades

P (A1) =1

2, P (B|A1) = 1

P (A2) =1

2, P (B|A2) =

(1

2

)5.

Logo,

P (A1|B) =

1

2· 1

1

2· 1 + 1

2· 132

=32

33= 0, 97.

2.7 Exerćıcios

1) Considere o experimento E: Lançar um dado e uma moeda. Pede-se:

a) Construa o espaço amostral

b) Enumere os seguintes eventos

A = {coroa, marcado por número ı́mpar}

B = {cara, marcado por número ı́mpar}

C = {múltiplos de 3}

c) Expresse os eventos

I) B

II) A ou B ocorrerem

III) B e C ocorrerem

IV) A∪B

d) Quais dos eventos A, B e C são mutuamente exclusivos?

50

2) Determine a probabilidade de:

a) Sair um número par no lançamento de um dado não-viciado.

b) Sair um rei ao se extrair uma carta de um baralho.

c) Sair soma 5 no lançamento de dois dados.

3) Um grupo de 15 elementos apresenta a seguinte composição:

Homens Mulheres

Menores 5 3

Adultos 5 2

Um elemento é escolhido ao acaso. Pergunta-se:

a) Qual a probabilidade de ser homem?

b) Qual a probabilidade de ser adulto?

c) Qual a probabilidade de ser menor e mulher?

d) Sabendo-se que o elemento escolhido é adulto, qual a probabilidade de ser

homem?

e) Dado que a escolha é mulher, qual a probabilidade de ser menor?

4) Considere que existam numa população animais de genótipos dos tipos

BB, Bb e bb, sendo os indiv́ıduos BB e Bb pretos e os do tipo bb brancos. As

probabilidades dos 6 tipos de acasalamento estão resumidas na tabela a seguir:

BB Bb bb

BB4

25

5

25

6

25

Bb -3

25

4

25

bb - -3

25

51

Dado que um descendente é branco, quais as probabilidades dos diversos

cruzamentos?

5) Denomina-se “screening program” a avaliação total de uma população

sobre determinada doença. Para se ter essa avaliação, cada indiv́ıduo é submetido

ao mesmo teste cĺınico. Em um destes programas foram apurados os resultados que

se seguem:

Doença Positivo (A) Negativo (B) Total

Presente (B) 950 50 1000

Ausente (B) 10 990 1000

Total 960 1040 2000

Calcular as probabilidades condicionais apropriadas e responder se este teste

cĺınico é apropriado e se o programa deve ou não ser executado.

Informa-se que:

a) P (A|B): quanto maior, mais senśıvel será o teste

b) P (A|B): quanto menor, mais espećıfico será o teste

c) P (B|A): falsos positivos

d) P (B|A): falsos negativos

Observação: Por (a) e (b) ter-se-á a resposta à primeira pergunta e por (c)

e (d) a resposta à segunda pergunta.

Num laboratório, após um experimento com reação em cadeia de polimerase

(PCR), foram obtidos dez tubos de ensaio, numerados de 1 a 10. Sabe-se que em

três deles a reação não ocorreu como o esperado.

1) Considerando o experimento com reposição, e os evendos:

A = o primeiro tubo contém reação que não ocorreu como o esperado

B = o segundo tubo contém reação que não ocorreu como o esperado

52

1.1. A e B são independentes?

1.2. A e B são mutuamente exclusivos?

1.2. Determine P (A), P (B), P (A∩B) e P (A

∪B)

2) Refaça o item (1) considerando o experimento com reposição.

Caṕıtulo 3

Variáveis Aleatórias3.1 Definição

Define-se uma variável aleatória como uma função X, que associa a cada ele-

mento s ∈ S um número real X(s), ou seja, associa valores numéricos aos resultados

de um experimento.

Exemplo 1:

E: lançamento de duas moedas

X: números de caras obtidos nas duas moedas

S = {(c, c); (c, k); (k, c); (k, k)}

X = {0, 1, 2}

53

54

Assim, uma variável aleatória tem domı́nio em S e contradomı́nio em ℜ.

Uma variável aleatória pode ser: discreta ou cont́ınua. Será discreta se o número

posśıvel de valores de X (seu contradomı́nio) for finito ou infinito numerável. Será

cont́ınua se o seu contradomı́nio for um intervalo ou uma coleção de intervalos. No

exemplo, X é uma variável discreta.

3.2 Variáveis Aleatórias Discretas

3.2.1 Função de Probabilidade

A probabilidade de que a variável aleatória X assuma o valor x, é a função

de probabilidade de X representada por P (X = x) ou simplesmente P (x). A função

P (X = x) determina a distribuição de probabilidades da variável aleatória e deve

satisfazer os axiomas:

a) 0 6 P (xi) 6 1b)∑

i P (xi) = 1

No exemplo 1, tem-se a distribuição de probabilidade de X:

X = x 0 1 2

P(X = x) 14

12

14

Graficamente

x

P(x)

0 1 2

1/41/2

Exemplo 2:

E2 : lançar dois dados e observar a soma dos números obtidos.

X = x 2 3 4 5 6 7 8 9 10 11 12

P(X = x) 136

236

336

436

536

636

536

436

336

236

136

55

Graficamente

x

P(x)

2 3 4 5 6 7 8 9 10 11 12

1/36

2/36

3/36

4/36

5/36

6/36

3.2.2 Função de Distribuição Acumulada

Define-se Função de Distribuição Acumulada da variável aleatória X, no

ponto x, como sendo a probabilidade de que X assuma um valor menor do que ou

igual a x, isto é,

F (x) = P (X 6 x)

Propriedades:

a) F (x) =∑

xi6x P (xi)

b) F (−∞) = 0

c) F (∞) = 1

d) P (a < X 6 b) = F (b)− F (a)e) P (a 6 X 6 b) = F (b)− F (a) + F (X = a)f) P (a < X < b) = F (b)− F (a)− F (X = b)

No exemplo 1:

X = x 0 1 2

P(X = x) 14

12

14

F(x) 14

341

Exemplo 3:

E3: lançar um dado e observar o número da face superior

X = x 1 2 3 4 5 6

P(X = x) 16

16

16

16

16

16

F(x) 16

26

36

46

56

66

56

x

F(x)

1 2

1/43/4

1

x

P(x)

1 2 3 4 5 6

1/6

x

F(x)

1 2 3 4 5 6

1/62/6

3/64/6

5/61

3.3 Variável Aleatória Cont́ınua

Função Densidade de Probabilidade

Seja X uma v.a. cont́ınua. A função densidade de probabilidade f(x) é uma

função que satisfaz às seguintes condições:

a) f(x) ≥ 0

b)∫Rf(x)dx = 1

Além disso,

P (a < X < b) =∫ baf(x)dx

Propriedades:

a) P (X = x0) =∫ x0x0

f(x)dx = 0

b)

P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b)

=

∫ ba

f(x)dx

57

Verifica-se que f(x), densidade de probabilidade, não é probabilidade.

Somente quando a função for integrada entre dois limites, ela produzirá uma

probabilidade que será a área sob a curva da função entre x = a e x = b, para a < b.

Exemplo 4

Seja X uma v.a.c. com função densidade de probabilidade (f.d.p)

f(x) =

2x se 0 < x < 10 para outros valoresf(x) é f.d.p., pois

a) f(x) ≥ 0

b)∫∞−∞ f(x)dx =

∫ 102xdx = [x2]10 = 1

Exemplo 5

Uma v.a. tem a seguinte função densidade de probabilidade

f(x) =

0 se x < 0

kx2 se 0 < x < 1

0 se x ≥ 1

Pede-se:

a) Determinar k

b) Fazer o gráfico de f(x)

c) Obter P (0 < X < 12)

Solução:

a)

k

∫ 10

x2dx = k

[x3

3

]10

=k

3= 1 ⇒ k = 3

∴ f(x) = 3x2 para 0 < x < 1

58

b)

c)

P (0 < X <1

2) = 3

∫ 12

0

x2dx = 3

[x3

3

]1/20

=

[1

2

]3=

1

8

3.4 Parâmetros

De uma maneira geral, as distribuições teóricas podem ser caracterizadas

por parâmetros análogos àqueles da estat́ıstica descritiva.

3.4.1 Esperança Matemática, Valor Esperado ou Média de

uma variável aleatória

Define-se esperança matemática de uma v.a.d. X, como

µx = E(X) = ΣxiP (xi)

e de uma v.a.c., como

µx = E(X) =

∫ ∞−∞

xf(x)dx.

Exemplo 6:

E1: lançar duas moedas

X: número de caras

xi 0 1 2

P (xi)1

4

1

2

1

4

µx = 0 ·1

4+ 1 · 1

2+ 2 · 1

4= 1

Espera-se que para um número grande de jogadas ocorra em média uma

cara.

Exemplo 7:

E1: lançar dois dados

59

X: soma dos números mostrados na face de cima

xi 2 3 4 5 6 7 8 9 10 11 12

P (xi)1

36

2

36

3

36

4

36

5

36

6

36

5

36

4

36

3

36

2

36

1

36

µx =1

36[2 + 6 + 12 + 20 + 30 + 42 + 40 + 36 + 30 + 22 + 12] =

252

36= 7

Exemplo 8:

f(x) =

2x, para 0 < x < 10, para outros valoresµx = E(X) =

∫ 102x2dx =

[2x3

3

]10

=2

3

Exemplo 9:

f(x) =

3x2, para 0 < x < 10, para outros valoresµx = E(X) =

∫ 103x3dx =

[3x4

4

]10

=3

4

Propriedades da Média (Esperança):

1. A média de uma constante é a própria constante.

E(K) =∑i

KP (xi) = K∑

P (xi) = K

E(K) =

∫ ∞−∞

Kf(x)dx = K

∫ ∞−∞

f(x)dx = K

2. Multiplicando-se uma v.a. X por uma constante, sua média fica multipli-

cada por essa constante.

E(KX) =∑

KxiP (xi) = K∑

xiP (xi) = KE(X)

E(KX) =

∫ ∞−∞

Kxf(x)dx = K

∫ ∞−∞

xf(x)dx = KE(X)

60

3. E(X ± Y ) = E(X)± E(Y )

4. E(X ±K) = E(X)±K

5. E(X − µx) = E(X)− µx = 0

6. E(XY ) = E(X) · E(Y ) se X e Y forem independentes

3.4.2 Variância

Define-se variância de uma v.a., como:

σ2x = Var(X) = E[X − E(X)]2

logo

σ2x = Var(X) = Σ(xi − µx)2P (xi) se X v.a.d.

e

σ2x = Var(X) =

∫ ∞−∞

(x− µx)2f(x)dx se X v.a.c.

Exemplo 10:

E: Lançar duas moedas

X: Número de caras

E(X) = 1

Var(X) = (0− 1)2 · 14+ (1− 1)2 · 1

2+ (2− 1)2 · 1

4= 1

2

Exemplo 11:

f(x) =

2x, para 0 < x < 10, para outros valores

61

E(X) = 23

Var(X) = 2

∫ 10

(x− 2

3

)2xdx = 2

∫ 10

(x2 − 4

3x+

4

9

)xdx = 2

∫ 10

(x3 − 4

3x2 +

4

9x

)dx

= 2

(x4

4− 4

3· x

3

3+

4

9· x

2

2

)10

= 2

(1

4− 4

9+

4

18

)= 2

(9− 16 + 8

36

)=

1

18

Propriedades da Variância:

1) A variância de uma constante é zero.

Var(K) = E{(K − E(K))2} = E[K −K] = 0

2) Multiplicando-se uma v.a por uma constante, sua variância fica multipli-

cada pelo quadrado da constante.

Var(KX) = E{[KX − E(KX)]2} = K2E{X − E(X)}2 = K2Var(X)

3) Somando-se ou subtraindo-se uma constante K a uma v.a., sua variância

não se altera.

Var(X ±K) = E{[(X ±K)− E(X ±K)]2} = E{[X ±K − E(X)±K]2}

= E{[X − E(X)]2} = Var(X)

4) Var(X) = E{[X − E(X)]2} = E{X2 − 2XE(X) + [E(X)]2}

= E(X2)− 2[E(X)]2 + [E(X)]2 = E(X2)− [E(X)]2

Obs.: Em muitos casos essa propriedade facilita grandemente o cálculo da

variância.

Exerćıcios

62

1) Seja X uma v.a.c. com f.d.p

f(x) =

k(x+ 3), para 1 ≤ x ≤ 80, para outros valores de xPede-se:

a) Determinar k

b) P (2 < X < 6)

c) P (X ≤ 3)

d) P (X ≥ 3)

e) E(X)

f) E(X2)

g) σ2x

2) Considere a distribuição de probabilidade da v.a.d. X, em que X= número

de pontos obtidos quando se lança um dado uma só vez. Pede-se:

a) Gráfico da função de probabilidade

b) E(X) = µx

c) E(X2)

d) σ2x = E(X2)− [E(X)]2

3) Sejam as variáveis aleatórias discretas:

X = número de tubos cuja reação não ocorreu como o esperado na amostra

escolhida

Y = número de tubos cuja reação ocorreu com sucesso na amostra escolhida

3.1. Determine as distribuições de probabilidade de X e Y, considerando o experi-

mento com reposição e, em seguida, sem reposição.

3.2. Compare E[X] nos casos com e sem reposição.

3.3. Idem (3.2) para E[Y ], Var[X] e Var[Y ].

63

3.4. Compare E[X] + E[Y ] com o tamanho da amostra retirada. (n = 2)

4) Sabendo-se que sob certas condições, o ciclo vital da praga A, que atua

na cana-de-açúcar, pode ser descrito por:

f(x) =

6(x− x2), se x ∈ [0; 1]0, caso contrário4.1. Verifique se f(x) pode ser estudada como uma função densidade de probabili-

dades.

4.2. Esboce um gráfico para f(x).

4.3. Determine E[X] e Var[X].

4.4. Determine e identifique no gráfico da função: a) P (0 < x < 1/4)

b) P (1/4 < x < 3/4)

c) P (x > 3/4).

Caṕıtulo 4

Distribuições de probabilidade

4.1 Definição

Entre as variáveis aleatórias existem algumas que se destacam por sua im-

portância quanto à representatividade de grande parte de fenômenos biológicos.

Assim, por exemplo, sabe-se que variáveis como peso, altura, idade, etc têm

distribuição normal de probabilidade enquanto que o número de sementes germi-

nadas pode ter distribuição binomial; o número de insetos presos em uma armadilha

luminosa e o número de reações nocivas motivadas pela injeção de certo soro podem

ter a distribuição de Poisson.

São estudadas, a seguir, algumas distribuições de v.a. mais utilizadas. Den-

tre as v.a.d., serão vistas:

- Distribuição de Bernoulli

- Distribuição Binomial

- Distribuição Poisson

Dentre as de v.a.c, podem ser consideradas:

- Distribuição Normal

- Distribuição de χ2-quadrado

- Distribuição t de Student

- Distribuição F de Snedecor

65

66

4.2 Distribuição de Bernoulli

4.2.1 Definição

Um experimento de Bernoulli é aquele ao qual podem ser associados apenas

dois resultados: sucesso (se acontecer o evento de interesse) ou fracasso (se não

acontecer o evento de interesse). Tem-se, então, uma v.a.d. X que assume valor 1

caso ocorra o evento A (sucesso) e o valor 0 caso não ocorra (insucesso ou fracasso),

com probabilidades, respectivamente, p = P (X = 1) e q = 1 − p = P (X = 0), isto

é, a distribuição de probabilidade de X é

X = x x1 = 0 x2 = 1

P (X = x) q = 1− p p

sendo que q + p = 1− p− p = 1.

Exemplos:

E1: Planta-se uma semente de feijão

A: a semente germina com probabilidade p

Ā: a semente não germina com probabilidade 1− p

E2: Lança-se um dado honesto e observa-se o valor da face voltada para

cima

A: virar face 3, x2 = 1 e P(X = x2) =1

6

Ā: virar face diferente de 3, x1 = 0 e P(X = x1) =5

6.

Observa-se que no experimento E1 a probabilidade “p” não é conhecida “a

priori”. Em alguns casos desse tipo, obtêm-se informações sobre estimativas de “p”

em revisões de bibliografia ou estima-se “p” experimentalmente.

4.2.2 Média, Variância e Desvio-Padrão

São obtidos por

67

µx = µ = E(X) = Σ2i=1xiP (xi) = 0 · q + 1 · p = p

σ2 = Var(X) = E[X − E(X)]2 = E(X2)− [E(X)]2

E(X2) = Σ2i=1x2iP (xi) = 0

2 · q + 12 · p = p

σ2 = p− p2 = p(1− p) = p · q

σx =√

σ2x =√pq.

Em E2 tem-se

µx = 0.5

6+ 1.

1

6=

1

6

σ2x =

(0− 1

6

)2.5

6+

(1− 1

6

)2.1

6=

1

6

(1− 1

6

)2=

5

36

σx =

√5

36=

√5

6

4.3 Distribuição Binomial

4.3.1 Definição

Seja uma sequência de n ensaios independentes e repetidos de Bernoulli.

Então se a v.a. X representa o número de sucessos nesses n ensaios, diz-se que X

tem distribuição binomial de probabilidades com parâmetros n e p e com função de

probabilidade dada por:

P (X = x) = Cxnpxqn−x

Vê-se que P (X = x) é f.d.p., pois

a) P (X = x) ≥ 0,∀x

b)∑

P (X = x) =n∑

x=0

Cxnpxqn−x = C0np

0qn + C1np1qn−1 + . . .+ Cnnp

nq0

= (p+ q)n = 1

Exemplo:

Um recipiente contém um grande número de sementes de feijão para as

quais o fornecedor garante um poder de germinação de 0,8. Se 5 dessas sementes são

plantadas, determine:

68

a) A distribuição de probabilidades para a variável

X: números de sementes germinadas.

Distribuição de Probabilidade de X

X = xi P (X = xi) P (X = xi)

0 0,00032 P (0) = C50 (0, 8)0(0, 2)5

1 0,00640 P (1) = C51 (0, 8)1(0, 2)4

2 0,05120 P (2) = C52 (0, 8)2(0, 2)3

3 0,20480 P (3) = C53 (0, 8)3(0, 2)2

4 0,40960 P (4) = C54 (0, 8)4(0, 2)1

5 0,32768 P (5) = C55 (0, 8)5(0, 2)0

b) A probabilidade de que germinem no máximo 4 sementes.

P [X ≤ 4] = P (0) + P (1) + P (2) + P (3) + P (4) = 0, 67232 ou

P [X ≤ 4] = 1− P (X = 5) = 1− 0, 32768 = 0, 67232.

4.3.2 Média, Variância e Desvio-Padrão

Como X v.a.d. binomial nada mais é do que a soma de n variáveis indepen-

dentes do tipo Bernoulli, tem-se:

µx = µ = E(X) = ΣxP (X = x) = np

σ2 = E[X − E(X)]2 = E(X2)− [E(X)]2 = npq

σx =√

σ2x =√npq

No exemplo dado

µx = 5 · 0, 8 = 4 germinações

σ2x = 5 · 0, 8 · 0, 2 = 0, 8 germinações ao quadrado

σx =√0, 8 = 0, 894 germinações.

69

No mesmo exemplo, ainda suponha que o agricultor precisa obter 100 mudas.

Qual o número mı́nimo de sementes que ele deve plantar? Qual a variabilidade do

número de sementes germinadas?

µ = np ⇒ 100 = n · 0, 8 ⇒ n = 125

σ2x = npq = 125 · 0, 8 · 0, 2 = 20

σx = 4, 47 ≃ 5

Exerćıcios

1) Certo tratamento quando aplicado a bovinos com certa enfermidade cura

60% dos casos. Tendo dois bovinos sob esse tratamento, qual a probabilidade:

a) de que os dois morram

b) de que os dois sejam curados

c) de que um seja curado e o outro não.

Qual o número médio de curas e qual sua variabilidade?


X = xi 0 1 2

P (X = xi) 0,16 0,48 0,36

em que X: número de sobreviventes, p = 0, 6, q = 1− 0, 6 = 0, 4 e n = 2.

Solução:

a) P (X = 0) = C02 (0, 6)0(0, 4)2 = 0, 16

b) P (X = 2) = C22 (0, 6)2(0, 4)1 = 0, 48

c) P (X = 1) = C12 (0, 6)1(0, 4)1 = 0, 36

µ = np = 2 · 0, 6 = 1, 2 curas

σ2 = npq = 2 · 0, 6 · 0, 4 = 0, 48 curas2

σ =√0, 48 = 0, 6928 curas.

70

2) Certa doença dada em pintos tem uma fatalidade de 30%. Em 6 casos

dessa doença, estabeleça a distribuição de probabilidade da v.a

X: número de sobreviventes

Baseado nessa distribuição, calcule:

a) a probabilidade de que todos sobrevivam

b) a probabilidade de que nenhum sobreviva

c) a probabilidade de que os dois sobrevivam

d) a probabilidade de que pelo menos dois sobrevivam

e) a probabilidade de que no mı́nimo quatro morram

f) o número médio de sobreviventes

g) a variância e o desvio-padrão do número de sobreviventes.

h) Se um produtor de frangos quer obter no final de um determinado peŕıodo

150 frangos, baseado na incidência dessa doença, qual o número mı́nimo de pintos

que ele deve comprar? Qual a variabilidade desse número?


X = xi 0 1 2 3 4 5 6

P (X = xi) 0,00073 0,01021 0,05954 0,18522 0,32414 0,30253 0,11764

p = 0, 7 q = 0, 3 n = 6

Solução:

a) P (X = 6) = 0, 11764

b) P (X = 0) = 0, 00073

c) P (X = 2) = 0, 05954

d) P (X ≥ 2) = 1− P (X = 0)− P (X = 1) = 0, 98906

e) P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) = 0, 07048

f) µ = np = 6 · 0, 7 = 4, 2

g) σ2 = npq = 6 · 0, 7 · 0, 3 = 1, 26 σ =√1, 26 = 1, 12

h) 150 = n · 0, 7 ⇒ n = 214 frangos

σ2 = npq = 214 · 0, 7 · 0, 3 = 45 ⇒ σ = 6, 7.

71

4.4 Distribuição de Poisson

4.4.1 Definição

Existem experimentos, nos quais o número de sucessos é conhecido ou facil-

mente determinável mas o número de insucessos não pode ser determinado. É o que

acontece quando se tem interesse no número de insetos presos em uma armadilha

luminosa ou no número de ácaros que atacam determinada cultura ou no número de

brotos por explante.

SeX é a variável aleatória discreta tal que sua distribuição de probabilidades

é do tipo

P (X = x) =λxe−λ

x!, x = 0, 1, 2, . . . , λ > 0

então, X tem distribuição de Poisson com parâmetro λ (λ é o número médio de

sucessos). Verifica-se que P (X = x) representa uma leǵıtima distribuição de proba-

bilidade, pois:

a) P (X = x) ≥ 0, ∀x

b)∑∞

x=0

λxe−λ

x!= e−λ

∞∑x=0

λx

x!= e−λ

[1+

1

1!λ+

1

2!λ2+

1

3!λ3+. . .

]= e−λeλ = 1.

4.4.2 Média, Variância e Desvio-padrão

São obtidos por:

µX = E(X) =∞∑x=0

xλxe−λ

x!= e−λ

∞∑x=1

xλx−1λ

x(x− 1)!= e−λ

∞∑x=1

λx−1

(x− 1)!.λ = e−λ.eλ.λ = λ

σ2X = E(X2)− [E(X)]2

E(X2) =∞∑x=0

x2e−λλx

x!=

∞∑x=1

x2e−λλx

x!=

∞∑x=1

xe−λλx

(x− 1)!=

∞∑x=1

(x− 1 + 1) e−λλx

(x− 1)!

=∞∑x=1

e−λλx

(x− 1)!+

∞∑x=1

(x− 1) e−λλx

(x− 1)!= λ+

∞∑x=2

xe−λλx

(x− 2)!= λ+ λ2

σ2X = λ+ λ2 − λ2 = λ

σX =√

σ2X =√λ.

72

Exemplo:

Em um determinado hospital veterinário existem em média 3 diagnósticos

de cães raivosos. Qual a probabilidade de que ocorram 2 diagnósticos no próximo

mês?

P (X = 2) =32.e−3

2!= 0, 2240.

4.4.3 Relação entre as distribuições Binomial e de Poisson

Na distribuição Binomial se n é grande, mas a probabilidade p de ocorrência

de um evento é proxima de zero, de modo que q = 1− p, é próximo de 1, o evento se

diz um evento raro. Na prática, considera-se como raro um evento em que o número

de provas é no mı́nimo 50 e np é menor do que 5. Em tais casos, a distribuição

binomial é muito bem aproximada pela distribuição de Poisson com λ = np. Tal

resultado já era de se esperar pois, fazendo λ = npn tem-se pn =λ

ne se λ é pequeno

e n tende para infinito, então, p → 0 e q → 1.

Considerando-se a função de distribuição de probabilidade da variável

aleatória discreta X binomial

P (X = x) = Cxnpxqn−x =

n!

x!(n− x)!px(1− p)n−x

=n(n− 1)(n− 2) . . . (n− x+ 1)

x!px(1− p)n−x

e, fazendo-se p =λ

n, tem-se:

P (X = x) =n(n− 1)(n− 2) . . . (n− x+ 1)

x!

(λ

n

)x(1− λ

n

)n−x=

n(n− 1)(n− 2) . . . (n− x+ 1)nx

λx

x!

(1− λ

n

)n(1− λ

n

)−x= 1

(1− 1

n

)(1− 2

n

). . .

(1− x− 1

n

)λx

x!

(1− λ

n

)n(1− λ

n

)−xQuando n → ∞, enquanto x e λ permanecem constantes, tem-se:

limn→∞ 1

(1− 1

n

)(1− 2

n

). . .

(1− x− 1

n

)= 1,

73

limn→∞

(1− λ

x

)n= 1 e limn→∞

(1− λ

n

)n= e−λ.

Portanto, sob as condições limites dadas, tem-se:

B(X;n, p) ⇒ e−λλx

x!,

para X = 0, 1, 2, . . ., isto é,

limn→∞

P (x = x) =e−λλx

x!

que é a função densidade de probabilidade de uma variável aleatória discreta com

distribuição de Poisson.

Exemplo:

A probabilidade de um indiv́ıduo sofrer uma reação nociva resultante da

aplicação de uma determinada vacina é 0,001. Determinar a probabilidade de entre

2000 indiv́ıduos:

a)Nenhum sofrer reação

b) Mais do que 2 sofrerem a reação

Solução

a) Por Poisson

λ = np = 2000.0, 001 = 2

P (X = 0) = e−220

0!=

1

e2= 0, 1353

Pela Binomial

P (X = 0) = C02000(0, 001)0(0.999)2000 = 0, 1353

b) Por Poisson

P (X > 2) = 1− e−220

0!− e−22

1

1!− e−22

2

2!

= 1− 0, 1353− 0, 2706 = 0, 3235

Pela Binomial

74

P (X = 1) = C12000(0, 001)1(0.999)1999 = 0, 2707

P (X = 2) = C22000(0, 001)1(0.999)1998 = 0, 2708

P (X > 2) = 1− 0, 1352− 0, 2707− 0, 2708 = 0, 3233.

4.5 Distribuição Normal

4.5.1 Introdução

A distribuição normal tem sido considerada como a mais importante das

distribuições de variável aleatória cont́ınua e, é básica para o desenvolvimento de

testes estat́ısticos tais como, o teste “t”, o teste “F” e o teste “χ2” e outros.

Dentro do campo de Ciências são consideradas variáveis normalmente dis-

tribúıdas as variáveis: altura, peso, idade, produção, total de leite, quantidade de

ração consumida, diâmetro à altura do peito, biomassa, etc.

A equação matemática da curva normal foi desenvolvida por De Moivre em

1773 e, posteriormente, Gauss (1775-1855) também obteve a equação de um estudo

de erros em medidas repetidas da mesma variável, e devido a ele, ela é chamada

também distribuição de Gauss.

4.5.2 Definição

Uma variável aleatória cont́ınua X tem distribuição normal se sua função

densidade de probabilidade for dada por:

f(x) =1

σ√2π

e−(x− µ)2

2σ2 ,−∞ < x < ∞

em que µ e σ são parâmetros que devem satisfazer às condições −∞ < x < ∞ e

σ > 0. Além disso, será provado que µ e σ correspondem, respectivamente, à média

e ao desvio-padrão da distribuição, e então, representa-se X ∼ N(µ, σ2).

Como f(x) é uma função densidade de probabilidade, então,

a)f(x) ≥ 0, ∀x, pois 1σ√2π

> 0 e e−(x− µ)2

2σ2 > 0

75

b)∫∞−∞ f(x)dx = 1

Prova: ∫ ∞−∞

f(x)dx =1

σ√2π

∫ ∞−∞

e−(x− µ)2

2σ2 dx,

fazendo-sex− µσ

= z ⇒ dx = σdz, quando x → ∞ ⇒ z → ∞ e x → −∞ ⇒ z →

−∞.

Logo,

∫ ∞−∞

f(x)dx =1

σ√2π

∫ ∞−∞

e−z2

2 σdz =1√2π

∫ ∞−∞

e−z2

2 dz

e como g(z) = e−z2

2 é uma função par, pois g(z) = g(−z),

tem-se: ∫ ∞−∞

f(x)dx =1√2π

2

∫ ∞0

e−z2

2 dz.

Fazendo-sez2

2= t ⇒ 2zdz

2= dt ⇒ dz = t

−1/2√2dt, quando z = 0 ⇒ t = 0 e

z → ∞ ⇒ t → ∞.

Logo,∫ ∞−∞

f(x)dx =1√2π

2√2

∫ ∞0

t−1/2e−tdt =1√π

∫ ∞0

t−1/2e−tdt =1√πΓ(

1

2) =

1√π

√π = 1

pois Γ(α+ 1) =∫∞0

xαe−xdx. Portanto,∫ ∞−∞

f(x)dx = 1.

4.5.3 Parâmetros: média, variância e desvio-padrão

Se X é uma v.a.c. com distribuição normal de parâmetros µ e σ, isto é,

X ∼ N(µ, σ2)

· 2010. 10. 15. · Cap tulo 1 Estat stica Descritiva 1.1 Introdu˘c~ao 1.1.1 Estat stica A...

Documents

Transcript of · 2010. 10. 15. · Cap tulo 1 Estat stica Descritiva 1.1 Introdu˘c~ao 1.1.1 Estat stica A...