Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3) Tan, Steinbach, Kumar

52
Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3) Tan, Steinbach, Kumar Irineu Júnior Pinheiro dos Santos Mirela Ferreira César Roberto Ribeiro Castro Menezes

description

Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3) Tan, Steinbach, Kumar. Irineu Júnior Pinheiro dos Santos Mirela Ferreira César Roberto Ribeiro Castro Menezes. Sumário. Introdução Teorema de Bayes Teorema de Bayes na Classificação Classificador Naive Bayes - PowerPoint PPT Presentation

Transcript of Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3) Tan, Steinbach, Kumar

Page 1: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

Classificadores Bayesianos

Introduction to Data Mining (Cap. 5.3)

Tan, Steinbach, KumarIrineu Júnior Pinheiro dos Santos

Mirela Ferreira CésarRoberto Ribeiro Castro Menezes

Page 2: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

2

Sumário Introdução Teorema de Bayes

Teorema de Bayes na Classificação Classificador Naive Bayes

M-Estimate das Probabilidades Condicionais

Page 3: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

3

Introdução - Conceitos

Classificadores Bayesianos são classificadores estatísticos que tem a função de classificar um objeto numa determinada classe, baseando-se na probabilidade deste objeto pertencer a esta classe.

Em muitas aplicações, a relação entre o conjunto de atributos e a variável classe são não-determinísticos.

Page 4: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

4

Introdução - Exemplo

Predizer quando uma pessoa tem doença no coração considerando os fatores alimentação saudável e freqüência que pratica exercícios.

Page 5: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

5

Introdução - Exemplo

Outros Fatores podem ocasionar a doença: fumo,

colesterol elevado e hereditariedade.

Doença no coração?

AlimentaçãoSaudável eExercícios

Relação não determinística

Page 6: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

6

Teorema de Bayes Fornece o cálculo das probabilidades de que uma

determinada amostra de dados pertença a cada uma das classes possíveis, predizendo para a amostra, a classe mais provável.

Considerando X e Y variáveis aleatórias, uma probabilidade condicional P(Y|X) refere-se a probabilidade de Y assumir um valor determinado, observando-se o valor assumido por X.

)(

)()|()|(

XP

YPYXPXYP

Page 7: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

7

Teorema de Bayes na Classificação Exemplo:

ID Idade Renda Estudante Crédito Compra_computador1 <= 30 Alta Não Bom Não2 <= 30 Alta Não Bom Não3 31..40 Alta Não Bom Sim4 > 40 Média Não Bom Sim5 > 40 Baixa Sim Bom Sim6 > 40 Baixa Sim Excelente Não7 31..40 Baixa Sim Excelente Sim8 <= 30 Média Não Bom Não9 <= 30 Baixa Sim Bom Sim10 > 40 Média Sim Bom Sim11 <= 30 Média Sim Excelente Sim12 31..40 Média Não Excelente Sim13 31..40 Alta Sim Bom Sim14 > 40 Média Não Excelente Não

Classificar os seguintes valores:X = (Idade <= 30, Renda = Media, Estudante = sim, Crédito = bom)Y = Compra_Computador?

Page 8: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

8

Teorema de Bayes na Classificação Exemplo:

ID Idade Renda Estudante Crédito Compra_computador1 <= 30 Alta Não Bom Não2 <= 30 Alta Não Bom Não3 31..40 Alta Não Bom Sim4 > 40 Média Não Bom Sim5 > 40 Baixa Sim Bom Sim6 > 40 Baixa Sim Excelente Não7 31..40 Baixa Sim Excelente Sim8 <= 30 Média Não Bom Não9 <= 30 Baixa Sim Bom Sim10 > 40 Média Sim Bom Sim11 <= 30 Média Sim Excelente Sim12 31..40 Média Não Excelente Sim13 31..40 Alta Sim Bom Sim14 > 40 Média Não Excelente Não

P(Y=sim) e P(Y=não)P(Y=sim) = 9/14 = 0,643 P(Y=não) = 5/14 = 0,357 = 1-P(Y=sim)

Page 9: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

9

Teorema de Bayes na Classificação X = (Idade <= 30, Renda = Media, Estudante = sim, Crédito = bom)

ID Idade Renda Estudante Crédito Compra_computador1 <= 30 Alta Não Bom Não2 <= 30 Alta Não Bom Não3 31..40 Alta Não Bom Sim4 > 40 Média Não Bom Sim5 > 40 Baixa Sim Bom Sim6 > 40 Baixa Sim Excelente Não7 31..40 Baixa Sim Excelente Sim8 <= 30 Média Não Bom Não9 <= 30 Baixa Sim Bom Sim10 > 40 Média Sim Bom Sim11 <= 30 Média Sim Excelente Sim12 31..40 Média Não Excelente Sim13 31..40 Alta Sim Bom Sim14 > 40 Média Não Excelente Não

Probabilidades:P[Idade <= 30 | Y = sim] = 2/9 = 0,222P[Idade <= 30 | Y = não] = 3/5 = 0,6

Page 10: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

10

Teorema de Bayes na Classificação X = (Idade <= 30, Renda = Media, Estudante = sim, Crédito = bom)

ID Idade Renda Estudante Crédito Compra_computador1 <= 30 Alta Não Bom Não2 <= 30 Alta Não Bom Não3 31..40 Alta Não Bom Sim4 > 40 Média Não Bom Sim5 > 40 Baixa Sim Bom Sim6 > 40 Baixa Sim Excelente Não7 31..40 Baixa Sim Excelente Sim8 <= 30 Média Não Bom Não9 <= 30 Baixa Sim Bom Sim10 > 40 Média Sim Bom Sim11 <= 30 Média Sim Excelente Sim12 31..40 Média Não Excelente Sim13 31..40 Alta Sim Bom Sim14 > 40 Média Não Excelente Não

Probabilidades:P[Renda = Media | Y = sim] = 4/9 = 0,444P[Renda = Media | Y = não] = 2/5 = 0,4

Page 11: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

11

Teorema de Bayes na Classificação X = (Idade <= 30, Renda = Media, Estudante = sim, Crédito = bom)

ID Idade Renda Estudante Crédito Compra_computador1 <= 30 Alta Não Bom Não2 <= 30 Alta Não Bom Não3 31..40 Alta Não Bom Sim4 > 40 Média Não Bom Sim5 > 40 Baixa Sim Bom Sim6 > 40 Baixa Sim Excelente Não7 31..40 Baixa Sim Excelente Sim8 <= 30 Média Não Bom Não9 <= 30 Baixa Sim Bom Sim10 > 40 Média Sim Bom Sim11 <= 30 Média Sim Excelente Sim12 31..40 Média Não Excelente Sim13 31..40 Alta Sim Bom Sim14 > 40 Média Não Excelente Não

Probabilidades:P[Estudante = sim | Y = sim] = 6/9 = 0,667P[Estudante = sim | Y = não] =1/5 = 0,2

Page 12: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

12

Teorema de Bayes na Classificação X = (Idade <= 30, Renda = Media, Estudante = sim, Crédito = bom)

ID Idade Renda Estudante Crédito Compra_computador1 <= 30 Alta Não Bom Não2 <= 30 Alta Não Bom Não3 31..40 Alta Não Bom Sim4 > 40 Média Não Bom Sim5 > 40 Baixa Sim Bom Sim6 > 40 Baixa Sim Excelente Não7 31..40 Baixa Sim Excelente Sim8 <= 30 Média Não Bom Não9 <= 30 Baixa Sim Bom Sim10 > 40 Média Sim Bom Sim11 <= 30 Média Sim Excelente Sim12 31..40 Média Não Excelente Sim13 31..40 Alta Sim Bom Sim14 > 40 Média Não Excelente Não

Probabilidades:P[Credito = bom | Y = sim] = 6/9 = 0,667P[Credito = bom | Y = não] = 2/5 = 0,4

Page 13: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

13

Teorema de Bayes na Classificação Calculamos isoladamente o valor da probabilidade

condicional de cada atributo, mas para que eles sejam calculado de forma interseccionada, temos:

P[x1, x

2,... x

d | C] = P(x

1| C) * P(x

2| C) * … * P(x

d| C)

Com isso, é possível chegar a uma forma mais geral do Teorema de Bayes:

)(

)|()()|( 1

XP

YXPYPXYP i

di

Page 14: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

14

Teorema de Bayes na ClassificaçãoTemos:

P(X|Y=sim) = 0,222 * 0,444 * 0,667 * 0,667 = 0,044

P(X|Y=não) = 0,6 * 0,4 * 0,2 * 0,4 = 0,019

Pela lei da probabilidade total:

P(X) = P(X|Y=sim)*P(Y=sim) + P(X|Y=não)*P(Y=não)

P(X) = 0,044*0,643 + 0,019*0,357 = 0,028 + 0,007 = 0,035

P(X|Y=sim) * P(Y=sim) / P(X) = 0,044 * 0,643 = 0,028 / 0,035 = 0,8

P(X|Y=não) * P(Y=não) / P(X) = 0,019 * 0,357 = 0,007 / 0,035 = 0,2

Ou seja, P(X|Y=sim) > P(X|Y=não) O classificador Bayesiano prediz que a tupla X é classificada

na classe Compra-Computador = sim

Page 15: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

15

Classificador Naive Bayes Um classificador Naive Bayes estima a probabilidade de

classe condicional P(X|Y).

Pré-considerações: Assume-se que os atributos são condicionalmente

independentes (Naive Bayes ingênuo ou simples); As probabilidades condicionais são estimadas para os atributos

de acordo com a sua classificação: Categórico; Contínuo.

Page 16: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

16

Atributos Condicionalmente Independentes São atributos que apresentam independência estatística

entre si: Dois eventos são estatisticamente independentes se a

probabilidade da ocorrência de um evento não é afetada pela ocorrência do outro evento.

Exemplo: Tamanho do braço x Habilidades de Leitura

Considerando a Idade, a dependência não ocorre.

Page 17: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

17

Atributos Categóricos É aquele atributo para o qual é possível estabelecer um

conjunto de valores finito.

Exemplo: Sexo: {Masculino, Feminino} Cor da Pele: {Branca, Marrom, Amarela, Preta}

Page 18: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

18

Atributos Categóricos Para uso no algoritmo Naive Bayes:

Estima-se a fração das instâncias de treinamento de acordo com cada valor da classe.

Exemplo:

Casa Própria Estado Civil Inadimplente

Sim Casado Sim

Sim Solteiro Não

Não Casado Não

Sim Divorciado Não

P(Casa Própria=Sim|Não)

Page 19: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

19

Atributos Categóricos

Exemplo:

Casa Própria Estado Civil Inadimplente

Sim Casado Sim

Sim Solteiro Não

Não Casado Não

Sim Divorciado Não

P(Casa Própria=Sim|Não) = 2/3

Page 20: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

20

Atributos Contínuos

São considerados contínuos os atributos que possuem muitos ou infinitos valores possíveis

Exemplo: Idade: Peso:

00R

Page 21: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

21

Atributos Contínuos Existem duas formas de estimar a probabilidade de

classe condicional para atributos contínuos: Discretização dos atributos; Distribuição Gaussiana.

Page 22: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

22

Atributos Contínuos Discretização de atributos contínuos:

Os atributos contínuos são divididos em intervalos discretos, que substituem os valores desses atributos.

Esta abordagem transforma os atributos contínuos em atributos ordinais.

A transformação dos atributos contínuos em atributos discretos permite que sejam tratados como atributos categóricos.

Page 23: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

23

Atributos Contínuos Distribuição Gaussiana:

Assume uma certa forma de distribuição de probabilidade para variáveis contínuas, e estima os parâmetros da distribuição usando os dados de treinamento.

Caracterizada por dois parâmetros: Média (µ) Variância (σ2) da amostra

Page 24: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

24

Atributos Contínuos

Para cada valor de classe y, a probabilidade da classe condicional para o atributo X é:

n

y

2

2

2exp

2

1)|(

x

yYxXP

1

22

n

x

Page 25: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

25

Classificador Naive Bayes

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

Atributos Categóricos Atributos Contínuos Classe

Exemplo: Dado o seguinte conjunto de treinamento:

Page 26: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

26

Classificador Naive Bayes Cálculo dos atributos categóricos:

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

P(Casa Própria=Sim|Não) = 3/7

Page 27: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

27

Classificador Naive Bayes

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

P(Casa Própria=Sim|Não) = 3/7

P(Casa Própria=Não|Não) = 4/7

Cálculo dos atributos categóricos:

Page 28: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

28

Classificador Naive Bayes

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

P(Casa Própria=Sim|Não) = 3/7

P(Casa Própria=Não|Não) = 4/7

P(Casa Própria=Sim|Sim) = 0

Cálculo dos atributos categóricos:

Page 29: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

29

Classificador Naive Bayes

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

P(Casa Própria=Sim|Não) = 3/7

P(Casa Própria=Não|Não) = 4/7

P(Casa Própria=Sim|Sim) = 0

P(Casa Própria=Não|Sim) = 1

Cálculo dos atributos categóricos:

Page 30: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

30

Classificador Naive Bayes

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

P(Casa Própria=Sim|Não) = 3/7

P(Casa Própria=Não|Não) = 4/7

P(Casa Própria=Sim|Sim) = 0

P(Casa Própria=Não|Sim) = 1

P(Estado Civil=Solteiro|Não) = 2/7

P(Estado Civil=Divorciado|Não) = 1/7

P(Estado Civil=Casado|Não) = 4/7

P(Estado Civil=Solteiro|Sim) = 2/3

P(Estado Civil=Divorciado|Sim) = 1/3

P(Estado Civil=Casado|Sim) = 0

Cálculo dos atributos categóricos:

Page 31: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

31

Classificador Naive Bayes

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

Média:

µ = (125 + 100 + 70 + 120 + 60 + 220 + 75) / 7 = 110

Variância:

σ2 = (125-110)2 + (100-110)2 + (70-110)2 + (120-110)2 + (60-110)2 + (220-110)2 + (75-110)2 / 6 = 2975

Cálculo dos atributos contínuos:

Para a classe Não

Page 32: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

32

Classificador Naive Bayes

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

Cálculo dos atributos contínuos:

Para a classe Sim

Média:

µ = (95 + 85 + 90) / 3 = 90

Variância:

σ2 = (95-90)2 + (85-90)2 + (90-90)2 / 2 = 25

Page 33: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

33

Classificador Naive Bayes

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

P(Casa Própria=Sim|Não) = 3/7

P(Casa Própria=Não|Não) = 4/7

P(Casa Própria=Sim|Sim) = 0

P(Casa Própria=Não|Sim) = 1

P(Estado Civil=Solteiro|Não) = 2/7

P(Estado Civil=Divorciado|Não) = 1/7

P(Estado Civil=Casado|Não) = 4/7

P(Estado Civil=Solteiro|Sim) = 2/3

P(Estado Civil=Divorciado|Sim) = 1/3

P(Estado Civil=Casado|Sim) = 0

Para o cálculo da Renda Anual:

Classe Não:

Média: 110 Variância: 2975

Classe Sim:

Média: 90 Variância: 25

Resultado dos cálculos básicos:

Page 34: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

34

Classificador Naive Bayes Dado o conjunto de treinamento anterior, qual a

classe do seguinte registro de teste:

X = (Casa Própria=Não, Estado Civil=Casado, Renda Anual=120K)

Avaliar qual a maior probabilidade entre as probabilidades posteriores: P(Inadimplente=Não|X) e P(Inadimplente=Sim|X)

Page 35: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

35

Classificador Naive Bayes Para calcular as probabilidades posteriores

P(Não|X) e P(Sim|X) necessitamos: Calcular as classes condicionais P(X|No) e P(X|Yes)

P(X|Não) P(Casa Própria=Não|Não) * P(Estado Civil=Casado|Não) * P(Renda Anual=120K|Não) 4/7 * 4/7 * 0,0072 0,0024

P(X|Sim) P(Casa Própria=Não|Sim) * P(Estado Civil=Casado|Sim) * P(Renda Anual=120K|Sim) 1 * 0 * 1,2x10-9 0

Distribuição Gaussiana

Page 36: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

36

Classificador Naive Bayes Juntando os termos:

P(Não|X) α * P(Não) * P(X|Não) α * 7/10 * 0,0024 0,0016α Onde α = 1/P(X) → Termo constante!

Como a probabilidade condicional de P(X|Sim) é zero: P(Sim|X) = 0

Logo, P(Não|X) > P(Sim|X) O registro X é classificado como Não

Page 37: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

37

M-Estimate das Probabilidades Condicionais

Problema: se a probabilidade da classe condicional de um dos atributos é zero, a probabilidade posterior para a classe inteira, quando avaliado esse atributo, também será.

Pois Lembre-se: P[x

1, x

2,... ,x

k | C] = P(x

1| C) * P(x

2| C) * … * P(x

k| C)

Quando essa condição existe para atributos das duas classes, o algoritmo não é capaz de classificar o registro.

Page 38: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

38

M-Estimate das Probabilidades Condicionais Exemplo, imagine que o conjunto de treinamento fosse assim:

E agora queremos saber P(X | C) sendo X = (Casa Própria = Sim, Estado Civil = Divorciado, Renda = 120k)

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

Page 39: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

39

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

M-Estimate das Probabilidades Condicionais

P(Não) = 6/9 = 0.666

Page 40: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

40

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

M-Estimate das Probabilidades Condicionais

P(Não) = 6/9 = 0.666

P(Sim) = 3/9 = 0.333

Page 41: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

41

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

M-Estimate das Probabilidades Condicionais

P(Não) = 6/9 = 0.666

P(Sim) = 3/9 = 0.333

P(Casa Própria = Sim | Não) = 2/6 = 0.33

Page 42: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

42

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

M-Estimate das Probabilidades Condicionais

P(Não) = 6/9 = 0.666

P(Sim) = 3/9 = 0.333

P(Casa Própria = Sim | Não) = 2/6 = 0.33

P(Estado Civil = Divorciado | Não) = 0

Page 43: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

43

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

M-Estimate das Probabilidades Condicionais

P(Não) = 6/9 = 0.666

P(Sim) = 3/9 = 0.333

P(Casa Própria = Sim | Não) = 2/6 = 0.33

P(Estado Civil = Divorciado | Não) = 0

P(Renda Anual = 120k | Não) = 0,0072

Média (µ) = 91,66kVariância (σ2) = 732,76

Page 44: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

44

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

M-Estimate das Probabilidades Condicionais

P(Não) = 6/9 = 0.666

P(Sim) = 3/9 = 0.333

P(Casa Própria = Sim | Não) = 2/6 = 0.33

P(Estado Civil = Divorciado | Não) = 0

P(Renda Anual = 120 | Não) = 0,0072

P(Casa Própria = Sim | Yes) = 0/3 = 0

Page 45: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

45

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

M-Estimate das Probabilidades Condicionais

P(Não) = 6/9 = 0.666

P(Sim) = 3/9 = 0.333

P(Casa Própria = Sim | Não) = 2/6 = 0.33

P(Estado Civil = Divorciado | Não) = 0

P(Renda Anual = 120 | Não) = 0,0072

P(Casa Própria = Sim | Sim) = 0/3 = 0

P(Estado Civil = Divorciado | Sim) = 0.333

Page 46: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

46

Registro Casa Própria Estado Civil Renda Anual Inadimplente

1 Sim Solteiro 125K Não

2 Não Casado 100K Não

3 Não Solteiro 70K Não

4 Sim Casado 120K Não

5 Não Divorciado 95K Sim

6 Não Casado 60K Não

7 Sim Divorciado 220K Não

8 Não Solteiro 85K Sim

9 Não Casado 75K Não

10 Não Solteiro 90K Sim

M-Estimate das Probabilidades Condicionais

P(Não) = 6/9 = 0.666

P(Sim) = 3/9 = 0.333

P(Casa Própria = Sim | Não) = 2/6 = 0.33

P(Estado Civil = Divorciado | Não) = 0

P(Renda Anual = 120 | Não) = 0,0072

P(Casa Própria = Sim | Sim) = 0/3 = 0

P(Estado Civil = Divorciado | Sim) = 0.333

P(Renda Anual = 120 | Sim) = 1,2 * 10-9

Page 47: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

47

M-Estimate das Probabilidades Condicionais

Aplicando a fórmula de Bayes:

P(C = Não | X) = α * 0.666 * (0.333 * 0 * 0,0072) P(C = Sim | X) = α * 0.333 * ( 0 * 0.333 * 1,2 * 10-9)

P(C = Não | X) = 0 P(C = Sim | X) = 0 Ou seja, o algoritmo não foi capaz de predizer a probabilidade

neste caso

Page 48: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

48

M-Estimate das Probabilidades Condicionais

É possível contornar o problema utilizando a abordagem M-Estimate para o cálculo das probabilidades condicionais

Page 49: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

49

M-Estimate das Probabilidades Condicionais

Onde: n é o número total de instâncias da classe y nc é o número de exemplos de treinamento da classe y com o valor x m é um parâmetro conhecido como o tamanho de amostra equivalente

m é dito valor de compensação p é um parâmetro especificado pelo usuário

+ ou – a proporção da classe no treinamento

Utilizando m = 3 e p = 2/3 (para a classe “Não”), é possível calcular a probabilidade condicional que anteriormente era zero: P(Estado Civil=Divorciado|Não) = (0 + 3*2/3)/(6+3) = 2/9

Page 50: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

50

M-Estimate das Probabilidades Condicionais Assumindo p=1/3 para classe “Sim” e p=2/3 para a classe “Não”, as

classes condicionais dos demais atributos são calculadas: P(Casa própria=Sim|Não) = (2 + 3*2/3)/(6 + 3) = 4/9 = 0.444 P(Estado Civil = Divorciado | Não) = 2/9 = 0.222 (calculado na lâmina anterior) P(Renda Anual = 120k | Não) = 0,0072

P(C = Não | X) = α * 0.666 * (0.444 * 0.222 * 0,0072) = 0,004α

P(Casa própria=Sim|Sim) = (0 + 3*1/3)/(3 + 3) = 1/6 = 0,166 P(Estado Civil = Divorciado | Sim) = (1 + 3 * 1/3) / (3 + 3) = 2/6 = 0,333 P(Renda Anual = 120k | Sim) = 1,2 * 10-9

P(C = Sim | X) = α * 0.333 * ( 0,166 * 0.333 * 1,2 * 10-9) = 0,022 * 10-9α

Portanto, o algoritmo de Naive Bayes prediz que para o conjunto de atributos X utilizado, a classe deverá ser NÃO

Page 51: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

51

Caracteristicas Naive Bayes

Vantagens: São robustos para isolar pontos de ruído, pois tais pontos são

calculados pela média quando estima-se a probabilidades condicionais dos dados.

Atributos irrelevantes não tem impacto na computação da probabilidade posterior.

Desvantagens: Atributos correlacionados degradam a performance de classificadores

bayesianos, pois a independência condicional não é mais assegurada.

Page 52: Classificadores Bayesianos Introduction to Data Mining (Cap. 5.3)  Tan, Steinbach, Kumar

Perguntas?