Intelligenza Artificiale

Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello

11

Intelligenza ArtificialeIntelligenza Artificiale

PreferenzePreferenze


22

OutlineOutline

Preferenze razionaliPreferenze razionali UtilitàUtilità DenaroDenaro Utilità multi-attibutoUtilità multi-attibuto Reti di decisioneReti di decisione Valore dell’informazioneValore dell’informazione


33

PreferenzePreferenzeUn agente sceglie tra premi (A, B, etc.) e Un agente sceglie tra premi (A, B, etc.) e

lotterie, cioè, situazioni con premi incertilotterie, cioè, situazioni con premi incerti

Lotteria L = [p, A; (1-p), B]Lotteria L = [p, A; (1-p), B]

ABBA

BABA

BABA

ad preferito ènon

tiindifferen sono e

a preferito è

:Notazione

≈≈f

f

p

1-p

L

A

B


44

Preferenze razionaliPreferenze razionaliIdea: le preferenze di un agente razionale devono obbedire a vincoli.Idea: le preferenze di un agente razionale devono obbedire a vincoli.Preferenze razionali Preferenze razionali comportamento descrivibile come comportamento descrivibile come massimizzazione dell’utilità attesamassimizzazione dell’utilità attesa

€

Vincoli :

Ordinabilità

(A f B)∨(B f A)∨(A ≈ B)

Transitività

(A f B)∧(B f C)⇒ (A f C)

Continuità

A f B f C⇒ ∃p [p,A;1− p,C] ≈ B

Sostituibilità

A ≈ B⇒ [p,A;1− p,C] ≈ [p,B;1− p,C]

Monotonicità

A ≈ B⇒ (p ≥ q⇔ [p,A;1− p,B] f ≈ [q,A;1−q,B])

Decomponibilità

[p,A;1− p,[q,B;1−q,C]] ≈ [p,A;(1− p)q,B;(1− p)(1−q)C]


55

Preferenze razionali (cont.)Preferenze razionali (cont.)La violazione dei vincoli conduce a evidenti contraddizioniLa violazione dei vincoli conduce a evidenti contraddizioniPer esempio: un agente con preferenze intransitive può Per esempio: un agente con preferenze intransitive può essere indotto a dare via tutto il suo denaroessere indotto a dare via tutto il suo denaro


66

Massimizzando l’utilità attesaMassimizzando l’utilità attesa

TeoremaTeorema (Ramsey, 1931; von Neumann e Morgenstern, 1944): (Ramsey, 1931; von Neumann e Morgenstern, 1944):Date le preferenze soddisfacenti i vincoli esiste una funzione a valori reali Date le preferenze soddisfacenti i vincoli esiste una funzione a valori reali U tale cheU tale che

Principio MEUPrincipio MEU: Scegliere l’azione che massimizza l’utilità attesa : Scegliere l’azione che massimizza l’utilità attesa Nota: un agente può essere interamente razionale (consistente con MEU) Nota: un agente può essere interamente razionale (consistente con MEU) senza mai rappresentare o manipolare utilità e probabilitàsenza mai rappresentare o manipolare utilità e probabilitàEs., una tabella predefinita per un giocatore perfetto di trisEs., una tabella predefinita per un giocatore perfetto di tris

∑=≈⇔≥

i iinn SUpSpSpU

BABUAU

)(]),;...;,([

)()(

11

f


77

UtilitàUtilità

L’utilità associa gli stati a numeri reali. Quali numeri ?L’utilità associa gli stati a numeri reali. Quali numeri ?Approccio standard per stabilire l’utilità umana:Approccio standard per stabilire l’utilità umana:Comparare un dato stato A con una lotteria standard LComparare un dato stato A con una lotteria standard Lp p che ha: che ha: ““miglior premio possibile” umiglior premio possibile” u ^̂ con probabilità p con probabilità p““peggiore catastrofe possibile” upeggiore catastrofe possibile” u ^̂ con probabilità (1-p) con probabilità (1-p) Aggiustare la probabilità della lotteria p fino a quando A è indifferente Aggiustare la probabilità della lotteria p fino a quando A è indifferente rispetto a Lrispetto a Lpp

Continua come prima

Morte istantanea

0.999999

0.000001

Pagare 30 € è indifferente a L


88

Scale di utilitàScale di utilità

Utilità normalizzate: uUtilità normalizzate: u^ ^ = 1.0, u= 1.0, u^ ^ = 0.0= 0.0 Micromorts: un milionesimo della possibilità di Micromorts: un milionesimo della possibilità di

morire morire – utile per la roulette russa, pagamento per ridurre i rischi utile per la roulette russa, pagamento per ridurre i rischi

prodotti, etc.,prodotti, etc., QALYs: quality-adjusted life yearsQALYs: quality-adjusted life years

– Utile per decisioni mediche comportanti un rischio Utile per decisioni mediche comportanti un rischio sostanzialesostanziale

Note: il comportamento è invariante per Note: il comportamento è invariante per trasformazioni lineari trasformazioni lineari

U’(x) = kU’(x) = k11U(x) + kU(x) + k2 2 dove kdove k1 1 > 0> 0


99

DenaroDenaro Il denaro non si comporta come una funzione di utilitàIl denaro non si comporta come una funzione di utilità Data una lotteria L con valore monetario atteso di EMV(L), Data una lotteria L con valore monetario atteso di EMV(L),

solitamente U(L) < U(EMV(L)), cioè, le persone sono solitamente U(L) < U(EMV(L)), cioè, le persone sono avverseavverse al rischioal rischio

Curva di utilità: per quale probabilità p sono indifferente tra un Curva di utilità: per quale probabilità p sono indifferente tra un premio fisso x e una lotteria [p, € M; (1-p), € 0] per un grande premio fisso x e una lotteria [p, € M; (1-p), € 0] per un grande M ?M ?

I dati si possono (o debbono estrapolare sperimentalmente)I dati si possono (o debbono estrapolare sperimentalmente)


1010

Paradosso di S. PietroburgoParadosso di S. Pietroburgo Vi viene chiesto di partecipare ad un gioco in cui una moneta viene Vi viene chiesto di partecipare ad un gioco in cui una moneta viene

lanciata in aria sino a quando il risultato non è “testa”. lanciata in aria sino a quando il risultato non è “testa”. Se “testa” compare al lancio “Se “testa” compare al lancio “nn” , il giocatore vince € ” , il giocatore vince € 22nn . . Quanto paghereste per giocare ?Quanto paghereste per giocare ?

EMV(S.P.)=EMV(S.P.)=

Disposto a pagare qualunque cifra ? Assurdo. Bernoulli (1738) propose Disposto a pagare qualunque cifra ? Assurdo. Bernoulli (1738) propose di misurare l’utilità del denaro su scala logaritmica:di misurare l’utilità del denaro su scala logaritmica:

Quindi per giocare un agente razionale paga sino a € 4 !Quindi per giocare un agente razionale paga sino a € 4 !

∞==∑∑ i

ii

iii TMVTP 2

2

1)()(

2...16

4

8

3

4

212log

2

1)()( 2 =++++==∑∑ i

ii

iii TMVTP


1111

Reti di decisioneReti di decisione Aggiungere nodi di azioni e nodi di utilità alle Aggiungere nodi di azioni e nodi di utilità alle

reti di credenza per prendere decisioni reti di credenza per prendere decisioni razionalirazionali

Algoritmo:Algoritmo:– for ogni valore del nodo di azionefor ogni valore del nodo di azione

calcolare il valore atteso dell’utilità del nodo data calcolare il valore atteso dell’utilità del nodo data l’azione e la proval’azione e la prova

– return l’azione MEUreturn l’azione MEU


1212

Utilità multiattributoUtilità multiattributo

Come possiamo gestire l’utilità di funzioni a più variabili XCome possiamo gestire l’utilità di funzioni a più variabili X11,,…,X…,Xnn ? ?

Esempio, per la costruzione di un aeroporto, parametri: Esempio, per la costruzione di un aeroporto, parametri: pericoli, rumori, costo di costruzionepericoli, rumori, costo di costruzione– qual è U(Pericoli, Rumore, Costo) ?qual è U(Pericoli, Rumore, Costo) ?

Come possono essere determinate le funzioni di utilità Come possono essere determinate le funzioni di utilità complesse dal comportamento delle preferenze ?complesse dal comportamento delle preferenze ?

Idea 1: identificare le condizioni sotto le cui decisioni Idea 1: identificare le condizioni sotto le cui decisioni possono essere fatte senza la completa identificazione di possono essere fatte senza la completa identificazione di U(xU(x11,…,x,…,xnn))

Tipicamente definire attributi tale che U è monotona in Tipicamente definire attributi tale che U è monotona in ogni parametro.ogni parametro.


1313

Dominanza strettaDominanza stretta

La scelta B domina strettamente la scelta A se e solo se La scelta B domina strettamente la scelta A se e solo se – per ogni parametro i, Xper ogni parametro i, Xii(B) (B) ≥ X≥ Xii(A) (e quindi U(B) ≥ U (A) )(A) (e quindi U(B) ≥ U (A) )

La dominanza stretta si riscontra raramente nella praticaLa dominanza stretta si riscontra raramente nella pratica


1414

Dominanza stocasticaDominanza stocastica

ottimale attributi gli su tutti stocastica dominanza :butomultiattri Caso

)()()()(

: onedistribuzicon A mentestocastica domina

, onedistribuzi una produce che ,A azionel' allora ,in monotona è Se

)()(

se solo e se onedistribuzi la mentestocastica domina onedistribuzi La

21

22

11

2- 1

21

⇒

≥

≥∀

∫∫

∫∫

∞

∞−

∞

∞−

∞−∞

dxxUxpdxxUxp

ppxU

dxxpdxxpt

pptt


1515

Dominanza stocasticaDominanza stocastica

La dominanza stocastica può essere spesso La dominanza stocastica può essere spesso determinata senza le distribuzioni esatte usando determinata senza le distribuzioni esatte usando ragionamenti qualitativiragionamenti qualitativi

Es., i costi di costruzione aumentano con la Es., i costi di costruzione aumentano con la distanza dalla città. Quindidistanza dalla città. Quindi– se Sse S2, 2, è più lontano dalla città rispetto a S è più lontano dalla città rispetto a S11 ne deriva ne deriva

che che

– SS11 domina stocasticamente S domina stocasticamente S22 sui costi sui costi


1616

Struttura di preferenza: deterministicoStruttura di preferenza: deterministico

XX11 and X and X2 2 sono sono preferenziabilmente indipendentipreferenziabilmente indipendenti (P.I.) da X (P.I.) da X33 se e solo se se e solo se la preferenza tra <xla preferenza tra <x11,x,x22,x,x33> and <x’> and <x’11,x’,x’22,x’,x’33> non dipende da x> non dipende da x33

Es., <Rumore, Costi, Sicurezza>:Es., <Rumore, Costi, Sicurezza>:<20,000 soffrono, $4.6 miliardi, 0.06 morti/mpm> contro<20,000 soffrono, $4.6 miliardi, 0.06 morti/mpm> contro<70,000 soffrono, $4.2 miliardi, 0.06 morti/mpm><70,000 soffrono, $4.2 miliardi, 0.06 morti/mpm>

TeoremaTeorema (Leontief, 1947): se ogni coppia di attributi è P.I. dal suo (Leontief, 1947): se ogni coppia di attributi è P.I. dal suo complemento, allora ogni sottoinsieme di attributi è P.I. dal suo complemento, allora ogni sottoinsieme di attributi è P.I. dal suo complemento: P.I. mutualecomplemento: P.I. mutuale

TeoremaTeorema (Debreu, 1960): P.I. mutuale (Debreu, 1960): P.I. mutuale ⇒ esiste una funzione di ⇒ esiste una funzione di valutazione additiva :valutazione additiva : V(S)=V(S)=∑∑iiVVii(X(Xii(S))(S))Quindi bisogna determinare Quindi bisogna determinare nn funzioni con singolo attributo; spesso una buona funzioni con singolo attributo; spesso una buona approssimazioneapprossimazione


1717

Struttura di preferenza: StocasticaStruttura di preferenza: Stocastica

Abbiamo bisogno di considerare le preferenze sulle lotterie:– X è indipendente dall’utilità di Y se e solo se– le preferenze sulle lotterie X non dipendono da y

U.I. mutuale: ogni sottoinsieme è U.I. dal suo complementoU.I. mutuale: ogni sottoinsieme è U.I. dal suo complemento Sotto tale ipotesi: esiste una funzione di utilità Sotto tale ipotesi: esiste una funzione di utilità

moltiplicativa:moltiplicativa:– U=kU=k11UU11+k+k22UU22+k+k33UU33+k+k11kk22UU11UU22+k+k22kk33UU22UU33+k+k33kk11UU33UU11+k+k11kk22kk33UU11UU

22UU33

Procedure di routine e pacchetti software per Procedure di routine e pacchetti software per generare test di preferenza per identificare varie generare test di preferenza per identificare varie famiglie canoniche di funzioni di utilitàfamiglie canoniche di funzioni di utilità


1818

Valore dell’informazioneValore dell’informazione Problema calcolare il valore di acquisire nuovi elementi decisionali.Problema calcolare il valore di acquisire nuovi elementi decisionali. Può essere fatto direttamente dalla rete di decisionePuò essere fatto direttamente dalla rete di decisione Esempio: comperare dei diritti petroliferiEsempio: comperare dei diritti petroliferi

– nn blocchi A blocchi A11, …, A, …, Ann, solo in uno è presente il petrolio, valore stimato , solo in uno è presente il petrolio, valore stimato kk– Probabilità a priori Probabilità a priori 1/n1/n ognuno, mutuamente esclusivi ognuno, mutuamente esclusivi– Il prezzo corrente di ogni blocco è allora Il prezzo corrente di ogni blocco è allora k/nk/n– Il consulente offre una perizia sul blocco AIl consulente offre una perizia sul blocco A11. Costo della consulenza ?. Costo della consulenza ?

Soluzione: calcolare il valore atteso dell’informazione = Soluzione: calcolare il valore atteso dell’informazione = – valore atteso della miglior azione data l’informazione meno il valore atteso della miglior azione data l’informazione meno il – valore atteso della miglior azione senza l’informazionevalore atteso della miglior azione senza l’informazione

Potremmo dire “petrolio in APotremmo dire “petrolio in A11” o “niente petrolio in A” o “niente petrolio in A11”, con probabilità rispettivamente ”, con probabilità rispettivamente 1/n1/n e e (n-1)/n(n-1)/n, ,

– [1/n * valore di “comprare A[1/n * valore di “comprare A11” dato “petrolio in A” dato “petrolio in A11” +” +– (n-1)/n * valore di “comprare un altro lotto” dato “niente petrolio in A(n-1)/n * valore di “comprare un altro lotto” dato “niente petrolio in A11” ] – 0” ] – 0– = =

nknn

k

n

nk

n

n

n/

)1(

1)1(1=

−−

+−


1919

Formula generaleFormula generale

ne)informazio perfetta della valoreVPI(

)|()),|()|(()(

: valoripossibili i su tutti atteso guadagno il calcolare dobbiamo

osconosciut è valorecui il random variabileuna è

),,|()(max),|(

scegliere dovremmo allora , conoscere di Supponiamo

),|()(max)|(

potenziali prove nuove , azioni delle esiti Possibili

corrente azionemiglior , corrente Prova

=

−===

⇒

===

=

=

∑

∑

∑

k jkjejkjkjjE

j

i jkjiiajkje

ejkj

i iia

ji

EEUeEEEUEeEPEVPI

eattualmentE

eEESPSUeEEEU

eE

ESPSUEEU

ESE

jk

jk

αα

αα

α

αα

α


2020

Proprietà del VPI Proprietà del VPI

esequenzial decisione di problemaun diventa gathering"-evidence"

ottimale sempre ènon selezione ogniper VPI remassimizza

,gathered"" essere può prova di elementoun dipiù quando :Nota

)()()()(),(

ordinedall' zaIndipenden

)()(),(

voltedue ottenere di esempio,per considera, additivitàNon

0)( ,

not ,in negativitàNon

,,

⇒

+=+=

+≠

≥∀

jEEkEkEEjEkjE

KEjEkjE

j

jE

EVPIEVPIEVPIEVPIEEVPI

EVPIEVPIEEVPI

E

EVPIEj post hocnexpectatio

kj

Intelligenza Artificiale

Documents

Transcript of Intelligenza Artificiale