Intelligenza Artificiale
-
Upload
cole-pollard -
Category
Documents
-
view
42 -
download
0
description
Transcript of Intelligenza Artificiale
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
11
Intelligenza ArtificialeIntelligenza Artificiale
PreferenzePreferenze
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
22
OutlineOutline
Preferenze razionaliPreferenze razionali UtilitàUtilità DenaroDenaro Utilità multi-attibutoUtilità multi-attibuto Reti di decisioneReti di decisione Valore dell’informazioneValore dell’informazione
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
33
PreferenzePreferenzeUn agente sceglie tra premi (A, B, etc.) e Un agente sceglie tra premi (A, B, etc.) e
lotterie, cioè, situazioni con premi incertilotterie, cioè, situazioni con premi incerti
Lotteria L = [p, A; (1-p), B]Lotteria L = [p, A; (1-p), B]
ABBA
BABA
BABA
ad preferito ènon
tiindifferen sono e
a preferito è
:Notazione
≈≈f
f
p
1-p
L
A
B
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
44
Preferenze razionaliPreferenze razionaliIdea: le preferenze di un agente razionale devono obbedire a vincoli.Idea: le preferenze di un agente razionale devono obbedire a vincoli.Preferenze razionali Preferenze razionali comportamento descrivibile come comportamento descrivibile come massimizzazione dell’utilità attesamassimizzazione dell’utilità attesa
€
Vincoli :
Ordinabilità
(A f B)∨(B f A)∨(A ≈ B)
Transitività
(A f B)∧(B f C)⇒ (A f C)
Continuità
A f B f C⇒ ∃p [p,A;1− p,C] ≈ B
Sostituibilità
A ≈ B⇒ [p,A;1− p,C] ≈ [p,B;1− p,C]
Monotonicità
A ≈ B⇒ (p ≥ q⇔ [p,A;1− p,B] f ≈ [q,A;1−q,B])
Decomponibilità
[p,A;1− p,[q,B;1−q,C]] ≈ [p,A;(1− p)q,B;(1− p)(1−q)C]
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
55
Preferenze razionali (cont.)Preferenze razionali (cont.)La violazione dei vincoli conduce a evidenti contraddizioniLa violazione dei vincoli conduce a evidenti contraddizioniPer esempio: un agente con preferenze intransitive può Per esempio: un agente con preferenze intransitive può essere indotto a dare via tutto il suo denaroessere indotto a dare via tutto il suo denaro
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
66
Massimizzando l’utilità attesaMassimizzando l’utilità attesa
TeoremaTeorema (Ramsey, 1931; von Neumann e Morgenstern, 1944): (Ramsey, 1931; von Neumann e Morgenstern, 1944):Date le preferenze soddisfacenti i vincoli esiste una funzione a valori reali Date le preferenze soddisfacenti i vincoli esiste una funzione a valori reali U tale cheU tale che
Principio MEUPrincipio MEU: Scegliere l’azione che massimizza l’utilità attesa : Scegliere l’azione che massimizza l’utilità attesa Nota: un agente può essere interamente razionale (consistente con MEU) Nota: un agente può essere interamente razionale (consistente con MEU) senza mai rappresentare o manipolare utilità e probabilitàsenza mai rappresentare o manipolare utilità e probabilitàEs., una tabella predefinita per un giocatore perfetto di trisEs., una tabella predefinita per un giocatore perfetto di tris
∑=≈⇔≥
i iinn SUpSpSpU
BABUAU
)(]),;...;,([
)()(
11
f
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
77
UtilitàUtilità
L’utilità associa gli stati a numeri reali. Quali numeri ?L’utilità associa gli stati a numeri reali. Quali numeri ?Approccio standard per stabilire l’utilità umana:Approccio standard per stabilire l’utilità umana:Comparare un dato stato A con una lotteria standard LComparare un dato stato A con una lotteria standard Lp p che ha: che ha: ““miglior premio possibile” umiglior premio possibile” u ^̂ con probabilità p con probabilità p““peggiore catastrofe possibile” upeggiore catastrofe possibile” u ^̂ con probabilità (1-p) con probabilità (1-p) Aggiustare la probabilità della lotteria p fino a quando A è indifferente Aggiustare la probabilità della lotteria p fino a quando A è indifferente rispetto a Lrispetto a Lpp
Continua come prima
Morte istantanea
0.999999
0.000001
Pagare 30 € è indifferente a L
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
88
Scale di utilitàScale di utilità
Utilità normalizzate: uUtilità normalizzate: u^ ^ = 1.0, u= 1.0, u^ ^ = 0.0= 0.0 Micromorts: un milionesimo della possibilità di Micromorts: un milionesimo della possibilità di
morire morire – utile per la roulette russa, pagamento per ridurre i rischi utile per la roulette russa, pagamento per ridurre i rischi
prodotti, etc.,prodotti, etc., QALYs: quality-adjusted life yearsQALYs: quality-adjusted life years
– Utile per decisioni mediche comportanti un rischio Utile per decisioni mediche comportanti un rischio sostanzialesostanziale
Note: il comportamento è invariante per Note: il comportamento è invariante per trasformazioni lineari trasformazioni lineari
U’(x) = kU’(x) = k11U(x) + kU(x) + k2 2 dove kdove k1 1 > 0> 0
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
99
DenaroDenaro Il denaro non si comporta come una funzione di utilitàIl denaro non si comporta come una funzione di utilità Data una lotteria L con valore monetario atteso di EMV(L), Data una lotteria L con valore monetario atteso di EMV(L),
solitamente U(L) < U(EMV(L)), cioè, le persone sono solitamente U(L) < U(EMV(L)), cioè, le persone sono avverseavverse al rischioal rischio
Curva di utilità: per quale probabilità p sono indifferente tra un Curva di utilità: per quale probabilità p sono indifferente tra un premio fisso x e una lotteria [p, € M; (1-p), € 0] per un grande premio fisso x e una lotteria [p, € M; (1-p), € 0] per un grande M ?M ?
I dati si possono (o debbono estrapolare sperimentalmente)I dati si possono (o debbono estrapolare sperimentalmente)
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
1010
Paradosso di S. PietroburgoParadosso di S. Pietroburgo Vi viene chiesto di partecipare ad un gioco in cui una moneta viene Vi viene chiesto di partecipare ad un gioco in cui una moneta viene
lanciata in aria sino a quando il risultato non è “testa”. lanciata in aria sino a quando il risultato non è “testa”. Se “testa” compare al lancio “Se “testa” compare al lancio “nn” , il giocatore vince € ” , il giocatore vince € 22nn . . Quanto paghereste per giocare ?Quanto paghereste per giocare ?
EMV(S.P.)=EMV(S.P.)=
Disposto a pagare qualunque cifra ? Assurdo. Bernoulli (1738) propose Disposto a pagare qualunque cifra ? Assurdo. Bernoulli (1738) propose di misurare l’utilità del denaro su scala logaritmica:di misurare l’utilità del denaro su scala logaritmica:
Quindi per giocare un agente razionale paga sino a € 4 !Quindi per giocare un agente razionale paga sino a € 4 !
∞==∑∑ i
ii
iii TMVTP 2
2
1)()(
2...16
4
8
3
4
212log
2
1)()( 2 =++++==∑∑ i
ii
iii TMVTP
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
1111
Reti di decisioneReti di decisione Aggiungere nodi di azioni e nodi di utilità alle Aggiungere nodi di azioni e nodi di utilità alle
reti di credenza per prendere decisioni reti di credenza per prendere decisioni razionalirazionali
Algoritmo:Algoritmo:– for ogni valore del nodo di azionefor ogni valore del nodo di azione
calcolare il valore atteso dell’utilità del nodo data calcolare il valore atteso dell’utilità del nodo data l’azione e la proval’azione e la prova
– return l’azione MEUreturn l’azione MEU
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
1212
Utilità multiattributoUtilità multiattributo
Come possiamo gestire l’utilità di funzioni a più variabili XCome possiamo gestire l’utilità di funzioni a più variabili X11,,…,X…,Xnn ? ?
Esempio, per la costruzione di un aeroporto, parametri: Esempio, per la costruzione di un aeroporto, parametri: pericoli, rumori, costo di costruzionepericoli, rumori, costo di costruzione– qual è U(Pericoli, Rumore, Costo) ?qual è U(Pericoli, Rumore, Costo) ?
Come possono essere determinate le funzioni di utilità Come possono essere determinate le funzioni di utilità complesse dal comportamento delle preferenze ?complesse dal comportamento delle preferenze ?
Idea 1: identificare le condizioni sotto le cui decisioni Idea 1: identificare le condizioni sotto le cui decisioni possono essere fatte senza la completa identificazione di possono essere fatte senza la completa identificazione di U(xU(x11,…,x,…,xnn))
Tipicamente definire attributi tale che U è monotona in Tipicamente definire attributi tale che U è monotona in ogni parametro.ogni parametro.
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
1313
Dominanza strettaDominanza stretta
La scelta B domina strettamente la scelta A se e solo se La scelta B domina strettamente la scelta A se e solo se – per ogni parametro i, Xper ogni parametro i, Xii(B) (B) ≥ X≥ Xii(A) (e quindi U(B) ≥ U (A) )(A) (e quindi U(B) ≥ U (A) )
La dominanza stretta si riscontra raramente nella praticaLa dominanza stretta si riscontra raramente nella pratica
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
1414
Dominanza stocasticaDominanza stocastica
ottimale attributi gli su tutti stocastica dominanza :butomultiattri Caso
)()()()(
: onedistribuzicon A mentestocastica domina
, onedistribuzi una produce che ,A azionel' allora ,in monotona è Se
)()(
se solo e se onedistribuzi la mentestocastica domina onedistribuzi La
21
22
11
2- 1
21
⇒
≥
≥∀
∫∫
∫∫
∞
∞−
∞
∞−
∞−∞
dxxUxpdxxUxp
ppxU
dxxpdxxpt
pptt
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
1515
Dominanza stocasticaDominanza stocastica
La dominanza stocastica può essere spesso La dominanza stocastica può essere spesso determinata senza le distribuzioni esatte usando determinata senza le distribuzioni esatte usando ragionamenti qualitativiragionamenti qualitativi
Es., i costi di costruzione aumentano con la Es., i costi di costruzione aumentano con la distanza dalla città. Quindidistanza dalla città. Quindi– se Sse S2, 2, è più lontano dalla città rispetto a S è più lontano dalla città rispetto a S11 ne deriva ne deriva
che che
– SS11 domina stocasticamente S domina stocasticamente S22 sui costi sui costi
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
1616
Struttura di preferenza: deterministicoStruttura di preferenza: deterministico
XX11 and X and X2 2 sono sono preferenziabilmente indipendentipreferenziabilmente indipendenti (P.I.) da X (P.I.) da X33 se e solo se se e solo se la preferenza tra <xla preferenza tra <x11,x,x22,x,x33> and <x’> and <x’11,x’,x’22,x’,x’33> non dipende da x> non dipende da x33
Es., <Rumore, Costi, Sicurezza>:Es., <Rumore, Costi, Sicurezza>:<20,000 soffrono, $4.6 miliardi, 0.06 morti/mpm> contro<20,000 soffrono, $4.6 miliardi, 0.06 morti/mpm> contro<70,000 soffrono, $4.2 miliardi, 0.06 morti/mpm><70,000 soffrono, $4.2 miliardi, 0.06 morti/mpm>
TeoremaTeorema (Leontief, 1947): se ogni coppia di attributi è P.I. dal suo (Leontief, 1947): se ogni coppia di attributi è P.I. dal suo complemento, allora ogni sottoinsieme di attributi è P.I. dal suo complemento, allora ogni sottoinsieme di attributi è P.I. dal suo complemento: P.I. mutualecomplemento: P.I. mutuale
TeoremaTeorema (Debreu, 1960): P.I. mutuale (Debreu, 1960): P.I. mutuale ⇒ esiste una funzione di ⇒ esiste una funzione di valutazione additiva :valutazione additiva : V(S)=V(S)=∑∑iiVVii(X(Xii(S))(S))Quindi bisogna determinare Quindi bisogna determinare nn funzioni con singolo attributo; spesso una buona funzioni con singolo attributo; spesso una buona approssimazioneapprossimazione
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
1717
Struttura di preferenza: StocasticaStruttura di preferenza: Stocastica
Abbiamo bisogno di considerare le preferenze sulle lotterie:– X è indipendente dall’utilità di Y se e solo se– le preferenze sulle lotterie X non dipendono da y
U.I. mutuale: ogni sottoinsieme è U.I. dal suo complementoU.I. mutuale: ogni sottoinsieme è U.I. dal suo complemento Sotto tale ipotesi: esiste una funzione di utilità Sotto tale ipotesi: esiste una funzione di utilità
moltiplicativa:moltiplicativa:– U=kU=k11UU11+k+k22UU22+k+k33UU33+k+k11kk22UU11UU22+k+k22kk33UU22UU33+k+k33kk11UU33UU11+k+k11kk22kk33UU11UU
22UU33
Procedure di routine e pacchetti software per Procedure di routine e pacchetti software per generare test di preferenza per identificare varie generare test di preferenza per identificare varie famiglie canoniche di funzioni di utilitàfamiglie canoniche di funzioni di utilità
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
1818
Valore dell’informazioneValore dell’informazione Problema calcolare il valore di acquisire nuovi elementi decisionali.Problema calcolare il valore di acquisire nuovi elementi decisionali. Può essere fatto direttamente dalla rete di decisionePuò essere fatto direttamente dalla rete di decisione Esempio: comperare dei diritti petroliferiEsempio: comperare dei diritti petroliferi
– nn blocchi A blocchi A11, …, A, …, Ann, solo in uno è presente il petrolio, valore stimato , solo in uno è presente il petrolio, valore stimato kk– Probabilità a priori Probabilità a priori 1/n1/n ognuno, mutuamente esclusivi ognuno, mutuamente esclusivi– Il prezzo corrente di ogni blocco è allora Il prezzo corrente di ogni blocco è allora k/nk/n– Il consulente offre una perizia sul blocco AIl consulente offre una perizia sul blocco A11. Costo della consulenza ?. Costo della consulenza ?
Soluzione: calcolare il valore atteso dell’informazione = Soluzione: calcolare il valore atteso dell’informazione = – valore atteso della miglior azione data l’informazione meno il valore atteso della miglior azione data l’informazione meno il – valore atteso della miglior azione senza l’informazionevalore atteso della miglior azione senza l’informazione
Potremmo dire “petrolio in APotremmo dire “petrolio in A11” o “niente petrolio in A” o “niente petrolio in A11”, con probabilità rispettivamente ”, con probabilità rispettivamente 1/n1/n e e (n-1)/n(n-1)/n, ,
– [1/n * valore di “comprare A[1/n * valore di “comprare A11” dato “petrolio in A” dato “petrolio in A11” +” +– (n-1)/n * valore di “comprare un altro lotto” dato “niente petrolio in A(n-1)/n * valore di “comprare un altro lotto” dato “niente petrolio in A11” ] – 0” ] – 0– = =
nknn
k
n
nk
n
n
n/
)1(
1)1(1=
−−
+−
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
1919
Formula generaleFormula generale
ne)informazio perfetta della valoreVPI(
)|()),|()|(()(
: valoripossibili i su tutti atteso guadagno il calcolare dobbiamo
osconosciut è valorecui il random variabileuna è
),,|()(max),|(
scegliere dovremmo allora , conoscere di Supponiamo
),|()(max)|(
potenziali prove nuove , azioni delle esiti Possibili
corrente azionemiglior , corrente Prova
=
−===
⇒
===
=
=
∑
∑
∑
k jkjejkjkjjE
j
i jkjiiajkje
ejkj
i iia
ji
EEUeEEEUEeEPEVPI
eattualmentE
eEESPSUeEEEU
eE
ESPSUEEU
ESE
jk
jk
αα
αα
α
αα
α
Slides Intelligenza Artificiale, VincenSlides Intelligenza Artificiale, Vincenzo Cutellozo Cutello
2020
Proprietà del VPI Proprietà del VPI
esequenzial decisione di problemaun diventa gathering"-evidence"
ottimale sempre ènon selezione ogniper VPI remassimizza
,gathered"" essere può prova di elementoun dipiù quando :Nota
)()()()(),(
ordinedall' zaIndipenden
)()(),(
voltedue ottenere di esempio,per considera, additivitàNon
0)( ,
not ,in negativitàNon
,,
⇒
+=+=
+≠
≥∀
jEEkEkEEjEkjE
KEjEkjE
j
jE
EVPIEVPIEVPIEVPIEEVPI
EVPIEVPIEEVPI
E
EVPIEj post hocnexpectatio
kj