STATISTICA, CAUSALITA' e TEORIA delle DECISIONI [modalità ... · Guerini U. (2000). -L’epitaffio...

127
Statistica, Causalità e Teoria delle decisioni Bruno Chiandotto Dipartimento di Statistica "G. Parenti" - Università di Firenze Università degli Studi Milano-Bicocca – Dottorato in Statistica Milano, 25 ottobre 2012

Transcript of STATISTICA, CAUSALITA' e TEORIA delle DECISIONI [modalità ... · Guerini U. (2000). -L’epitaffio...

  • Statistica, Causalità eTeoria delle decisioni

    Bruno ChiandottoDipartimento di Statistica "G. Parenti" - Università di Firenze

    Università degli Studi Milano-Bicocca – Dottorato in Statistica

    Milano, 25 ottobre 2012

  • Causalità:relazione misurabile o illusione ?

    Statistica e Causalità: un caso di convergenze parallele ?

    Causality: one word many thingsNancy Cartwright (2004)

  • StatisticaL’inferenza statistica non è Inferenza causale

    “Statisticians rarely refer to causality in their writings and, when they do, it is usually to warn of dangers in the concept. Thus Speed (1990) says “Considerations of causality should be treated as they have always been

    treated in statistics: preferably not at all but, if necessary, then with very great care”. ……

    D. Lindley (2002)

  • Un fatto è certoGli individui,gli enti, le istituzioni,… regolano il

    proprio comportamento basandosi su un sofisticato processo, spesso inconscio, di

    ragionamento causalenon supportato, nella generalità dei casi, da

    dati e analisi statistiche adeguate.

  • Guerini U. (2000). - L’epitaffio della causalità statistica ” (2000). Rivista on-line di Diritto e di Giustizia.

    Reato in genere - Nesso di causalità tra condotta omissiva ed evento - Identità tra causalità attiva e causalità omissiva -Sussunzione sotto leggi scientifiche - Leggi universali e leggi statistiche - Necessità del ricorso a leggi statistiche con un coefficiente percentualistico vicino a cento - Giudizio di alta probabilità logica o elevata credibilità razionale.

    “ Sotto il profilo dell’accertamento, il procedimento utilizzato per stabilire se l’omissione è condizione necessaria non è diverso, ma identico, nella sua struttura, a quello cui si ricorre per giustificare la causalità dell’azione, ossia il giudice, avvalendosi del modello della sussunzione sotto leggi statistiche — ove non disponga di leggi universali — dice che è probabile che la condotta dell’agente costituisca, coeteris paribus, una condizione necessaria dell’evento.

  • Guerini (segue)

    Una spiegazione statistica adeguata del singolo evento lesivo presuppone una legge statistica con un coefficiente percentualistico vicino a cento e deve sfociare in un giudizio sul nesso di condizionamento di alta probabilità logica o di elevata credibilità razionale dove alta ed elevata stanno ad indicare un giudizio che si avvicina al massimo, alla certezza…..”

  • In occasione di un Convegno sui “Fondamenti dell’Inferenza Statistica” tenuto a firenze il 28-29

    aprile 1977, Italo Scardovi (1978), riprendendo un’immagine di E. Neurath (uno degli animatori del

    Circolo di Vienna), che raffigurava la conoscenza induttiva come una nave in avaria che deve essere

    riparata in alto mare senza interrompere la navigazione , osserva:

  • .....Dai tempi di Hume la nave ha imbarcato acqua, e ancora più filosofi. Essi ne affollano il ponte, raccolti in

    schiere agguerrite, deduttivisti, falsificazionisti e verificazionisti,…… . Un’allegra confusione di linguaggi,

    uno scontro continuo di idee. Eppure, la navigazione procede. Vi attendono gli addetti alla scienza, che

    tuttavia non mancano di prestare attenzione al disputar dei loici, anche per il sopraggiungere di strani

    personaggi non proprio filosofi e nemmeno tanto scienziati. Divisi in fazioni irriducibili, costoro si

    affaccendano tra il ponte e le stive, un po’ intenti all’andar per mare, un po’ presi da quel vivace

    argomentare, e comunque pronti a calar scialuppe.Sono gli statistici.

    Oggi la situazione non è cambiata, la nave è ancora in avaria ma i navigatori, sono molti di più, sia nel

    numero che nella specializzazione

  • Dopo una sommaria illustrazione del concetto di causalità verrà delineato lo sviluppo dei due principali

    approcci all’ inferenza statistica, quello classico e quello bayesiano, soffermando l’attenzione su alcuni

    aspetti che consentono d’interpretarli come casi particolari della teoria statistica delle decisioni. Si cercherà, infine, di evidenziare come proprio

    nell’approccio decisionale all’inferenza statistica possano risiedere elementi in grado, per un verso di

    giustificare alcuni sviluppi recenti dell’analisi causale, per altro verso d’individuare il punto di convergenza tra inferenza statistica ed inferenza causale, punto

    che viene identificato nella:

    Teoria causale bayesiana-soggettiva delle decisioni statistiche

  • Schema della presentazione

    Causalità Statistica Inferenza statistica e inferenza causale Teoria (statistica) delle decisioniTeoria causale delle decisioni statistiche Conclusioni

  • DefinizioneCausalità è la relazione tra un evento (la causa) ed un secondo evento (l’effetto) dove il secondo evento viene interpretato come conseguenza del primo evento. L’inferenza statistica causale è il processo attraverso il quale si utilizzano dati statistici(manifestazioni dei fenomeni di interesse) per trarre conclusioni riguardo la presenza o assenza di una relazione di causalità.

  • Nell’uso comune sia l’evento causa che l’evento effetto possono avere natura diversa: si può trattare di singolo eventi o, anche, di oggetti, processi, proprietà, variabili, fatti, stato del mondo, ecc.Inoltre, sia la causa che l’effetto possono avere natura unidimensionale o multidimensionale.

  • Nel percorso teso alla individuazione e misura dei nessi di causalità (inferenza causale), si deve:

    Esplicitare la logica sottostante il percorso che s’intende intraprendere• Data la causa si vuole individuare

    l’effetto ?• Dato l’effetto si vuol risalire alla

    causa ?

    Chiarire la natura della causa• Necessaria• Sufficiente• Necessaria e sufficiente• Contributiva (concorrente)• Osservabile o latente

  • Definire il percorso di causalità• Diretto• Indiretto• Sia diretto che indiretto

    Definire la dimensione del processo• L’effetto è determinato da una sola causa• Si è in presenza di una pluralità di cause

    inoltre

    In presenza di una pluralità di cause• Le cause agiscono in modo indipendente• Le cause interagiscono

  • Tener conto della natura del contesto scientifico

    • Scienze sperimentali• Scienze osservazionali• Scienze quasi sperimentali

    Tener conto dell’ambito disciplinare

    Filosofia della scienza, Epidemiologia, Biologia, Medicina, Psicologia, Sociologia, Economia, Management , Giurisprudenza, Ingegneria, Fisica, Storia, Politica, Teologia,………….

  • Alcuni tra i filosofi e scienziati che hanno fornito contributi rilevanti sul tema della

    causalità

    Platone (428/427 a.c-348/347 a.c.), Aristotele (384/383 a.c-322 a.c.), Machiavelli (1469-1527), Copernico(1473-1543), Bacone (1561-1626), Galileo (1564-1642),Keplero (1571-1630), Cartesio (1596-1650), Huygens(1596-1687), Locke (1632-1704), Newton (1643-1727),………………….

    David Hume (1711-1776)

  • Hume (A treatise on Human Nature,1737/1739)“When we look about us towards external objects, and consider

    the operation of causes, we are never able, in a single instance, to discover any power or necessary connexion; any quality, which binds the effect to the cause, and renders the one an infallible consequence of the other. ... experience only teaches us, how one event constantly follows another; without instructing us in the secret connexion, which binds them together, and renders them inseparable. We then call the one object, cause; the other, effect. We suppose that there is some connexion between them; some power in the one, by which it infallibly produces the other, and operates with the greatest certainty and strongest necessity. I say then, that, even after we have experience of the operations of cause and effect, our conclusions from that experience are not founded on (a priori) reasoning, or any process of the understanding.”

  • Nel volume: An Enquiry Concerning Human Understanding (1748) Hume riprende il tema affermando che:

    “All reasoning concerning cause and effect are founded on experience, and all reasonings from experience are founded on the supposition that the course of nature will continue uniformly the same”.

    Secondo Hume la causalità può essere adeguatamente osservata soltanto in termini di regolarità empiriche, in presenza di:

    - contiguità o associazione (la causa e l’effetto si manifestano insieme)- successione (la causa precede l’effetto)- congiunzione costante (la relazione di causa effetto si deve ripetere nel tempo)

    ma NON PUÒ ESSERE VERIFICATA

  • John S. Mill (1806-1873), pur condividendo la concezione di causalità proposta da Hume, ritiene possibile una verifica empirica della causalità.

    Mill, nel volume “System of Logic” (1843) elenca una serie di metodi (canoni) che possono consentire una valida inferenza induttiva - Method of agreement- Method of Difference- Joint method of agreement & difference- Method of residues- Method of concomitant variation

  • I metodi proposti da Mill sono stati oggetto di una serie innumerevole di critiche, tra queste, la più rilevante riguarda l’assunto che la relazione di causa effetto è unica ed ha natura deterministica. Non si considera, cioè, ne la presenza di cause multiple ne l’interazione tra cause e preclude qualunque possibilità di considerazione degli errori di misura, errori che sono quasi sempre presenti, e spesso interagiscono tra loro, sia nel contesto delle scienze sociali, ma anche nelle scienze biologiche, cliniche, epidemiologiche, …

  • A. Bradford Hill (1897-1991), nel President’s Addres della Convegno della Royal Society of Medicine (1965) “The Environment and Disease: Association or Causation ” elenca nove condizioni minime necessarie affinché sia possibile verificare adeguatamente la presenza di una relazione di causa-effetto:- Strength (of association)- Consistency - Specificity - Temporality (factually necessary for cause to precede effect)- Biological gradient (dose-response relationship)- Plausibility (biological plausibility) - Coherence - Experiment (reversibility)- Analogy (consideration of alternate explanations)

    Ma, nello stesso lavoro, sottolinea che

  • ….“None of my nine viewpoints can bring indisputable evidence for or against the cause-and-effect hypothesis and none can

    be required as a sine qua non. What they can do, with greater or less strength, is to help us to make up our minds

    on the fundamental question - is there any other way of explaining the set of facts before us - is there any other way of explaining the set of facts before us, is there any

    other answer equally, or more, likely than cause and effect?No formal tests of significance can

    answer those questionsSuch tests can, and should, remind us of the effects that the play of chance can create, and they will instruct us in the likely magnitude of those effects. Beyond that they contribute nothing to the 'proof' of our hypothesis.” …..

  • “No formal tests of significance can answer those questions”

    Si tratta di una critica sostanziale alla cosidettaInferenza statistica classica, cioè, all’approccio statistico prevalente negli anni sessanta per la risoluzione dei problemi di inferenza induttiva, in particolare alla:

    - Teoria dei test di significativitàRonald A. Fisher (1867-1947)

    - Teoria del test delle ipotesiJerzy Neyman (1894-1981) e Egon Pearson (1895-1980)

  • Ma la Statistica non si riduce alla solaInferenza Statistica classica, infatti,

    lo sviluppo dell’inferenza statistica, nei suoi filoni principali, può essere riassunto nello schema

    Autore ImpostazioneR.A. Fisher (frequentista)J.Neyman-E. Pearson (frequentista)H. Jeffreys (bayesiana oggettiva)B. deFinetti- L.J. Savage (bayesiana soggettiva)

    Teoria statistica delle decisioni

    Teoria causale delle decisioni statistiche

    Inferenza statistica classica

    Inferenza statistica bayesiana

  • Inferenza statistica: approcci alternativi

    Fiduciale (Fisher, 1930, 1935, 1956)Verosimiglianza (Barnard, 1949; Birnbaum, 1962; Edwards,

    1972; Azzalini, 1996; Royall, 1997)Plausibilità (Barndorff-Nielsen, 1976)Strutturale (Fraser, 1968)Pivotale (Barnard, 1985)Prequentiale (Dawid, 1984, 1997)Predittiva (Geisser, 1993)..........

  • John Arbuthnot (1667-1735) nell’articolo “An Argument for Divine Providence, taken from the Constant Regularity observed in the Births of both Sexes”. Philosophical Transactions of the Royal Society of London 27 (1710). afferma:

    … “Among innumerable Footsteps of Divine Providence to be found in the Works of Nature, there is a very remarkable one in the exact Balance that is maintained between the Numbers of Men and Women; for by this means it is provided, that the Species may never fail, nor perish, since every Male may have its Female, and of a proportional Age.This Equality of Males and Females is not the Effect of chance but Divine Providence, working for a good End, which I thus demonstrate.” …

  • Karl Pearson (1857-1936) nel volume: “The Grammar of Science” (1890) in apertura del Cap. 5 (Cause and effect – Probability) afferma:

    “The discussion of the previous chapter has led us to see that law in the scientific sense only describes in mental shorthand the sequences of our perceptions. It does not explain why those perceptions have a certain order nor why that order repeats itself; the law discovered by science introduces no elements of necessity into the sequence of our sense-impressions; it merely gives a concise statement of how changes are taking place. That a certain sequence has occurred and recurred in the past is a matter of experience to wich we give expression in the concept of causation. …….. Science in no case can demonstrate any inherent necessity in a sequence, nor prove with absolute certainty that it must be repeated. Science for the past is a description, for the future a belief; it is not, and has never been, an explanation, if by this word is meant that science shows the necessity of any sequence of perceptions.” ……. (segue)

  • ………The old view of cause and effect tried to subsume the universe under these two conceptual limits to experience and it could only fail; things are not in our experience either independent or causative.All classes of phenomena are linked together, and the problem in each case is how close is the degree of association.Likeness of causes produces likeness of effects; we can measure the degree of likeness, whether we are dealing with a chemical reaction or with the resemblance in any aptitude between parent and child.There is no question of absolute sameness in either case; there is a wide degree of difference in the likeness, but both problems are only variants of one and the same logical problem the contingency problem at the basis of modern science.

  • Yule (1871-1951) nell’articolo: “An Investigation into the Causes of Changes in Pauperism in England, Chiefly During the Last Two Intercensal Decades” (1899), afferma:

    … “The various causes that one may conceive to effect changes in the rate of pauperism may for clearness be classified under some five heads:(1.) Changes in the method, or strictness, of administration of the law. (2.) Changes in economic conditions, e.g., fluctuations in trade, wages, prices, and employment.(3.) Changes of a general social character, e.g., in density of population, overcrowding, or in the character of industry in a given district.(4.) Changes more of a moral character, illustrated, for example, by the statistics of crime, illegitimacy, education, or possibly death-rates from certain causes.(5.) Changes in the age distribution of the population. …

  • Yule aveva come obiettivo l’individuazione delle cause della povertà in Inghilterra, a tal fine

    utilizza il modello di regressione, passando dalla misura della presenza di interrelazione

    (associazione) tra caratteri, a quello della misura della relazione inserendo la direzionalità nel

    legame associativo.

    Si tratta di uno dei primi tentativi di utilizzo di modelli statistici di regressione per la risoluzione

    dei problemi di inferenza statistica causale

  • La metodologia impiegata da Yule è stato oggetto di innumerevoli critiche rivolte, soprattutto, alla pretesa

    di voler attribuire una valenza causale alle misure ottenute. Yule era, comunque, del tutto consapevole

    della debolezza delle sue argomentazioni; infatti, nella nota 25, riportata a piè di pagina del suo lavoro,

    afferma: “Strictly,for " due to " read " associated with."

    Changes in proportion of old and in population were much the same in the two groups in all cases. The

    assumption could not have been made, I imagine, had the kingdom been taken as a whole.

  • Il percorso tracciato da Yule è stato un paradigma di riferimento per molti contributi successivi riferiti a contesti osservazionali, ai quali si possono, però, rivolgere critiche aventi sostanzialmente la stessa natura di quelle rivolte a Yule.- Modelli di regressione semplice, multipla e multipla

    multivariata, lineari e generalizzati - Modelli di analisi delle varianza e della covarianza.- Modelli ad equazioni simultenee (sviluppati in ambito

    econometrico a partire dai lavori classici della Cowles Commission)- Modelli di analisi fattoriale (sviluppati in ambito sociometrico)- Modelli ad equazioni strutturali- Modelli multilivello- Modelli multilivello ad equazioni strutturali

  • Se per un verso la grande rilevanza dei contributi forniti non può che essere apprezzata, per altro verso,

    non si può non sottolineare la debolezza delle conclusioni cui, in forma implicita, ma spesso anche esplicita, molti autori sono pervenuti attribuendo,

    senza un’adeguata verifica, valenza causale ai risultati ottenuti attraverso l’impiego dei modelli statistici di

    regressione.

    Viene attribuita, cioè, una valenza di inferenza causale a risultati la cui validità non travalica i

    confini propri dell’inferenza statistica.

    Association is not causation

  • Tra gli autori che, per rilevanza e profondità delle argomentazioni svolte, hanno fornito i contributi più interessanti riguardo all’uso improprio dei modelli statistici va collocato

    David A. Freedman (1938-2008)Sul tema della causalità Friedman è intervenuto più volte fornendo sempre contributi estremamente significativi; si segnalano in particolare gli articoli:

    From association to Causation via Regression (1997).From Association to Causation: Some Remarks on

    the History of Statistics (1999).Statistical Models for causation: A critical Review (2005).

  • Risposta a Hume

    l’Inferenza statistica classica

  • Hume (1739) sostiene che l'induzione è irrazionale, la realtà può essere soltanto osservata.Karl Pearson (1857-1936) condivide questa impostazione ma propone strumenti quantitativi (statistici) in grado di facilitare la comprensione della realtà. Ronald A. Fisher (1867-1947), Jerzy Neyman (1894-1981) e Egon Pearson (1895-1980), non sembrano condividere tale opinione e propongono l’introduzione di modelli che, semplificando la realtà, non solo ne facilitano la compresione ma consentono anche, sulla scorta delle sole informazioni “oggettive” (risultanze campionarie), la risoluzione razionale dei problemi di induzione (inferenza statistica classica/frequentista).

  • Le procedure proposte proposte da Fisher e da Neyman-Pearson trovano giustificazione nelle loro prestazioni sotto l’ipotesi teorica della ripetibilità dell'esperimento, gli unici dati utilizzati sono quelli che derivano dall’esperimento. - Nell'approccio Fisheriano, l'enfasi è posta sul semplice test di significatività=rifiuto dell’ipotesi nulla (principio della falsificazione trattato estesamente dal filosofo K.A. Popper), sulla funzione di verosimiglianza e sul principio di sufficienza.- Nell’approccio di Neyman-Pearson, i requisiti operativi vengono ulteriormente enfatizzati, oltre alpossibile rifiuto dell’ipotesi di lavoro (ipotesi nulla), viene introdotta un’ipotesi alternativa. Sulla scorta dell’evidenza campionaria si decide in favore dell’una o dell’altra ipotesi.

  • Una ulteriore rilevante differenza tra l’approccio di Fisher e quello di Neyman-Pearson riguarda la problematica degli intervalli di stima: intervalli fiduciali per il primo autore, intervalli di confidenza per i secondi. L’obiettivo che si vuol perseguire ricorrendo alla stima attraverso l’impiego degli intervalli è lo stesso ma l’interpretazione del risultato è concettualmente diversa. Fisher interpreta gli intervalli attribuendogli una valenza che trova giustificazione teorica solo nel contesto bayesiano. Al riguardo, Savage (1961) scrive: “Fisher's school, with its emphasis on fiducial probability

    -a bold attempt to make the Bayesian omelet without breaking the Bayesian eggs -

    may be regarded as an exception to the rule that frequentists leave great latitude for subjective choice in statistical analysis.”

  • Con i test di significatività, Fisher ha rivoluzionato la teoria e la pratica statistica, Popper, che ha sviluppato la metodologia falsificazionista, ha avuto un'influenza simile nel contesto della filosofia della scienza. Entrambe le soluzioni al problema di apprendimento razionale si basano sullo stesso principio, vale a dire, che è razionale accettare ipotesi se sono “sopravvissute” a test rigorosi (corroborate nella terminologia di Popper).

  • Risposta a Hume, un percorso diverso:

    l’Inferenza statistica bayesiana

  • Hume (1739) sostiene che l'induzione è irrazionale:“la realtà può essere soltanto osservata”

    Thomas Bayes (1702-1761), Pierre S. Laplace (1749-1827)sostengono invece che il processo di apprendimento è razionale e procede assegnando delle probabilità alle cause, tali probabilità (a priori) vengono poi aggiornate alla luce dell'esperienza (probabilità a posteriori).In Laplace il significato da attribuire alle probabilità a priori non è del tutto chiaro e per determinare tali probabilitàfa riferimento quello che è usualmente detto

    principio della ragione insufficiente

  • John M. Keynes (1883-1946) e Rudolf Carnap (1891-1970) hanno cercato di superare le critiche rivolte all'approccio di Laplace interpretando la probabilità a priori come una misura della relazione logica tra affermazioni ma non sono riusciti nell’intento: la probabilità logica come da loro definita non è univoca.Una concezione alternativa di probabilità logica, quella proposta da Harold Jeffreys (1891-1989) .

  • L’approccio di Jeffreys all’inferenza ha la stessa natura di quello di Fisher: cosa si può ragionevolmente concludere riguardo ad un modello ipotizzato sulla scorta di dati osservati?Ma, al contrario di Fisher, Jeffreys sostiene che per raggiungere un tale obiettivo è necessaria una diversa concezione della probabilità, in particolare, un ragionevole grado di fiducia capace di rappresentare la mancanza di conoscenza; si tratta in sostanza di una riproposizione aggiornata della distribuzione a priori non informativa di Laplace.

  • Frank P. Ramsey (1931) e Bruno de Finetti (1937), indipendentemente l'uno dall'altro, hanno criticato sia la definizione frequentista di probabilità sia la definizione logica proponendo una versione soggettiva o personalistica della probabilità. La loro definizione risolve il problema della non unicità della probabilità logica assumendo che individui diversi con lo stesso bagaglio informativo possano esprimere misure di probabilità diverse per uno stesso evento. La valorizzazione e diffusione in ambito scientifico dei contributi di Ramsey e de Finetti è opera di Leonard J. Savage (1954). A questi due autori, viene attribuita la paternità dell’approccio bayesiano-soggettivoall’inferenza statistica.

  • Sull’approccio bayesiano all’infererenza statistica particolarmente significativi sono anche i contributi, a torto quasi del tutto trascurati nella letteratura internazionale, di Corrado Gini (1938,1943) e Giuseppe Pompilj (1951a, 1951b, 1961). Sul contributo di Pompilj riporto, di seguito, alcuni brani tratti da suoi lavori, mentre per quanto riguarda i contributi di Gini, sui fondamenti della probabilità e della inferenza statistica, si rimanda al recentissimo articolo di Piccinato (2011) che riassume egregiamente il pensiero di questo grande autore.

  • Pompilj (nel volume sulla teoria dei campioni 1961) scrive: ”..Cercherò di illustrare il significato e la portata delle formule di Bayes riportando alcuni brani di un mio articolo della rivista Archimede (1951a).L’esperienza quotidiana ci pone continuamente di fronte a contrasti apparentemente paradossali perché in essi le parti invocano, a sostegno delle opposte tesi, gli stessi fatti, su cui perfettamente concordano. Come mai, …., le parti concordano sui fatti (e talvolta anche nei minimi particolari di questi fatti) ed arrivano poi a conclusioni contrastanti? …….”.

  • Pompilj (segue) …..Attraverso quale meccanismo ciascuno di noi si persuade di certe interpretazioni? Qual è di questa persuasione la componente soggettiva e quella oggettiva? Si tratta di problemi assai vecchi ; e non può certo soddisfare la spiegazione dogmatica degli antichi sofisti: l’uomo è la misura di tutte le cose …….Nei Sei personaggi in cerca di autore quando il Capocomico” interrompe la tirata della figliastra esclamando: veniamo al fatto; veniamo al fatto, signori miei! Queste sono discussioni – Il padre, il personaggio padre interviene chiarendo:

  • Pompilj (segue)

    Ecco, sissignore! Ma un fatto è come un sacco: vuoto non si regge: perché si regga, bisogna prima farci entrar dentro la ragione e i sentimenti che lo han determinato.Questa battuta del padre contiene la vera essenza del problema testé delineato; perché una volta riconosciuto, secondo l’immagine pirandelliana, che un fatto è come un sacco, possiamo facilmente capire come a seconda di quel che ci si mette dentro potrà assumere un aspetto piuttosto che un altro. …..”

  • Ancora, nel suo contributo sulla “logica della conformità” (1951b), Pompilj scrive: ”….. Voglio invece osservare che non solo la conformità è concettualmente diversa dalla plausibilità, ma che addirittura nel nostro ordine di idée, un problema della plausibilità o significatività non ha senso, perché non è lecito domandarsi se un modello è vero o falso quando si può sempre rispondere che, a stretto rigore, ogni modello è falso, in quanto non coincide con la realtà.Questo, naturalmente, non vuol dire che una teoria della significatività non abbia senso, ma solo che essa non può servire per discutere se il modello è vero,….”.

  • Pompilj (segue) ….. mentre invece il suo uso, correttamente fatto nell'ambito del modello, può diventare utilissimo, purché lo schema teorico di per se stesso già affermi che possono agire più cause e per di più fornisca tutti i dati necessari per una corretta applicazione di tali teorie, di modo che di volta in volta, e sempre relativamente al modello che sta alla base delle nostre indagini, si possa inferire, dall'esame dei risultati sperimentali, sulle cause che hanno agito. Ma fuori di questo modello, che deve essere considerato preesistente e indiscutibile, ogni indagine in tal senso risulta necessariamente vana!”

  • Pompilj anticipa di circa 30 anni un concetto, cui si fa quasi sempre riferimento quando si affronta il tema dell’uso di modelli (probabilistici e statistici) nella ricerca scientifica, la cui paternità è attribuita a G. E. P. Box (1979). All models are wrong but some are usefulA conclusione analoga si perviene se si considera la produzione scientifica di Gini. Questo autore, oltre ad essere stato precursore (Gini, 1911) di quello che viene usualmente definito come approccio bayesiano empirico all’inferenza statistica (Chiandotto, 1978), in due contributi (1938 e 1943) anticipa gran parte delle critiche rivolte, negli anni successivi, alla teoria dei test di significatività dai sostenitori dell’approccio bayesiano all’inferenza statistica.

  • D. Hume (1711-1776)(L’induzione non è razionale)

    x

  • R x x

    K. Pearson (1857-1936)Rifiuta la causalità

    “ASSOCIATION IS NOT CAUSATION”

  • R.A. Fisher (1890-1962), J. Neyman (1894-1981), E.Pearson (1895-1980)

    /f x X

  • T. Bayes (1702-1761), P. S. Laplace (1749-1827)

  • /x f x

    /

    //

    Formula di Bayesf x

    xE f x

    Inferenza statistica Neo-bayesianaF. P. Ramsey (1903-1930), B. de Finetti(1906-1985), L. J. Savage (1917-1971)

  • Teoria delle decisioni

  • Oggetto di studio della teoria delle decisioni è il processo decisionale. Attraverso l’analisi del comportamento degli attori (individui o gruppi) coinvolti nel processo stesso; si procede, cioè, all’esame di come i decisori prendono o dovrebbero prendere delle decisioni.In questa ottica si è soliti distinguere la teoria delle decisioni in due filoni principali: teoria normativa e teoria descrittiva. Chi si occupa di teoria descrittiva cerca di scoprire come le decisioni vengono prese nei diversi contesti operativi; chi si occupa di teoria normativa analizza il modo con cui le decisioni dovrebbero essere prese facendo riferimento ad agenti idealmente razionali.

  • Allo sviluppo della teoria delle decisioni hanno contribuito cultori di discipline diverse: filosofi e logici, matematici e statistici, psicologi e sociologi, economisti, ecc.

    Le applicazioni della teoria spaziano dalle speculazioni astratte, relative ad agenti idealmente razionali, ai suggerimenti pratici per la risoluzione di specifici problemi decisionali.I teorici della decisione indagano sulle conseguenze logiche di differenti regole decisionali o esplorano gli aspetti logico-matematici di diverse descrizioni di comportamento razionale; gli applicati sono invece interessati all’esame dei processi decisionali così come gli stessi si svolgono nella realtà.

  • Molti autori (Cox, 1958; Smith, 1965; Barnett, 1999) affermano che una distinzione deve essere fatta tra inferenza statistica e teoria statistica delle decisioni.. Ma alcuni autori come Savage (1951) e Lindley (1965, 2006), e questo è anche il mio parere, considerano la teoria statistica delle decisioni come una naturale generalizzazione dell’inferenza statistica.Inoltre, l'approccio decisionale, combinando varie teorie di inferenza statistica, evita i dogmatismi che possono portare a situazioni paradossali, è esente da errori logici, è più efficace nel contesto applicativo e tratta con successo una gamma più ampia di problemi rispetto agli approcci tradizionali.

  • I fondamenta della teoria (normativa) delle decisioni sono dovuti a Von Neumann e Morgenstern (utilità attesa – UE, 1947) e a Savage(utilità soggettiva attesa – SEU, 1954). Questi autori, sulla base di una serie di postulati, o assiomi di comportamento razionale del decisore, dimostrano l'esistenza di una funzione di utilità a valori reali (che può essere determinata), ed il decisore consegue il massimo beneficio massimizzando l’utilità attesa associata ad ogni singola decisione.

    L'approccio decisionale fornisce una soluzione soddisfacente al cosiddetto problema pragmatico dell’induzione.

  • Tavola di decisione (conseguenze)

    1 2

    1 11 1 1 1 2

    2 2 1 2 2 2 2

    1 2

    1 2

    j k

    j k

    j k

    i i i i j i k

    h h h h j h k

    A z io n eS ta to d i n a tu r a

    c ca c ca c c c c

    a c c c c

    a c c c c

  • Tavola di decisione (utilità)

    1 2

    1 1 1 2 111

    2 2 1 2 2 2 2

    1 2

    1 2

    , , ,,

    , , , ,

    , , , ,

    , , , ,

    j k

    kj

    j k

    i i i i j i k

    h h h h j h k

    AzioneStato

    u a u a u au aa

    a u a u a u a u a

    a u a u a u a u a

    a u a u a u a u a

  • Usualmente si distinguono le decisioni a seconda del contesto informativo in cui l’agente opera in:

    Decisioni in situazioni di certezza “ “ “ “ rischio “ “ “ “ incertezza “ “ “ “ estrema incertezza

    Una classificazione “più statistica” è:

  • Decisione in assenza assoluta di informazioni(teoria classica delle decisioni)Decisione basata sulle sole informazioni a priori(teoria bayesiana delle decisioni)Decisione basata sulle sole informazioni campionarie (teoria statistica classica delle decisioni)Decisione basata su informazioni campionarie e informazioni a priori (teoria statistica bayesiana delle decisioni).

  • Struttura generale del processo decisionale

    Gli elementi che possono entrare in gioco nello svolgimento di un qualunque processo decisionale, sia in termini di spazi di riferimento che

    di funzioni, nelle diverse strutturazioni e fattispecie operative, sono:

    Spazio parametrico o spazio degli stati di natura; in molte situazioni tale spazio è Rh e può trattarsi sia di uno spazio discreto che di uno spazio continuoSpazio delle azioni finali (si assume che lo spazio sia discreto)Spazio delle prove o degli esperimentiSpazio o universo dei campioni come risultato di ciascuna prova o esperimentoSpazio delle decisioni.

  • In aggiunta agli spazi appena definiti risulta conveniente introdurre esplicitamente almeno tre funzioni:

    funzione di utilità - si tratta di una funzione che associa a ciascuna azione e stato di natura una conseguenza espressa in termini di utilità;funzione di decisione - funzione che proietta ciascun punto dello spazio campionario nello spazio delle azioni;funzione di perdita - si tratta di una funzione che associa a ciascuna azione e stato di natura una conseguenza espressa in termini di perdita.

  • Tavola di decisione (in assenza di informazioni)

    1 2

    1 11 1 1 1 2

    2 2 1 2 2 2 2

    1 2

    1 2

    : ,

    j k

    j k

    j k

    i i i i j i k

    h h h h j h k

    i j i j

    A z i o n eS t a t o

    u ua u ua u u u u

    a u u u u

    a u u u u

    F u n z i o n e d i u t i l i t à u u a

  • Criterio del max-min o criterio di Wald.

    * max (min )ijjia u

    Criterio del max-max.

    * max (max )iji ja u

    Criterio di Hurwicz.

    * max min (1 ) max ij ijji ja u u Criterio di Savage o del min-max rimpianto.

    max ij ij ijir u u

    )r max( min *a ijji

    Criterio di Laplace o della ragione insufficiente.

    1

    * max n

    ijij

    a u

  • Tavola di decisione (con informazioni a priori)

    1 2

    1 11 11 12

    2 21 22 2 2

    1 2

    1 2

    1

    * max , max ,

    j k

    j k

    j k

    i i i ij ik

    h h h hj hk

    k

    i j i j ji i j

    AzioneStato

    u ua u ua u u u u

    a u u u u

    a u u u u

    a E u a u a P

  • Tavola di decisione (perdite)

    1 2

    1 11 1 1 1 2

    2 2 1 2 2 2 2

    1 2

    1 2

    : ,

    j k

    j k

    j k

    i i i i j i k

    h h h h j h k

    i j i j i j

    A z i o n eS t a t o

    l la l la l l l l

    a l l l l

    a l l l l

    F u n z i o n e d i p e r d i t a l l a u

  • Tavola di decisione (con informazioni campionarie)

    1 2

    1 11 1 1 1 2

    2 2 1 2 2 2 2

    1 2

    1 2

    1 2

    : ,

    , , . . . . ,

    j k

    j k

    j k

    i i i i j i k

    p p p p j p k

    i i j

    n

    D e c i s i o n eS t a t o

    l ld l ld l l l l

    d l l l l

    d l l l l

    F u n z i o n e d i d e c i s i o n e d l d x

    x x x x p u n t o c a m p i o n a r i o

  • Tavola di decisione (con informazioni campionarie)

    1 2

    1 11 1 1 1 2

    2 2 1 2 2 2 2

    1 2

    1 2

    : ,

    , , /

    j h

    j h

    j h

    i i i i j i h

    p P P p j p h

    i j x i j

    x i j i j jx

    D e c i s i o n eS t a t o

    R Rd R Rd R R R R

    d R R R R

    d R R R R

    F u n z i o n e d i r i s c h i o R E l a

    E l d x l d x P x

  • Criterio del max-min o criterio di Wald.

    * min (max )iji jd R

    Criterio del max-max.

    * min (min )iji jd u

    Criterio di Hurwicz.

    * min max (1 ) min ij iji jjd u u Criterio di Savage o del min-max rimpianto.

    min ij ij ijir R R

    ijji* max (min )d R

    Criterio di Laplace o della ragione insufficiente.

    1

    * min n

    ijij

    d R

  • Tavola di decisione (con informazioni a priori e informazioni campionarie)

    1 2

    1 11 1 1 1 2

    2 2 1 2 2 2 2

    1 2

    1 2

    * m i n , m i n ,

    m i n , /

    m i n ,

    i i

    i

    i

    j h

    j h

    j h

    i i i i j i h

    p P P p j p h

    i id d

    i j jxd

    i jxd

    D e c i s i o n e P P P PS t a t o

    R Rd R Rd R R R R

    d R R R R

    d R R R R

    d E R d E R d x

    E l d x f x d x

    l d x

    1

    /k

    j jj

    f x d x

  • Tavola di decisione (con informazioni a priori e informazioni campionarie)

    1

    1

    Regola di decisione Forma estensiva

    * min , /

    min , /

    m

    i

    i

    k

    i j j jxd j

    k

    i j ja jx

    d l d x f x dx

    l a x f x dx

    1

    in , / *i

    k

    i j ja jl a x a

  • Dalla teoria normativa alla teoria prescrittiva delle decisioni

    Anche se il problema della rilevanza degli assiomi sul comportamento del decisore va visto, non nel senso di buona descrizione, ma in quello di buona norma, numerose critiche a tale impostazione hanno indotto diversi autori a formulare assiomatizzazioni alternative: teorie generalizzate dell’utilità (Chiandotto e Bacci, 2004).Per caratterizzare lo sviluppo della teoria delle decisioni in questa direzione alcuni autori hanno suggerito la dizione di teoria prescrittiva (Bell e al., 1988) e quella di teoria costruttiva (Roy, 1993; Tsoukiàs, 2003, 2007) che si caratterizzano, appunto per il fatto che le regole ideali di comportamento razionale devono poter essere tradotte in strumenti direttamente operativi. In particolare si considerano generalizzazioni che trattano gli aspetti :

  • •Violazione della transitività•Effetto certezza•Effetto pseudo-certezza o effetto isolamento•Sovrastima dei bassi livelli di probabilità e

    sottostima di quelli alti•Avversione all’ambiguità•Effetto contesto (assioma dell’indipendenza)•Effetto inerzia•Influenza del dominio delle lotterie

  • I modelli prescrittivi e costruttivi sono dunque orientati ad avvicinare i comportamenti degli individui a schemi decisionali razionalmente coerenti; tali modelli contemplano solitamente assiomi più deboli rispetto a quelli classici o, addirittura, possono anche non trovare inizialmente una giustificazione su base assiomatica; in particolare, essendo l’assioma d’indipendenza quello più frequentemente violato, le nuove teorie impiegano forme più deboli di tale assioma, come l’interrelazione, che portano all’abbandono della proprietà di linearità nelle probabilità. Machina(1982), sviluppa una teoria dell’utilità abolendo del tutto l’assioma d’indipendenza. Altre teorie, invece, rivolgono l’attenzione al non rispetto della proprietà di transitività (Fishburn 1973, 1988).

  • Tra le proposte teoriche più interessanti si segnalano:

    La teoria dell’utilità dipendente dal rango (Quiggin, 1993) La teoria del prospetto (Kahneman e Tversky, 1979) La teoria dell’utilità dipendente dal rango e dal segno (Luce e Fishburn, 1991), che risulta della fusione delle prime due e che costituisce anche la base della generalizzazione (teoria cumulata del prospetto) proposta da Tversky e Kahneman nel 1992.

  • Teoria dell’Utilità Dipendente dal Rango

    Quiggin (1993) propone una teoria nel cui contesto il decisore massimizza l’utilità attesa dell’insieme dei risultati in base alla trasformazione della distribuzione di probabilità e non in base alla trasformazione delle singole probabilità.

  • Teoria del Prospetto

    La teoria del prospetto (Kahneman e Tversky 1979) distingue due fasi nel processo di scelta: la fase di editing e quella di valutazione. La fase di editingconsiste in un’analisi preliminare delle lotterie offerte, in modo da giungere ad una rappresentazione più semplice, tramite una riorganizzazione e riformulazione delle opzioni.

  • Le idee di base delle due teorie appena descritte, cioè assegnazione dell’utilità in base all’ordine dei risultati (teoria dell’utilità dipendente dal rango) e assegnazione di utilità diverse a risultati negativi e positivi e loro dipendenza dallo status quo (teoria del prospetto), possono essere combinate in una nuova tipologia di teorie: le Teorie dell’utilità dipendente dal rango e dal segno. Un esempio di tale tipo di teorie è la Teoria del prospetto cumulata (Tversky e Kahneman 1992)

  • La teoria delle decisioni, anche nelle versioni generalizzate, non è strumento adeguato di supporto nello svolgimento dei processi decisionali poiché:

    non considera le situazioni nelle quali la scelta operata dal decisore ha un effetto, più o meno rilevante sullo stato di natura e, quindi, sulle conseguenze

    non vengono specificate le relazioni tra azioni e conseguenze.

  • Se la scelta operata dal decisore ha un impatto sulle conseguenze diventa essenziale tutta la problematica relativa alla analisi della causalità, sia nei suoi aspetti teorici che nelle sue implicazioni operative.

  • Nonostante gli innumerevoli sviluppi anche le teorie generalizzate dell’utilità non risultano del tutto adeguate quale strumento di supporto ai processi decisionali. Infatti tali teorie trattano, nella quasi totalità dei casi, le situazioni nelle quali le conseguenze cui il decisore va incontro dipendono dallo stato di natura nell’ipotesi che l’azione non abbia alcun effetto sullo stato di natura, un’ipotesi questa che in molti contesti decisionali non risulta soddisfatta. Accade spesso, infatti, di incontrare situazioni nelle quali la scelta operata dal decisore ha un effetto, più o meno rilevante sullo stato di natura, pertanto, sulle conseguenze la scelta del decisore avrà effetto indiretto che passa attraverso lo stato di natura.In questo contesto diventa essenziale tutta la problematica relativa all’analisi della causalità, sia nei suoi aspetti teorici che nelle sue implicazioni operative.

  • Dall’inferenza statistica All’Inferenza causale

  • In letteratura sono stati proposti approcci diversi, basati nella quasi totalità su modelli statistici di regressione, per l’analisi della causalità nei contesti osservazionali: dal metodo delle risposte potenziali proposto da Rubin (1974, 1978, 1997, …..) (che riprende e sviluppa un approccio proposto da Neyman nel 1923),Holland e Rubin (1983), Rosenbaun e Rubin (1983), Holland (1986, 1988), Robins (2003), Hirano e Heckman (2005), Heckman e Vytlacil (2005), a quelli sviluppati nell’ambito degli studi sull’intelligenza artificiale, soprattutto ad opera di Pearl (1988, 1995, 2000, 2003) e di Spirtes, Glymour e Scheines (1993, 2000).

  • Tra gli altri, per la loro rilevanza, vanno segnalati anche i contributi: - degli statistici Dawid (1979, 2000, 2002), Lauritzen(2001, 2003), Lauritzen e Ricchardson (2002), Dempster(1967), Shafer (1976)- dell’econometrico Granger (1969)- dei filosofi della scienza Gibbard e Harper (1976) ), Lewis (1973, 1981, 1986), Skyrms (1979, 1982), Cartwright (2006), Sobel (1990,1994) e Woodward(2003).

  • Classificazione dei diversi approcci all’Inferenza causale in contesti osservazionali

    - Metodi delle risposte potenziali (Neyman, Rubin, Holland, .....)- Approccio controfattuale (Lewis, Robins, ....)- Modelli grafici (Spirtes et al., Pearl, Lauritzen, Dawid, Woodward ....)- Modelli ad equazioni strutturali (Pearl, ....)- Metodo di Dempster-Shafer (Dempster, Shafer, ....)- Granger causality (Granger, ... )..................

  • I differenti approcci alla causalità elencati sono caratterizzati da proprie particolarità che, a detta degli stessi autori, non li rendono compatibili: ciascun autore ritiene il proprio approccio superiore a tutti altri, atteggiamento questo (diversità e superiorità) che non appare a chi scrive condivisibile, sia perché i diversi approcci si caratterizzano per alcuni tratti fondamentali comuni sia perché, come sempre accade, non esiste, ne può esistere, uno strumento statistico-metodologico universale in grado di fornire la risposta più soddisfacente in tutte le situazioni di ricerca.

  • Nella generalità dei casi è proprio attraverso l’usocombinato di strumentazioni diverse, che spesso non sono cosi diverse, come chiaramente evidenziato da White e Chalak (2006) nel lavoro “A unified Framework for Defining and Identifying Causal Effects, che si riescono a conseguire i risultati più interessanti e significativi.

  • Riguardo all’uso combinato di approcci diversi si riporta quanto affermato da Lauritzen nella discussione al lavoro :” Direct and Indirect Causal Effects via Potential Outcomes” di Rubin (2004).

    “….In the modern revival of interest in causal inference in statistics, a number of competing formalisms prevail such as structural equations (Pearl, 2009), graphical models (Spirtes et al., 1993; Pearl, 1995a; Lauritzen, 2001; Dawid, 2002), counterfactual random variables (Robins, 2003), or potential responses (Rubin, 1974, 1978; Holland, 1986). Much energy has been used to promote the virtues of one formalism versus the other, seemingly without coming nearer to a consensus; see the somewhat relentless discussion of Dawid (2000).

  • Professor Rubin’s paper advocates the use of potential responses in contrast to graphical models, illustrated with a discussion of direct and indirect effects in connection with the use of surrogate endpoints in clinical trials. Although discussions of this nature can be used to sharpen the minds and pinpoint important issues, I find them generally futile. Personally I see the different formalisms as different ‘languages’. The French language may be best for making love whereas the Italian may be more suitable for singing, but both are indeed possible, and I have no difficulty accepting that potential responses, structural equations, and graphical models coexist as languages expressing causal concepts each with their virtues and vices.

  • It is hardly possible to imagine a language that completely prevents users from expressing stupid things. Personally I am much more comfortable with the language of graphical models than that of potential responses, which I, as also Dawid (2000), find just as seductive and potentially dangerous as Professor Rubin finds graphical models. I certainly disagree with Professor Rubin’s statement that graphical models tend to bury essential scientific and design issues. It is always true that concepts that strongly support intuition in many cases, can seduce one to incorrect conclusions in other cases. Each of us speaks and understands our own language most comfortably but, to communicate in a fruitful way, it is indeed an advantage to learn other languages as well. ….”

  • Woodword (2003) raccoglie in un volume il frutto di una attività trentennale di ricerca presentando una nuova teoria della causalità che contrappone, ritenendola superiore, alla teoria controfattuale sviluppata da Lewis (1981). Il contributo di Woodword si colloca nel filone degli studi di Spirtes, Glymour e Scheines (1993, 2000) e di Pearl (2000, 2009), ma, mentre questi ultimi autori concentrano le loro attenzioni sugli aspetti teorico-metodologici, Woodword si sofferma in particolare sui fondamenti filosofici del ragionamento causale introducendo una semplice, ma chiara, definizione di causalità:

    C causa E se e solo se il valore di E si modifica a ragione di un qualche intervento su C.

  • Woodword presenta gli strumenti per l’analisi causale, grafi ed equazioni, per poi procedere all’esposizione della sua teoria della manipolazione; l’idea dell’intervento sulle variabili causa il punto focale su cui poggia tutto lo sviluppo teorico di Pearl (l’operatore do).

    “No causation Without Manipulation”

    (Attribuita a Rubin)

  • Teoria causale delle decisioni

  • Armendt (1986), nel trattare dei fondamenti della teoria causale delle decisioni, distingue quattro filoni di ricerca, molto simili nei contenuti ma filosoficamente diversi che vengono fatti risalire, rispettivamente a Gibbard e Harper (1976), Sobel(1978), Skyrms (1979) e Lewis (1981). Tutti i filoni si caratterizzano per l’introduzione di un insieme di assiomi di preferenza razionale e per la derivazione di un teorema di esistenza della funzione di utilità in grado di rappresentare le preferenze dei decisori. Purtroppo anche tali tentativi non riescono a fornire una risposta soddisfacente, molto più promettente risulta la proposta di Heckerman e Schachter (1995). Questi due autori sostanzialmente ripropongono la definizione di causa ed effetto di Pearl in termini decisionali; proposta, però, che lo stesso Pearl critica aspramente come segnalano anche gli stessi autori nella discussione al lavoro “Statistics and Causal Inference: A review” (Heckerman e Schachter, 2003):

  • ….“Unfortunately, Pearl has downplayed the strong connections between his work and decision theory as well as the suitability of the influence diagram as a representation of causal interactions. On the contrary, we believe that people who are familiar with decision theory will find comfort, as we have, in these connections. Of course, some statisticians are not familiar with decision theory and will need to understand new concepts whether studying Pearl’s ideas directly or through an initial study of decision theory. In such cases, we believe these researchers might come to an appreciation of Pearl’s work most easily by first gaining an understanding of the implicit decision theory”…...

  • Le obiezioni avanzate da questo autore (Pearl, 2000 e 2003) non appaiono del tutto fondate e i lavori di Sloman e Lagnado (2005), Sloman e Hagmayer (2005), Hagmayer e Sloman, (2006) sembrano confortare ampliamente una tale impressione. D’altra parte i modelli ad equazioni simultanee ed i modelli ad equazioni strutturali sono, sin dalla loro formulazione, sviluppati ed interpretati attribuendo loro una valenza causale, la stessa valenza che è stata attribuita alla path analysis (Wright, 1921, 1935) e ai grafici di influenza (Howard e Matheson, 1984). Una forzatura questa dettata da necessità interpretative collegata ad esigenze operative: l’utilizzazione a fini decisionali (attivazione di politiche di intervento) dei risultati conseguiti attraverso l’impiego dei modelli.Il percorso scientifico intrapreso da Pearl, soprattutto negli sviluppi più recenti, possiede tutti i presupposti per fornire la giustificazione teorica all’interpretazione causale dei modelli ad equazioni strutturali.

  • Tavola di decisione (con informazioni a priori e informazioni campionarie)

    1

    1

    1

    Regola di decisione bayesiana

    * min , /

    max , /

    Regola di decisione bayesiana condizionata

    * max , / , osservo

    *

    i

    k

    i j ja j

    k

    i j ji j

    k

    i j j i ii j

    a l a x

    u a x

    a u a x a a

    a

    1

    max , // , decido

    operatore di

    k

    i j j i ii j

    u a x a a

    do Pearl

  • Tavola di decisione (con informazioni a priori e informazioni campionarie condizionate)

    1 2

    1 11 11 12

    2 21 22 2 2

    1 2

    1 2

    // , // , // , // ,j k

    j k

    j k

    i i i ij ik

    h h h hj hk

    Azione a x a x a x a xStato

    u ua u ua u u u u

    a u u u u

    a u u u u

  • ConclusioniInferenze causali si possono trarre sia da dati sperimentali che non sperimentali. Tuttavia, regole meccaniche non risolvono il problema.L’analisi causale richiede approfondita conoscenza del fenomeno che s’intende analizzare ed un enorme investimento in termini di abilità, intelligenza e il duro lavoro.I dati statistici devono essere raccolti (pianificando laddove possibile la loro raccolta), ipotesi alternative di possibili percorsi causali devono essere adeguatamente verificate.L’inferenza statistica causale, nella versione bayesiana decisionale sommariamente richiamata, può essere di grande ausilio nel percorso di ricerca di nessi causali finalizzati all’attivazione di interventi operativi.

  • CONCLUSIONI: suggerimento ai giovani statistici

    Dedicare una qualche attenzione all’analisi causale in ottica decisionale seguendo un percorso di studio che passa attraverso la lettura preliminare di:Woodword J. (2003). Making Things Happen: a Theory of Causal Explanation, Oxford Studies in the Philosophy of Science.Pearl J. (2009). Causal inference in statistics: An overview. Statistics Surveys, 3.Pearl J. (2012). The Causal Foundations of Structural Equation Modeling. in R. H. Hoyle (Ed.), Handbook of Structural Equation Modeling. New York: Guilford Press.

    Prima di affrontare questo percorso si suggerisce anche un’attenta riflessione su quanto scritto da Lindley D.V. (2002) nell’articolo “Seeing and Doing: the Concept of Causation” . International Statistical Review, 70, 2.

  • …… Whatever is meant by causation, it is clear that it refers to a relationship between quantities, a change in one being the cause of a change in another. ….. The study of causality therefore begins with uncertain quantities, often called random variables, and their probability specification, which can be expressed in several forms. One form is a joint distribution but a preferred method is to place the quantities in some order and use a sequence of univariate distributions. ….. Statisticians have recognized the relevance of order in some cases; for example in passing from correlation between y and x to the regression of y on x , where the former is unaltered when the quantities are interchanged but the latter is not. There is a further point about regression in that there is a distinction between xyp as part of a joint distribution, where it appears together with xp , and xyp where x loses its uncertain status and has been selected. Pearl expresses the distinction as one between seeing X to be equal to x , and controlling X to be x , where upper-case has been used to denote the quantity (variable) and lower-case to describe its value. We will follow him and use the rather imprecise, but most useful, notation xyp in the former case with x random and xdoyp in the latter with x controlled.

    Lindley (2002)

  • When it is useful to emphasize the distinction, he writes xsyp eeinstead of xyp . Much of the book is devoted to the ‘do’ operator and themechanisms for handling it, so providing the calculus of causality mentionedearlier. …….. With these preliminaries, it is now possible to see what is meantby a causal mechanism. We illustrate with the case of three quantities. Asexplained, they are first placed in some order, say u , x , y , and that orderused to describe their joint distribution as

    xuypuxpup , (1)What happens if x is controlled, or selected, and replaced by x do ?

    Clearly x now has no uncertainty, and uyp is no longer relevant, but it isnot clear what happens to the remaining densities in (1). Pearl makes twoassumptions:

    A. up is unaffected by the control of x , and B. in xuyp , , x is replaced by the value selected by the control but

    otherwise remains unaltered. In the ‘do’ notation, xuypxdouyp , , …..

    Lindley (segue)

  • All the procedures developed depend on the ability to order a set of quantities,observed and unobserved, in such a way that assumptions A and B obtain; that is, setting one quantity to a chosen value has no effect on its predecessors and only effects its successors by replacing uncertain x by chosen x , leaving the autonomous, conditional distributions unaltered, x ,, douypxuyp in our illustrative example. Such a system is

    termed a causal mechanism. The whole edifice constructed in the book depends on the validity of A and B, and it is interesting that Pearl does not refer to them as assumptions, but as definitions. …… My first reaction to the strong assumptions A and B, and hence to the whole edifice here constructed, was one of extreme scepticism, but increased exposure to the ideas and to real problems has lessened this appreciably to one where my main reserve concerns difficulties in checking the reasonableness of the assumptions.

    Lindley (segue)

  • Extensive use of causal ideas by scientists and laymen suggests that we dohave an appreciation of order, that x influences y, rather than y influences x,and that we do feel that some structures are autonomous enough to resistinterference by control. Consequently causal mechanisms may be easier tocome by than one might initially think. What is also abundantly clear is that ifthe assumptions are made, then powerful results follow. Also, to be fair,Pearl, in chapter 2, does have useful things to say about the construction ofcausal mechanisms. It appears to be reasonable to accept the assumptionsand explore the rich consequences that flow from them, rather than engage intoo much speculation about their validity, which can be considered if theconsequences appear unsound. There will always exist multivariate situationswhich are not amenable to this treatment, often because no causal structurecan be seen and the quantities have, as a result, no natural order or DAG.”

    Lindley (segue)

  • Un caso di studio: Un modello ad equazioni strutturali per l’acquisizione degli abbonamenti RAI.

    Chiandotto (1981). Rapporto interno, Rai-Radiotelevisione Italiana

    Variabili considerateACRONIMO DescrizioneAIU Abbonamenti acquisiti su interventi effettuatiCUR Contestazioni URAR definite su caricoFNC Fattori non consideratiGEO Gestione ordinaria + coattivaNA % di nuove acquisizioni TVPAE Produttori: avvisi su presentazioniRAE Rivenditori: avvisi su presentazioniRED Reddito pro-famiglia

    RP Numero medio unitario di acquisizioni TV tramiteproduttoriRR Numero medio di acquisizioni TV tramite rivenditoriTAB Tasso di abusivismoUAD Ufficio: avvisi su fonti definite

  • Acquisizione abbonamenti RAIModello ad equazioni strutturali

    1. RAE = f1 ( RR ) 2. PAE = f2 ( RP ) 3. RR = f3 ( TAB, RED ) 4. RP = f4 ( TAB, RED ) 5. GEO = f5 ( TAB, RED ) 6. GEO = f6 ( TAB, RED, RR ) 7. GEO = f7 ( TAB, RED, RR, RP ) 8. AIU = f8 ( TAB, RED, CUR, UAD ) 9. AIU = f9 ( TAB, RED, CUR, UAD, RR ) 10. AIU = f10 ( TAB, RED, CUR, UAD, RR, RP ) 11. AIU = f11 ( TAB, RED, CUR, UAD, RR, RP, GEO ) 12. AIU = f12 ( TAB, RED, CUR, UAD, RR, RP, GEO, RAE ) 13. AIU = f13 ( TAB, RED, CUR, UAD, RR, RP, GEO, RAE, PAE ) 14. NA = f14 ( TAB, RED, CUR, UAD ) 15. NA = f15 ( TAB, RED, CUR, UAD, RR ) 16. NA = f16 ( TAB, RED, CUR, UAD, RR, RP ) 17. NA = f17 ( TAB, RED, CUR, UAD, RR, RP, GEO ) 18. NA = f18 ( TAB, RED, CUR, UAD, RR, RP, GEO,RAE ) 19. NA = f19 ( TAB, RED, CUR, UAD, RR, RP, GEO,RAE, PAE ) 20. NA = f20 ( TAB, RED, CUR, UAD, RR, RP, GEO,RAE, PAE, AIU)

     

  • Scomposizione degli effetti nel modello (causale) per le nuove acquisizioni di abbonamenti TV (NA)

    TAB -0,223 -0,017 -0,017 0,000 -0,028 -0,293 0,017 -0,561 -0,264 -0,825

    RED 0,628 0,009 0,003 -0,014 0,014 -0,070 0,008 0,578 0,210 0,788

    CUR -0,054 0,006 0,007 0,025 0,012 0,010 0,004 0,010 0,294 0,034

    UAD -0,168 -0,005 0,002 0,012 0,002 -0,117 0,000 -0,274 -0,405 0,131

    RR 0,163 0,000 0,005 0,001 -0,101 -0,001 0,067 0,314 0,381

    RP 0,219 -0,016 -0,002 -0,108 -0,001 0,092 0,203 0,301

    GEO 0,017 -0,014 -0,059 -0,001 -0,057 0,116 0,059

    RAE 0,002 0,047 -0,013 0,036 -0,256 -0,220

    PAE -0,231 0,009 -0,322 -0,078 -0,400

    AIU -0,022 -0,022 0,429 0,407

    Variabilipre-determ

    inate

    Effetto Correlazionesem

    pliceDiretto

    Indiretto

    Totale SpurioRR RP GEO RAE PAE AIU

  • Simboli utilizzati nella rappresentazione grafica del modello di analisi

    = Variabili esogene Relazione causale diretta (positiva) unidirezionale = Variabili endogene Relazione causale inversa (negativa) unidirezionale = Variabile endogena d’interesse Relazioni causali bidirezionali

  • Acquisizione abbonamenti RAIModello ad equazioni strutturali- Grafo ed effetto totale

    R2 = 0,91

    UAD -0,0274

    PAE -0,322

    GEO -0,057

    RP 0,092

    RR 0,067

    AIU -0,022

    RAE 0,036 NA

    TAB - 0,561

    RED 0,578

    CUR 0,010

    FNC

  • Chiandotto B. (2012) - Causalità, Statistica e Teoria delle Decisioni: Riferimenti bibliografici

    Arbuthonot J. (1710). An Argument for Divine Providence, taken from the Constant Regularityobserved in the Births of both Sexes, Philosophical Transactions of the Royal Society of London,27, ristampato in Studies in the History of Statistics and Probability Volume II, Kendall M.G. ePlackett R:L: Wycombe H. (eds), Griffin 1977.

    Armendt B. (1986). A Foundations of Causal Decision Theory, Topoi 5.

    Azzalini A. (1996). Statistical Inference Based on the Likelihood, Chapman & Hall.

    Barnard G.A. (1949). Statistical inference, JRSS, Series B, 11.

    Barnard G.A. (1985). Statistical inference. In Encyclopedia of Statistica Science, Vol. 6, Kotz S. eJohnson M.L. (eds).

    Barndorff-Nielsen (1976). Plausibilty Inference, JRSS, Series B, 38.

    Barnett V. (1999). Comparative Statistical Inference, Wiley.

    Bayes T. (1763). Essay Towards Solving a Problem in the Doctrine of Chances. PhilosophicalTransactions of the Royal Society of London, 53.

    Bell D.E., Raiffa H. e Tversky A. (1988). Decision Making, Cambridge University Press.

    Birnbaum A. (1962) On the foundation of statistical inference, JASA, 57.

    Box G:E.P. (1979). Robustness in the Strategy of Scientific Model Building, in Robustness inStatistics, Launer R.L. e Wilkinson G.N. (eds.), Academic Press.

    Cartwright N. (2002). One Word; Many Things, Centre for Philosophy of Natural and Social ScienceCausality: Metaphysics and Methods,Technical Report 07/03.

    Cartwright N. (2006). From Causation to Explanation and Back. In The Future of Philosophy, LeiterB. (ed.), Oxford Clarendon Press.

  • Chiandotto B. (1978). L’approccio bayesiano empirico alla problematica dell’inferenza statistica, in Ifondamenti dell’inferenza statistica. Atti del Covegno, Firenze 28-30 aprile 1977. DipartimentoStatistico dell’Università di Firenze.

    Chiandotto B. e Bacci S. (2004). Decisioni razionali per il governo dell’università, un prerequisitoessenziale: la teoria dell’utilità, Università degli Studi di Firenze.

    Cox D.R. (1958). Some problems connected with statistical inference. Ann. Math. Stat. 29.

    Dawid, A.P. (1979), Conditional Independence in Statistical Theory, JRSS, Series B ,41.

    Dawid, A.P. (1984). Present position and potential developments: some personal views. Statistical

    theory. The prequential approach. JRSS, Series A, 147.

    Dawid, A.P. (1997). Prequential analysis. In Encyclopedia of Statistical Sciences, Kotz S., Read C.B.e Banks D.L. (eds), Wiley.

    Dawid A. P. (2000). Causal inference without counterfactuals, JASA 95.

    Dawid A. P. (2002). Influence diagrams for causal modelling and inference, Int. Stat. Rev. 70, 16.

    De Finetti B. (1937). La prévision: ses lois logiques, ses source subjectives: Annales del’InstitutHenri Poincarré, 24.

    Dempster A.P.(1967). Upper and lower probabilities induced by a multivalued mapping, Ann. Math.Stat., 38.

    Edwards A.W.F. (1972). Likelihood, Cambridge, University Press, 2nd ed. 1992.

  • Fishburn P.C. (1973). A mixture-set axiomatization of conditional subjective expected utility,Econometrica, 41.

    Fishburn P.C. (1988). Normative theories of decision making under risk and under uncertainty. InDecision Making, Bell D:E:, Raiffa H., Tversky A. (Eds.)

    Fishburn.P.C. (1991). Nontransitive Preferences in Decision Theory. Journal of Risk andUncertainty, 4.

    Fisher R.A. (1930). Inverse Probability. Proc. Camb. Phil. Soc., 26.

    Fisher R.A. (1935). The logic of Inductive inference, JRSS. 98.

    Fisher R.A. (1956). Statistical Method and Scientific Inference. Oliver and Boyd.

    Fraser D.A.S.(1968). The Structure of Inference, Wiley.

    Freedman D.A. (1997). From association to causation via regression. In Causality in Crisis? , MckinV.R., Turner S.P: (eds.), University of Notre Dame Press

    Freedman D.A. (1999). From Association to Causation: Some Remarks on the History of Statistics.Stat. Science, Vol. 14.

    Freedman D.A. (2005). Statistical models for Causation.

    http://www.stat.berkeley.edu/~census/oxcauser.pdf

    Geisser (1993). Predictive Inference: An Introduction, Chapman & Hall.

    Gibbard A. e Harper W. (1976). Counterfactuals and Two Kinds of Expected Utility. In Harper W.,Stalnaker R. e Pearce G. (eds.), Conditionals, Belief, Decision, Chance, and Time, Dordrecht-Reidel.

  • Gini C. (1911).Considerazioni sulle probabilità a posteriori e applicazioni l rapporto dei sessi nellenascite umane, Studi Economico-Giuridici dell’Università di Cagliari, ristampato in Metron, Vol. XV,1949.

    Gini C. (1939). I pericoli della statistica, Atti della I Riunione della Società Italiana di Statistica.

    Gini C. (1943). I test di significatività, Atti della VII Riunione della Società Italiana di Statistica.

    Granger C.W.J. (1969). Investigating Causal Relations by Econometric Models and Cross-spectralMethods, Econometrica, Vol. 37.

    Guerini U. (2000). L’epitaffio della causalità statistica, Rivista on-line di Diritto e Giustizia.

    Hagmayer Y. e Sloman S. A. (2005). Causal Models of Decision Making: Choice as Intervention,Proceedings of the Twenty-Seventh Annual Conference of the Cognitive Science Society, Stresa,Italy.

    Heckerman D. e Shachter R. (1995). Decision-theoretic foundations for causal reasoning, J.Artificial Intelligence Res., 3.

    Heckerman D. e Shachter R. (2003). Discussion in Pearl, J. (2003), Statistics and Causal Inference:A Review. Test., 12.

    Heckman J., Vytlacil E. (2005). Structural Equations, Treatment Effects, and Econometric PolicyEvaluation, Econometrica, 73.

  • Hill A.B. (1965). The Environment and Disease: Association or Causation? JRSM, Vol. 58.

    Holland P. (1986). Statistics and causal inference, JASA, 81.

    Howard R.A. e Matheson J.E. (1984). Influence diagrams. In Readings in the Principles andApplications of Decision Analysis, Howard R.A., Matheson J.E. (Eds.). Strategic Decision Group.

    Hume D. (1739). A treatise of Human Nature: Being an attempt to introduce the experimentalMethod of Reasoning Into moral Subjects. Book 1: Of the Understanding. The Project GutenbergEBook. Release Date: December, 2003.

    Hume D. (1739). An Enquiry Concerning Human Understanding, Harvard Classics Volume 37,Copyright 1910 P.F. Collier & Son.

    Jeffrey R.C. (1965). The Logic of Decision. 2nd ed. (1983). Chicago University Press.

    Kahneman D. e Tversky A. (1979), Prospect theory: an analysis of decision under risk,Econometrica ,47.

    Laplace P.S. (1812). Théorie analitique the probabilities. 3rd ed. (1820). Courcier.

    Lauritzen S.L. (2001). Causal inference from graphical models. In Complex Stochastic Systems,Barndorff-Nielsen, Cox e Klüppelberg (Eds.), Chapman and Hall.

    Lauritzen S.L. (2003), Graphical models for surrogates, Bull. Int. Statist. Inst., 60.

    Lauritzen S.L. (2004). Discussion on causality in Rubin, D. B. (2004). Direct and Indirect CausalEffects via Potential Outcomes, Scandinavian Journal of Statistics, 31.

  • Lauritzen S., Richardson T. (2002). Chain Graph Models and Their Causal Interpretations, JRSS,Series B, 64.

    Lewis, D. (1973). ‘Causation’. Journal of Philosophy, 70,. Ristampato con postscritto in,Philosophical Papers, vol. II (OUP, 1986).

    Lewis D. (1981). Causal decision theory, Australasian Journal of Philosophy, 59.

    Lewis, D. (1986). Causal explanation, In Philosophical Papers, volume II, Oxford University Press.. Lindley D.V. (1965). Introduction to Probability and Statistics from a Bayesian Viewpoint, Part 1: Probability, Part 2: inference, Cambridge University Press.

    Lindley D.V. (2002). Seeing and Doing: the Concept of Causation, International Statistical Review,Vol. 70.

    Lindley D. V. (2006). Understanding Uncertainty. J. Wiley.

    Luce R.D. e Fishburn P.C. (1991). Rank and sign dependent linear utility models for finite firstorder gambles, Journal of Risk and Uncertainty, 4.

    Machina M.J. (1982). Expected utility analysis without the independence axiom, Econometrica, 50.

    Mill J.S. (1843). A System of Logic Ratiocinative and Inductive, Being a Connected View of thePrinciples of Evidence and the Methods of Scientific Investigation (Books I-III). In Collected Worksof John Stuart Mill, Volume VII - ed. John M. Robson, Introduction by R.F. McRae (Toronto:University of Toronto Press, London: Routledge and Kegan Paul, 1974).

    Neyman J. e Pearson E.S. (1928). On the use and interpretation of certain test criteria forpurposes of statistical inference. Part. I and II. Biometrika, 20A.

  • Pearl J. (1988). Probabilistic Reasoning in Intelligent Systems. Morgan Kaufmann.

    Pearl J. (1995). Causal diagrams for empirical research, Biometrika, 82.

    Pearl J. (2000). Causality: models, reasoning, and inference, 2nd ed. (2009). Cambridge UniversityPress.

    Pearl J. (2012). The Causal Foundations of Structural Equation Modeling. In Handbook ofStructural Equation Modeling, Hoyle R. H (ed.) New York Guilford Press

    Pearson K. (1892). The grammar of Science, 2nd ed. 1890, Adam and Charles Black, London.http://archive.org/details/grammarofscience00pearuoft.

    Piccinato L. (2011). Gini’s criticism to the theory of inference: a missed opportunity, Metron, Vol.LXIX.

    Pompilj G. (1951a). Lineamenti di una teoria della persuasione, Archimede, 3.

    Pompilj G. (1951b).Logica della conformità, Archimede, 4.

    Pompilj G. (1956). Teoria dei campioni, Applicazioni alla sperimentazione, alla produttività e allerilevazioni campionarie, Ristampa parziale, Veschi, 1961.

    Quiggin J. (1993). Generalized expected utility (the rank-dependent model), Kluwer AcademicPublishers.

    Ramsey F.P. (1931). Truth and probability. In The Foundations of Mathematics and Other LogicalEssays. Braithwaite R.B. (ed.), Routlge & Kegan Paul.

    Robins J.M. (2003). Semantics of causal DAG models and the identification of direct and indirecteffects. In Highly Structured Stochastic Systems, Green P., Hjort N. e Richardson S. (eds), OxfordUniversity Press.

  • Roy B. (1993). Decision science or decision-aid science?, Eur. J. of Oper.Res., 66.

    Royall R. (1997). Statistical Evidence: a Likelihood Paradigm, Chapman & hall.

    Rubin D.B. (1974). Estimating causal effects of treatment s in randomized and non-randomizedstudies, J. Educ. Psychol. 66.

    Rubin D.B. (2004). Direct and Indirect Causal Effects via Potential Outcomes, Scandinavian Journalof Statistics, 31.

    Savage L.J. (1951). The theory of statistical decision, JASA, 46.

    Savage L.J. (1954). The Foundations of Statistics, Wiley.

    Scardovi I. (1978). L’inferenza induttiva nella ricerca scientifica. Annotazioni storiografiche. In Ifondamenti dell’inferenza statistica. Atti del Covegno, Firenze 28-30 aprile 1977. DipartimentoStatistico dell’Università di Firenze.

    Shafer G.(1976). A Mathematical Theory of Evidence, Princeton University Press.

    Skyrms B. (1979). Causal Necessity, Yale University Press.

    Skyrms B. (1982). Causal decision theory, Journal of Philosophy, 79.

    Sloman S.A. e Hagmayer Y. (2005), The causal psycho-logic of choice, Trends in CognitiveSciences, 10.

    Sloman S.A. e Lagnado D.A. (2005). Do we "do"?, Cognitive Science.

    Smith C.A.B. (1961). Consistency in statistical inference and decision. JRSS B, Vol. 25.

  • Sobel J.H.. (1990).Maximization, stability of decision, and actions in accordance with reason,Philosophy of Science, 57.

    Sobel J.H.. (1994). Taking Chances: Essays on Rational Choice, Cambridge University Press.

    Spirtes P., Glymour C. e Scheines R. (2000). Causation, prediction and search, Springer-Verlag,2nd ed. MIT Press.

    Tsoukiàs A. (2003), From decision theory to decision aiding methodology, LAMSADE - CNRS,Université Paris Dauphine.

    Tsoukiàs A. (2007). On the concept of decision aiding process: an operational perspective, Annalsof Operations Research , 154.

    Tversky A. e Kahneman D. (1992). Advances in prospect theory: cumulative representation ofuncertainty, Journal of Risk and Uncertainty, 5.

    Von Neumann J. e Morgenstern O. (1947). Theory of Games and Economic Behavior, 2nd ed.,Princeton University Press.

    White H. e Chalak K. (2006), A Unified Framework for Defining and Identifying causal Effects,UCSD Department of Economics Working Paper.

    Woodword J. (2003). Making Things Happen: a Theory of Causal Explanation, Oxford Studies inthe Philosophy of Science.

    Wright S. (1921). Correlation and causation, Journal of Agricultural Research , 20.

    Wright S. (1934). The Method of Path Coefficients, The Annals of Math. Statistics, Vol. 5.

    Yule G.U. (!899). An Investigation into the Causes of Changes in Pauperism in England, chieflyduring the last two intercensal decades (part I), JRSS, Vol. LXII, II.

  • Bibliografia aggiuntiva

    Allais M. (1953). Le comportament de l’homme rationel devant le risque: critique des axiom etpostulates de l’ecole americane. Econometrica, 21.

    Cantwell J. (2010). On an Alleged Counter-Example to Causal Decision Theory, Synthese, 173.

    Carnap R. (1950). Logical Foundations of Probability. Chicago University Press.

    Cox D.R. e Wermuth N. (2004). Causality: a Statistical View, Int. Stat. Rev., 72.

    Dempster A.P. (1968). A generalization of Bayesian inference, JRSS, Series B, 30.

    Efron B. (1986) .Why Isn’t Everyone a Bayesian..,The American Statistician, Vol. 40.

    Efron B. (2010). The Future of Indirect Evidence, Statistical Science, Vol. 25.

    Efron B. (2010). Rejoinder: The Future of Indirect Evidence, Statistical Science, Vol. 25.

    Egan A. (2007). Some Counterexamples to Causal Decision Theory, Philosophical Review, 116.

    Freedman D. (1999). From Association to Causation: Some Remarks on the History of Statistics.Stat. Science, Vol. 14.

    Frosini B.V. (2006). Causality and Causal models: a Conceptual Perspective, Int. Stat. Rev., 74.

    Gelman A. (2010). Bayesian Statistics Then and Now, Statistical Science, Vol. 25.

  • Geneletti S.G. e Dawid A.P. (2011). Defining identifying the effect of treatment on the treated. InCausality in the Sciences. Illari P.M., Russo F. e Williamson J. (eds.), Oxford Univ. Press.

    Glymour C. (1981). Why I Am Not a Bayesian In Theory and Evidence, Chicago University Press, 6.

    Good I.J. (1960). Weights of evidence, corroboration, explanatory power, information and utility ofexperiment, JRSS, Series B, 22.

    Greenland S. (2010). Comment: The Need for Syncretism in Applied Statistics, Statistical Science,Vol. 25.

    Holland P. (1988), Causal inference, path analysis, and recursive structural equations models. InClogg C. (ed.), Sociological Methodology. American Sociological Association.

    Holland P. e Rubin D. (1988). Causal inference in retrospective studies, Ev. Rev., 13.

    Jeffreys H. (1931). Scientific Inference, Cambridge University Press.

    Jeffreys H. (1936). Theory of Probability, 3rd ed. (1961). Oxford at the Clarendon Press.

    Joyce J. (1999). The Foundations of Causal Decision Theory, Cambridge University Press.

    Joyce J. (2011). A defense of imprecise credence in inference and decision making, Oxford Studiesin Epistemology, Vol. 4.

    Kass R.E. (2010). Comment: How Should Indirect Evidence Be Used?, Statistical Science, Vol. 25.

    Laplace P.S. (1812). Théorie analitique the probabilities. 3rd ed. (1820). Courcier.

    Lauritzen S.L. (2004). Discussion on causality in Rubin, D. B. (2004). Direct and Indirect CausalEffects via Potential Outcomes, Scandinavian Journal of Statistics, 31.

    Martin R., Zhang J. e Liu C. (2010). Dempster–Shafer Theory and Statistical Inference with WeakBeliefs, Statististical Science , Vol. 25.

  • Pearl J. (2001). Bayesianism and causality, or, why I am only a half-bayesian. In Foundations ofBayesianism, Corfield D. e Williamson J. (eds.) Kluwer Applied Logic Series, Kluwer AcademicPublishers, Vol. 254.

    Piccinato L. (2011). Bayesian Statistical Inference: an Overview, Atti del Convegno SIS 2011.

    Popper K.R. (1959). The Logic of Scientific Discovery. Hutchison Education. Prima edizione inTedesco: Logic der Forschung, 1934.

    Pollock J.L. (2002). Causal Probability, Synthese, Vol. 132.

    Price H. (1986). Against Causal Decision TheorY, Synthese, Vol. 67.

    Seidenfeld T. (1979). Why I am not an objective Bayesian; some reflection prompted byRosenKrantz, Theory and Decision, Vol. 11.

    Shafer G. (1990). Perspectives on the theory and practice of belief functions, International Journalof Approximate Reasoning, 3.

    Shafer G.(1996). The Art of Causal Conjecture, MIT Press.

    Sobel M.E. (1990). ‘‘Effect Analysis and Causation in Linear Structural Equation Models.’’Psychometrika, 55.

    Sobel M.E. (1995). Causal Inference in the Social and Behavioral Sciences. In Handbook ofStatistical Modeling for the Social and Behavioral Sciences, Arminger G., Clogg C.C. e Sobel M.E.(eds), Plenum

    Sobel, M.E. (2000). Causal inference in the social sciences. JASA, 95.

    Sobel M.E. (2006).Discussion: ‘The Scientific Model of Causality, Sociological Methodology, Vol. 35.

    Wald A. (1950). Statistical Decision Functions, Wiley.