INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato...

36
INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale

Transcript of INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato...

Page 1: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER

Teorie psicologiche del lessico e del significato lessicale

Page 2: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

DEFINIZIONI NEI DIZIONARI

horse noun

1 a solid-hoofed plant-eating domesticated mammal with a flowing mane and tail, used for riding, racing, and to carry and pull loads

New Oxford Dictionary of English

GENUS

DIFFERENTIAE

Page 3: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

DEFINIZIONI NEI DIZIONARI

contascàtti: Dispositivo installato a richiesta presso l’utente per la documentazione del traffico telefonico

(Zingarelli 1995)

maneggevole: Che si puo’ maneggiare facilmente || Fig. trattabile, arrendevole || T. mar. del vento, quando permette l’esecuzione di qualsiasi manovra

(Palazzi-Folena, 1992)

Page 4: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

EVIDENZA IN LESSICOGRAFIA

Su che base vengono Identificate le accezioni di una parola? Sviluppate le definizioni?

WordNet: Un tentativo di fondare la ricerca lessicografica su basi psicologica

Questa settimana: Evidenza psicologica Evidenza da corpora

Page 5: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

RAPPRESENTAZIONE LESSICALE IN PSICOLOGIA E NEI CORPORA

La psicologia e la linguistica dei corpora sono arrivate ad idee simili per quel che riguarda il significato lessicale

Queste idee possono essere utili Per sviluppare lessici piu’ accessibili Per sviluppare metodi automatici per la

scoperta delle accezioni

Page 6: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

EVIDENZA PSICOLOGICA SUL SIGNIFICATO

Semantic priming Teorie dei concetti in psicologia:

Reti semantiche Teoria dei prototipi

Disambiguazione lessicale

Page 7: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

SEMANTIC PRIMING

Uno degli effetti fondamentali rilevati dalla ricerca psicolinguistica a partire dagli anni ’60 Per esempio, Schvaneveldt & Meyer

1971 Udire una parola (o vedere

un’immagine) ATTIVA parole / concetti associati

Page 8: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

SEMANTIC PRIMING: ESEMPIO (SCHVANEVELDT & MEYER)

Page 9: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

ASSOCIAZIONI TRA PAROLE (O CONCETTI)

I risultati di Schvaneveldt ed altri portarono allo sviluppo di teorie del lessico basate sull’associazione

Ed alla compilazione di liste di parole associate sulla base di dati psicologici

Page 10: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

RETI SEMANTICHE: RISULTATI DALLA PSICOLOGIA COGNITIVA

Collins & Quillian, 1969: tempi per decidere se un oggetto ha una certa proprieta’ aumentano a seconda della ‘distanza’ A canary is yellow A canary has feathers A canary eats food

Haviland & Clark 1974, Sanford & Garrod 1979: I looked around the house. The lounge was very spacious.

Page 11: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

LE RETI SEMANTICHE

Page 12: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

RETI SEMANTICHE E LESSICO

Evidenza per relazioni di iponimia

Page 13: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

TEORIE DEI CONCETTI IN PSICOLOGIA: PROTOTIPI

La teoria dominante dei concetti in Psicologia e’ la teoria dei PROTOTIPI proposta da Rosch negli anni ’70

Page 14: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

IL PROBLEMA DI PLATONE

For many concepts, there simply aren’t any definitions” (LM p.14)

A theory that correctly describes the behavior of perhaps three hundred words has been asserted to correctly describe the behavior of the tens of thousands of general names (Putnam)

Page 15: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

WITTGENSTEIN: ‘GAME’

What is common to all games? Are they all ‘amusing’?

Cfr. chess

Or is there always winning and losing? Counterex: child throwing his ball at the wall

Look at the parts played by skill and luck “I can think of no better expression that

FAMILY RESEMBLANCE” ‘games form a family’

Page 16: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

PUTNAM

the term ‘lemon’ not definable by simply conjoining its ‘definining characteristics’ yellow color / tart taste / a certain kind of peel Abnormal members (green lemon) Three legged tiger (Also: three-legged

chair, see below)

Page 17: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

CONCLUSIONE

Le definizioni genus+differentia non riflettono la nostra conoscenza lessicale sui concetti

Page 18: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

EVIDENZA PER TEORIA DEI PROTOTIPI

Typicality effects Is a tomato a vegetable or a fruit? ‘Is this art?’

Failures of transitivity If A is a B and B is a C, is A a C?

Page 19: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

‘Fuzzy’ or ‘graded’ categorization

A necessary and sufficient definition should pick up all the category members and none of the non-members

But this is not what happens: Hampton (1979): no clear division between

members and non-members of 8 categories Kitchen utensils: SINK? SPONGE? Vegetables: TOMATOES? GOURDS?

Agreement on typicality judgments (‘think of a fish, any fish’) Rosch (1975): very high correlation (.97) between

subjects’s typicality rankings for 10 categories

Page 20: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

Typicality effects

The ease with which people judge CATEGORY MEMBERSHIP depends on typicality Rips, Shoben and Smith (1973): Fast to affirm that a robin

is a bird; not so fast to affirm that a chicken is a bird Posner & Keele: similarity to visual pattern

Learning: typical items learned before atypical ones (Rosch Simpson & Miller 1976) Learning is faster if subjects are taught on typical items

Typicality affects speed of inference Rips 1975: Garrod & Sanford 1977: faster reading time for “The bird

came in through the front door” when ROBIN than when GOOSE

Page 21: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

La teoria in breve

Manteniamo rappresentazioni dei concetti sulla base delle loro ‘features’ (TRATTI)

Per ogni classe di oggetti esistono dei rappresentanti piu’ TIPICI

Per decidere se un oggetto e’ una sedia od una poltrona calcoliamo la SOMIGLIANZA tra questo oggetto e la ‘tipica sedia’ e la ‘tipica poltrona’

Page 22: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

FEATURE NORMS

Psychologists have been collecting concept features from subjects at least since Rosch and Mervis (1975)

Different methodologies used (from free association to very tightly controlled)

Three such databases currently available Garrard et al (2001) - GA Vinson and Vigliocco (2004) - VV McRae et al (2005) – MCRA - the largest, also

classified

Page 23: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

SPEAKER-GENERATED FEATURES (VINSON AND VIGLIOCCO)

Page 24: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

FEATURE NORMS (GARRARD)

Page 25: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

What makes an item typical? Rosch & Mervis 1975

Items are typical when they have HIGH FAMILY RESEMBLANCE with members of the category:

Typical items have many of the attributes of members Do not have properties of nonmembers Irrespective of frequency: ORIOLE vs CHICKEN

Evidence 1: checked that subjects agree on typicality for several natural categories

1. Asked subjects to list attributes (actually, check)2. Weighed each attribute by how many items it occurred with within

the category1. ‘SCORE’ indicates how many common features

3. Found that score highly predictive of typicality (.84-.91)Five most typical ‘furniture’ (CHAIR, SOFA, TABLE, DRESSER, DESK) have 13 features in common

Five least typical (CLOCK, PICTURE, CLOSET, VASE, TELEPHONE) had 2 attributes in common

Page 26: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

Rosch and Mervis 1975 (2)

Evidence 2: non-typical elements have more features in common with other categories

Evidence 3: speed of learning with artificial stimuli belonging to 2 classes Items with more features in common with

family easier to learn Items with more features in common with

contrast category harder to learn

Page 27: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

CONCETTI COME ‘CLUSTER’

CHICKEN

GOOSE

ORIOLEROBIN

OSTRICH

Page 28: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

FEATURE NORMS & DIZIONARI

Questi dati sui tratti tipici di concetti raccolti da soggetti potrebbero essere utili per guidare lo sviluppo di definizioni o delle relazioni semantiche in un dizionario tipo WordNet

Page 29: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

FEATURE NORMS PER ELDIT

Un progetto congiunto European Academy Bolzano / UniTN (CIMEC) per raccogliere feature norms su parole in Italiano e Tedesco

Page 30: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

METODI

Dati raccolti da studenti nelle scuole di Bolzano ~70 studenti di lingua madre Italiana e 70

di lingua madre tedesca Raccolto dati su 50 concetti

Page 31: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

RISULTATI

~200 paia concetto / attributo in comune tra tutti e 70 i soggetti tedeschi ed altrettante per gli Italiani

Tipi di proprieta’ piu’ importanti: Iponimia ( il cane e’ un animale ) Parte ( il cane ha le zampe) Qualita’ esterna ( le fragole sono rosse) Comportamento ( il cane abbaia )

Page 32: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

EVIDENZA PSICOLOGICA SULLE ACCEZIONI

Molta ricerca psicologica a partire dagli anni ’70 si e’ occupata del problema della DISAMBIGUAZIONE LESSICALE

Questo tipo di ricerca puo’ aiutare a risolvere il problema della distinzione tra OMONIMIA (gru) e POLISEMIA (bocca)

Page 33: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

DISAMBIGUAZIONE LESSICALE: OMONIMI

Page 34: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

DISAMBIGUAZIONE LESSICALE: POLISEMIA

Page 35: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

CONCLUSIONI

I risultati della ricerca psicologica potrebbero aiutare nello sviluppo di nuovi dizionari Aiutando ad identificare le accezioni Assicurando che le definizioni

contengano le proprieta’ di un concetto che i parlanti della lingua trovano piu’ significative

Page 36: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale.

LETTURE