Capitolo
2
 |
Le
traduzioni che potrete trovare su questo sito
sono unicamente destinate ad uso interno per il
corso di Psicologia della Percezione dell'Università
degli studi di Trieste. Nascono con l'intento
di fornire un ausilio a quegli studenti che non
hanno molta dimestichezza con la lingua inglese.
Le traduzioni sono opera degli stessi studenti
del corso di Psicologia della Percezione 1999
- 2000. Nell'utilizzo di questo materiale va tenuto
conto che la correttezza dello stesso va verificata
confrontando le traduzioni con il testo originale.
Per ulteriori domande, clicca
qui.
|
Approcci
Teorici alla Visione
tradotto
e curato da:
Laura Bortolossi
Cristina Silvestri
Elena Vittone
Elena Burlon
Cristina Zomero
Approcci teorici alla visione 2
2.1
Teorie classiche sulla visione
2.1.1 Strutturalismo
2.1.2 Gestaltismo
Olismo
Isomorfismo Psicofisico
2.1.3 Ottica Ecologica
Analisi della struttura dello stimolo
Percezione diretta
2.1.4 Costruttivismo
Inferenza Inconscia
Interpretazione euristica
2.2 Una breve storia dell'Information Processing
2.2.1 Computer Vision
L'invenzione dei computer
Mondo dei blocchi
Approccio computazionale all'Ottica Ecologica
Connessionismo e Reti Neurali
2.2.2 Psicologia dell'Information Processing
Primi Sviluppi
Registrazione di una singola cellula
Autoradiografia
Tecniche di Brain Imaging
2.3 Teorie dell'Information Processing
2.3.1 La metafora del computer
2.3.2 Tre livelli dell'Information Processing
Il livello computazionale
Il livello algoritmico
Il livello implementazionale
2.3.3 Tre assunzioni sull'Information Procesing
Descrizioni informazionali
Decomposizione ricorsiva
Incorporazione Fisica
2.3.4 Rappresentazioni
2.3.5 Processi
Informazioni Implicite versus Esplicite
Processamento come Inferenza
Assunzioni Nascoste
Processamento Euristico
Assunzioni Nascoste versus Validità Ecologica
Processi Top-down versus Validità Ecologica
2.4 Quattro Stadi della Percezione Visiva
2.4.1 Immagine Retinica
2.4.2 Stadio Basato sull'Immagine
2.4.3 Stadio Basato sulle Superfici
2.4.4 Stadio Basato sugli Oggetti
2.4.5 Stadio Basato sulle Categorie
Gli
scienziati della visione cercano di capire come la conoscenza
dell'ambiente può essere estratta dalla luce
che entra negli occhi. Il sapere scientifico di un dominio
complesso, quale è quello della percezione visiva,
richiede molto di più che una semplice conoscenza
dei fatti; richiede una teoria. Una teoria è
un integrato set di asserzioni (chiamate ipotesi) sui
meccanismi costitutivi o principi che, non solo organizzano
e spiegano i fatti, ma fanno anche delle predizioni.
Esamineremo molte teorie in questo libro. Molte di queste
hanno qualcosa in comune: non sono corrette. Conoscere
teorie diverse, anche incomplete o sbagliate, è
importante perché anch'esse possono contenere
importanti elementi veri o possono proporre un nuovo
e illuminante punto di vista.
Come decidere qual è la teoria migliore? Gli
scienziati usano un principio chiamato rasoio di Ockham:
la miglior teoria è quella più parsimoniosa,
cioè la teoria che spiega i risultati empirici
con meno assunzioni. Alla parsimonia, come criterio
di valutazione, va aggiunta alla consistenza logica
e all'adeguatezza empirica.
________________________________________________________________________________
2.1 TEORIE CLASSICHE DELLA VISIONE
Kurt
Koffka (1935), psicologo gestaltista, enucleò
meglio di chiunque altro il problema della percezione
visiva in una semplice domanda: "Perché
le cose appaiono come appaiono?" Ecco tre classiche
risposte che formano il cuore di teorie psicologiche
della percezione visiva:
1. Ambiente versus organismo. Una possibile risposta
al quesito di Koffka è "Perché il
mondo è fatto così". Questa frase
rimanda all'analisi delle condizioni esterne per capire
la percezione. In particolare, suggerisce che si potrebbe
esaminare se il tipo di informazione dello stimolo prossimale
corrisponde a quella dello stimolo distale. Una risposta
alternativa potrebbe essere "Perché il nostro
sistema nervoso della visione è fatto così".
Qui si richiama all'analisi della natura dell'organismo
piuttosto che alla natura esterna del mondo. Facendo
un compromesso è possibile trovare una posizione
intermedia: sia la struttura degli stimoli esterni,
che la struttura interna dell'organismo sono importanti.
2. Acquisito versus innato. "Perché abbiamo
imparato a vedere in quel modo": è la visione
empirista in accordo con il fatto che noi vediamo in
quel modo grazie alle conoscenze accumulate con la nostra
personale interazione con il mondo. Una risposta alternativa
è "Perché siamo nati per vedere in
quel modo", questo è il punto di vista innatista
per cui noi non abbiamo bisogno di acquisire specifiche
conoscenze durante la nostra vita perché l'evoluzione
ci ha forniti del necessario meccanismo neuronale. Questa
spiegazione in termini di maturazione può considerarsi
innatista.
3. Atomismo versus olismo. "In funzione del modo
in cui appare ogni piccolo pezzo del campo", questa
è la visione atomistica per cui la percezione
dell'intero campo visivo si può raggiungere semplicemente
mettendo insieme ogni pezzo dell'esperienza visiva di
ogni regione locale. Ciò contrasta con la risposta
" In funzione del modo in cui è organizzato
l'intero campo visivo ": questa è la visione
olistica che suggerisce che pezzi singoli non possono
essere semplicemente messi insieme ma devono essere
integrati globalmente.
4. Introspezione versus comportamento. Questa controversia
concerne se la teoria della percezione può derivare
dalle osservazioni fenomenologiche della nostra esperienza
conscia (introspezione) o da misurazioni obiettive della
performance umana (comportamento). Koffka presupponeva
un approccio introspettivo chiedendosi "Perché
le cose appaiono come appaiono?", infatti "come
appaiono " presuppone l'esperienza cosciente. Un
comportamentista si sarebbe chiesto "Che cosa ci
rende capaci di fare la visione?"
Con
queste domande in mente analizziamo ora quattro teorie
diverse della percezione visiva; tre di queste, strutturalismo,
gestaltismo e ottica ecologica, sono facilmente identificabili
con le quattro questioni chiave, l'ultima, il costruttivismo
è una specie di mix delle altre tre. Il costruttivismo
rappresenta la corrente dominante e ci porta direttamente
al moderno punto di vista dell'Information Processing.
TEORIA INNATISMO VSEMPIRISMO ATOMISMO VS OLISMO ORGANISMO
VS AMBIENTE PRINCIPALE ANALOGIA METODO
Strutturalismo Empirismo Atomismo Organismo Chimica
Introspezione
Gestaltismo Innatismo Olismo Organismo Fisica Introspezione
Ottica Ecologica Innatismo Olismo Ambiente Risonanza
meccanica Analisi dello stimolo
2.1.1 STRUTTURALISMO
Il
primo approccio psicologico alla teoria della percezione
è chiamato strutturalismo: mette radici nella
scuola filosofica dell'empirismo inglese (Locke , Berkeley,
Hume). Queste idee furono introdotte in psicologia dal
suo padre fondatore, W.Wundt in Germania e furono più
tardi portate negli Stati Uniti da uno dei suoi allievi,
E.Titchener.
Lo strutturalismo vede la percezione come un processo
che sorge da atomi sensoriali base, primitivi, indivisibili
elementi dell'esperienza specifica di una modalità
(visiva, uditiva), che rimandano a ricordi di altri
atomi sensoriali che sono stati associati (raggruppati
assieme) nella memoria attraverso avvenimenti ripetuti
precedentemente. Queste associazioni si verificano quando
l'esperienza sensoriale è abbastanza chiusa in
uno spazio e in un tempo e dopo un sufficiente numero
di presentazioni. Nel caso della visione gli atomi sensoriali
sono le esperienze visive di colore in ogni piccola
regione del campo visivo risultanti presumibilmente
dall'attività di ogni fotorecettore nella retina.
Queste locali sensazioni sono assunte come combinazione
da semplici concatenazioni in percezioni: immaginiamo
di unire assieme pagine trasparenti ognuna delle quali
contiene una piccola macchia di colore ad una singola
locazione al fine di creare un disegno unitario.
Inoltre le esperienze visive suscitano ricordi di altre
modalità sensoriali tramite associazione. Ad
esempio la memoria di com'è un cane può
essere associata a come abbaia, al suo odore, etc.;
e una parte del cane, ad esempio la testa, può
essere associata ad un'altra parte del corpo come le
gambe, il corpo e la taglia. La percezione è
concepita come un processo di associazione molto rapido
e inconscio che permette l'accesso alla memoria attraverso
l'esperienza con il mondo. Secondo il Strutturalismo,
un osservatore apprende sempre di più grazie
alle associazioni, e le sue percezioni diventano più
ricche, più accurate, e più complesse.
Le sensazioni sono tenute assieme in percetti più
complessi, che sono il risultato di associazioni nella
contiguità spazio-temporale delle esperienze
passate.
Un altro fondamento su cui il strutturalismo è
costruito è il metodo dell'introspezione "allenata".
Gli strutturalisti ritengono che uno può scoprire
le unità elementari della percezione spostando
l'attenzione all'interno (introspezione) e osservando
la sua stessa esperienza. Prima la persona deve essere
addestrata ma, ad ogni modo, rimane un metodo poco credibile
in quanto ha forti influenze rilevabili nei risultati
ottenuti
Comunque il strutturalismo può essere visto come
una fase di transizione tra il periodo filosofico all'inizio
della storia della teoria della percezione e un periodo
psicologico più sofisticato. Senza benefici per
le scoperte dei nuovi scienziati, il strutturalismo
ha cercato di tradurre la visione filosofica degli empiristi
inglesi più o meno direttamente nell'emergente
disciplina della psicologia.
2.1.2
GESTALTISMO
Storicamente
il movimento gestaltista è considerato una reazione
contro il strutturalismo; i suoi leader furono Max Wertheimer,
Wolfang Kohler, Kurt Koffka.
Olismo.
Gestalt è una parola tedesca che significa "forma
intera" o "configurazione". Come il nome
suggerisce, l'idea strutturalista che i gestaltisti
rifiutarono più veemente è quella secondo
cui la percezione e costruita da atomi di sensazioni
uniti da una semplice concatenazione. Infatti il loro
grido di battaglia era "L'intero è diverso
dalla semplice somma delle parti"; un esempio sono
le configurazioni che hanno delle proprietà emergenti
che non sono divisibili in nessuna delle loro parti
locali. I Gestaltisti rifiutano le idee strutturaliste
perché la semplice concatenazione delle parti
può raramente catturare la struttura percepita
dell'intero. Il merito dei psicologi Gestaltisti fu
quello di teorizzare quegli aspetti della percezione
che dipendono dalla qualità della figura intera
o dalla configurazione.
Ovviamente i Gestaltisti rifiutano l'analogia classica
del strutturalismo con la chimica perché è
una visione troppo atomistica. Preferiscono riferirsi
ai processi mentali come una analogia alle forze dei
campi magnetici della fisica. L'aspetto cruciale dei
campi magnetici a cui si appellano i gestaltisti è
la loro natura olistica. Per esempio, una singola particella
caricata positivamente definisce un campo magnetico
che si estende in uno spazio. Ma se si aggiunge una
seconda particella, la struttura dell'intero campo magnetico
cambierà, è cambierà in relazione
alla carica delle due particelle. Questo esempio è
conforme all'idea gestaltista della struttura delle
configurazioni come un intero, piuttosto che come una
concatenazione di parti.
Come ulteriore reazione contro lo strutturalisno i Gestaltisi
rifiutano l'empirismo come base della percezione. Per
esempio, essi credevano che il meccanismo dell'organizzazione
percettiva non richiede apprendimento dall'esperienza,
ma avviene grazie all'interazione delle strutture del
cervello con la struttura dello stimolo. Comunque, la
posizione innatista nella teoria gestaltista è
meno centrale di quella olistica.
Isomorfismo
Psicofisiologico. I Gestaltisti formularono la loro
posizione nella relazione tra mente e cervello nella
loro dottrina dell'isomorfismo psicofisico. Esso consiste
nel fatto che le esperienze percettive sono strutturalmente
le stesse (isomorfiche) ai sottostanti eventi mentali
(fisiologici). Un esempio è la teoria dell'isomorfismo
psicofisiologico della teoria dell'opponent process
(Hering): cioè ci sono sei colori primari strutturati
come tre paia di opposti: rosso vs verde, blu vs giallo,
nero vs bianco. Questa analisi è basata su osservazioni
intuitive grazie alle esperienze visive del colore.
La dottrina Gestaltista dell'isomorfismo psicofisiologico,
asserisce che ci potrebbero essere delle strutture neurali
corrispondenti che governano la percezione del colore.
Ci sono delle evidenze sperimentali che confermano questa
ipotesi: nel sistema visivo umano ci sono tre tipi di
neuroni che codificano il colore in tre paia di opposti
rosso/verde, blu/giallo, nero/bianco, proprio come l'analisi
dell'esperienza del colore di Hering suggerisce. Questa
corrispondenza tra esperienze del colore e eventi neuronali
opposti supporta la dottrina Gestaltista dell'isomorfismo
psicofisiologico.
Ma l'isomorfismo psicofisiologico non è sufficiente
a definire una teoria neurologica delle funzioni mentali.
Wolfang Kohlerhikkokkh (1920/1950), esplorò in
modo più approfondito le connessioni tra le idee
della teoria della Gestalt e i meccanismi del cervello
sottostanti. Il cervello stesso è un esempio
di ciò che chiamiamo Gestalt fisica: un sistema
fisico dinamico che converge verso uno stato di equilibrio
spendendo energia il meno possibile. I Gestaltisti usano
spesso la metafora della bolla di sapone: esse hanno
l'interessante proprietà per cui, non importa
la loro forma iniziale, esse inevitabilmente si evolveranno
in una sfera perfetta. I cambiamenti avvengono perché
la distribuzione locale della tensione allo sforzo si
propaga in tutta la superficie finché la bolla
di sapone raggiungerà lo stato di stabilità
globale. Ci sono molte altre "gestalten" fisiche
definibili con questa proprietà dinamica, e i
Gestaltisti credono che il cervello sia il primo esempio.
Il secondo, più specifico principio di Kohler
dice che i meccanismi del cervello che sottostanno alla
percezione sono campi elettromagnetici generati da milioni
di neuroni. Molti esperimenti per testare questa ipotesi
fallirono e, ne conseguì che la teoria della
Gestalt perse i favori della comunità scientifica.
Oggigiorno però le idee gestaltiste hanno avuto
un ritorno nella forma di teorie dinamiche connessioniste,
come vedremo più avanti.
2.1.3
OTTICA ECOLOGICA
Questa
teoria della visione è il risultato primariamente
di un uomo: James.J,Gibson della Cornell University.
Anche Gibson si oppose vigorosamente agli strutturalisti
e, allo stesso tempo, fu influenzato fortemente dal
movimento Gestaltista, in particolare per l'enfasi olistica.
Diversamente dai gestaltisti essi però, rifiutava
l'idea che la struttura organismica è alla base
della percezione. Gibson propose invece che la percezione
può essere capita meglio analizzando la struttura
dell'ambiente in cui è inserito l'organismo.
Questa è l'ecologia.
L'ottica ecologica è più una teoria sulle
basi informazionali della percezione dell'ambiente piuttosto
che sulle basi del meccanismi nel cervello. Questo approccio
segna una drastica divisione dalle teorie precedenti
e precede di un bel po' i moderni lavori nella visione
computazionale.
Analisi
della struttura dello stimolo. La meta della teoria
ecologica della visione di Gibson è sottolineare
che come il mondo viene strutturato dalla luce nell'ambiente
dell'optic array (AOA), così le persone sono
capaci di percepire l'ambiente campionando informazione.
In termini diversi Gibson si propose di trovare quali
caratteristiche dello stimolo prossimale producono l'informazione
sullo stimolo distale. In particolare l'intero pattern
di stimolazione prossimale contiene molta più
informazione sullo stimolo distale di quanto si sospettava.
Per esempio Gibson teorizzò il gradiente di tessitura
ovvero un graduale cambiamento in termini di diminuzione
di grandezza, di aumento di densità e di proiezione
in 2-D in corrispondenza all'allontanamento delle superfici.
Molte superfici nel mondo hanno un'approssimativa tessitura
uniforme: prati erbosi, muri di pietra, pareti tappezzate,
piastrelle
solo per nominarne alcune. Gibson identifica
nel gradiente di tessitura l'origine dell'informazione
sulla profondità, l'inclinazione, e la grandezza
degli oggetti nell'ambiente e dimostra come i soggetti
possono percepire queste proprietà.
La teoria ecologica è anche importante perché
enfatizza il ruolo della visione come attività
esploratrice del mondo, con le relative conseguenze
di tipo informazionale. Quando l'osservatore si muove
attorno al mondo il pattern spaziale di stimolazione
della retina cambia costantemente nel tempo (concetto
di optic flow e di AOA dinamica). Infatti, il sistema
visivo degli organismi si evolve con il movimento adattivo:
cercare cibo, acqua, compagni, riparo. L'ottica ecologica
cerca anche di specificare, per un osservatore in movimento,
quali informazioni ricavate dall'ambiente sono utilizzabili.
Un altro dei più importanti insight nello studio
della "informazione utile" nella dinamica
AOA è che la stessa informazione ottica che specifica
l'informazione ambientale specifica anche la traiettoria
dell'osservatore.
Gibson credeva che l'informazione sufficiente ricavabile
dalla stimolazione della retina permette ad un organismo
di esplorare attivamente l'ambiente e di percepirlo
senza ambiguità. Questo processo, che si completa
nel cervello, si chiama information pick up e si basa
sulla metafora della risonanza, per specificare come
avviene questo processo. Semplicemente, l'informazione
nello stimolo produce l'attivazione delle appropriate
strutture neuronali appropriate, analogamente al modo
in cui una data vibrazione meccanica dell'aria mette
in vibrazione un diapason con la stessa frequenza caratteristica.
Percezione
diretta. L'aspetto più controverso della teoria
di Gibson è l'assunto della percezione diretta:
l'idea che la percezione visiva dell'ambiente è
pienamente specificata dall'informazione ottica ricavabile
dalla retina in movimento, dall'esplorazione di un organismo
attivo senza nessun processo di mediazione di rappresentazioni
interne. Gibson infatti era contrario all'idea che la
percezione è possibile solo facendo delle "inferenze
inconsce" in aggiunta all'informazione strettamente
percettiva. Egli rifiuta questa influenza aggiunta alla
percezione, sostenendo invece che non c'è nessun
bisogno di quelle inferenze se si considerano le molte
potenzialità dell'informazione ottica, in particolare
quella ricavata dall'optic flow dell'organismo che esplora
l'ambiente.
Sfortunatamente, la brillante analisi dell'informazione
ricavabile nella dinamica AOA ha dei limiti nel spiegare
la fondamentale indeterminazione nella ricostruzione
del mondo reale a 3-D dalla piatta informazione retinica
2-D (the inverse problem, sezione 1.2.3.). Gibson enfatizza
ancora una volta il ruolo dell'osservatore esplorativo,
che risolve il problema aggiungendo la dimensione temporale
allo stimolo prossimale. Ma nella dinamica AOA, questa
informazione aggiunta è ancora insufficiente
in quanto gli eventi ambientali sono effettivamente
a quattro dimensioni (tre spaziali più una temporale)
e l'informazione nella dinamica AOA è solo tridimensionale
(due dimensioni spaziali e una temporale), anche quando
sono usati i due occhi contemporaneamente. L'informazione
addizionale della dimensione temporale vincola le soluzioni
al problema inverso (cioè restringe il numero
delle soluzioni valide), ma non lo risolve completamente.
2.1.4
COSTRUTTIVISMO
Molti
teorici della percezione, discutendo sul problema inverso,
hanno concluso che, nel processo della visione, ci deve
essere qualche tipo addizionale di informazione in aggiunta
all'immagine retinica. In un modo o nell'altro, il nostro
sistema visivo dalle informazioni che contribuiscono
a formare l'immagine retinica arriva alla soluzione
più idonea tra quelle logicamente infinite. Questa
è la posizione a cui si rifà il costruttivismo.
Il costruttivismo, che è il classico approccio
dominante alla teoria della visione, combina i più
diversi aspetti delle teorie precedenti; per questo
si può definirla una teoria eclettica.
Il moderno costruttivismo intende essere primariamente
una teoria del meccanismo interno della percezione,
piuttosto che centrata sull'ambiente esterno. Comunque
il meccanismo interno delle teorie costruttiviste si
basa spesso sull'estrazione di informazioni ambientali
dai pattern di stimolazione ottica che Gibson ha descritto
all'interno dell'ottica ecologica. Il costruttivismo
perpetua l'idea che i percetti globali sono costruiti
dall'informazione locale. Allo stesso tempo sottolinea
l'importanza delle proprietà emergenti quali
linee, bordi, angoli e anche le figure intere dei gestaltisti.
Rispetto alla controversia innato-acqusito, il moderno
costruttivismo è neutrale. Per certi aspetti
il processo percettivo deve essere sicuramente innato
per altri, invece, sono appresi attraverso l'interazione
con il mondo. Definire quali aspetti sono innati e quali
acquisiti è un problema che deve essere affrontato
studiando lo sviluppo infantile. Infine i più
moderni costruttivisti sono, metodologicamente parlando,
comportamentisti. Cioè, essi estraggono inferenze
sui processi percettivi studiando misure quantitative
di comportamenti umani e animali piuttosto che ( o in
aggiunta) introspettivamente. In questo essi si scontrano
sia con i strutturalisti che con i gestaltisti, anche
se non ci sono dubbi che l'analisi introspettiva è
il primo passo importante nella teoria costruttivista;
la differenza è che i costruttivisti poi procedono
nella raccolta di misure comportamentali per dimostrare
la loro ipotesi oggettivamente.
Inferenze
inconsce. Il padre della teoria costruttivista è
Hermann von Helmholtz, brillante fisico, matematico
e psicologo tedesco. Molte delle sue idee base sono
state pubblicate già nel 1867, nel libro Trattato
di Ottica Fisiologica, e sono sorprendentemente rimaste
intatte. Nonostante i molti contributi significativi
allo studio della percezione visiva, uno dei concetti
helmholtziani più "duraturi", è
l'idea centrale che la percezione dipende da inferenze
inconsce. Diversamente da Gibson, Helmholtz conosceva
il buco esistente tra l'informazione ottica direttamente
ottenuta dalla stimolazione retinica e la conoscenza
percettiva che ne deriva (gap(=buco, divario) richiama
la natura indeterminata dell'inverse problem). Helmholtz
sosteneva che il buco poteva essere coperto. Egli sosteneva
che la visione richiede un processo di inferenze, o
qualcosa di molto simili ad esse, che trasformi le informazioni
insufficienti a 2-D, in un'interpretazione percettiva
dell'ambiente a 3-D. Il processo di inferenza percettiva
è inconscio perché le persone non hanno
coscienza di come , quando, perché, avvengano.
Più recentemente, Richard Gregory(1970), Julian
Hochberg (1964), e Irvin Rock (1983), hanno rimodernizzato
e rielaborato l'idea helmholtziana.
Se il sistema visivo fa inferenze sulla natura dell'ambiente
dalle informazioni ottiche derivanti dalla stimolazione
retinica, è importante conoscere le basi sulle
quali vengono fatte queste inferenze. Questo proposito
viene chiamato likelihood principle: è un modo
probabilistico di vedere la percezione per cui il sistema
visivo computa l'interpretazione con la più alta
probabilità determinata dalla stimolazione retinica.
Il likelihood principle è spesso confuso con
il principio della Gestalt di Pregnanza (chiamato anche
principio del minimo), che sta alla base della selezione
sopra le possibili interpretazioni secondo la "bontà"
e la "semplicità" tra le alternative.
Per esempio, il fatto che le persone percepiscono la
prima figura come un cerchio dietro un quadrato, piuttosto
che come un quadrato dietro tre quarti di cerchio (terza
figura), viene spiegato dal likelihood principle costruttivista
come conseguenza del fatto che è molto più
probabile che un cerchio intero sia in parte occluso
da un quadrato. Lo stesso esempio può essere
spiegato dal principio gestaltista della Pregnanza,
per cui un cerchio intero è una figura "migliore"
di tre quarti di cerchio nella direzione di una forma
più regolare, semplice, e più simmetrica.
Interpretazione euristica. La prospettiva teorica di
questo libro fa riferimento largamente alla nozione
helmholtziana dell'inferenza inconscia. In particolare
svilupperemo l'idea che il sistema visivo va oltre l'informazione
ottica facendo un alto numero di possibili assunzioni
sulla natura dell'ambiente e sulle condizioni sotto
le quali è visto. Quando queste assunzioni vengono
"accoppiate" con l'immagine sensoriale, danno
come risultato un processo di interpretazione euristica,
con cui il sistema visivo fa inferenze sulla migliore
condizione ambientale che può aver prodotto l'immagine.
Questo processo è euristico perché usa
le regole probabilistiche che sono spesso, anche se
non sempre, vere. Se, per esempio l'inferenza è
falsa, avremo delle conclusioni sbagliate, le illusioni
visive (sezione 2.3.5).
Il likelihood principle è strettamente in connessione
con la nozione costruttivista della percezione come
processo euristico. L'utilità evoluzionistica
della visione è massimizzata dall'uso della più
probabile ipotesi per arrivare ad una interpretazione
corretta della realtà esterna.
Le ipotesi "nascoste" fatte dal sistema visivo
sono molte e varie. Un esempio è il fatto che
gli ambienti interni, quali soffitti, piani, muri sono
tutti allineati verticalmente e perpendicolarmente dalla
forza gravitazionale.
Un'interpretazione letterale dell'inferenza inconscia
è che la percezione è accompagnata da
un modo sequenziale di applicare le regole della logica
simbolica o risolvendo equazioni matematiche. Inoltre,
questo è il tipo di processo che Helmholtz sembrava
avere in mente quando propose la sua interpretazione
di inferenza inconscia. Fortunatamente, oggigiorno ci
sono interpretazioni più plausibili che utilizzano
il modello computazionale che si adatta allo schema
generale inferenziale dei costruttivisti. Per esempio
reti connessioniste possono arrivare a conclusioni percettive
basate parzialmente su dati sensoriali in entrata e
con l'aggiunta di elementi inclusi in pattern di interconnessioni
di elementi simili ai neuroni. Tali reti sono in grado
di "fare inferenze" sulla base di assunzioni
euristiche senza operazioni né logiche né
matematiche.
2.2 UNA BREVE STORIA DELL' INFORMATION PROCESSING (elaborazione
delle informazioni).
La
scienza della visione nasce negli anni 1950-60, quando
tre importanti cambiamenti hanno modificato il modo
di concepire la visione:
l'uso della simulazione al computer
l'applicazione delle concezioni base dell'elaborazione
delle informazioni alla psicologia
l'emergere dell'idea che il cervello è un elaboratore
biologico di informazioni.
2.2.1
LA VISIONE NEL COMPUTER.
Nello
sviluppo della scienza della visione ha avuto un ruolo
centrale l'idea che i moderni computer digitali potevano
venire usati per simulare la complessa elaborazione
percettiva. In precedenza la visione era considerata
una funzione esclusiva degli organismi viventi e gli
scienziati testavano le ipotesi che formulavano solo
su esseri viventi. L'avvento della simulazione al computer
ha radicalmente cambiato la situazione: gli scienziati
lavoravano così su sistemi le cui regole di funzionamento
erano conosciute in anticipo ed utilizzavano il computer
per confrontare il comportamento del computer con quello
degli organismi viventi.
L'INVENZIONE
DEL COMPUTER. Il computer è stato inventato nel
1930 da un brillante matematico inglese : Alan Turing.
Egli inventò una serie di macchine ipotetiche,
che noi conosciamo ora come le macchine universali di
Turing. Queste macchine potevano essere programmate
per elaborare in maniera automatica le informazioni.
La macchina di Turing era ipotetica nel senso che era
un'astrazione matematica.
Nel 1946 il matematico John von Neumann costruì
il primo computer digitale, che fu chiamato ENIAC.
Da allora il computer è stato sempre più
perfezionato, comunque i moderni computer digitali sono
tutti degli esempi delle macchine universali di Turing.
Sin dal 1940 Turing capì le incredibili capacità
della sua macchina per simulare il pensiero intelligente.
E' proprio questa idea che da origine all'INTELLIGENZA
ARTIFICIALE, la branca della scienza del computer nella
quale i programmi vengono scritti con lo scopo di simulare
il comportamento intelligente. All'inizio i teorici
dell'intelligenza artificiale cercavano di simulare
dei compiti cognitivi difficili, come giocare a scacchi
e dimostrare i teoremi matematici. Solamente in seguito
vennero creati dei programmi che consentivano una simulazione
della percezione visiva.
Questo sforzo porta alla nascita di quella branca della
scienza della visione, che si occupa di come il computer
può essere programmato ad estrarre dall'immagine
ottica informazioni sulle condizioni ambientali.
Lo studio della visione al computer(computer vision)
ha promosso due importanti cambiamenti:
1) IMMAGINI REALI: le teorie della visione simulate
al computer possono venire applicate ad immagini su
scala grigia, ottenute registrando con una videocamera
scene del mondo reale. Le teorie classiche della percezione
visiva sono state generalmente costruite per tenere
conto di condizioni stimolo che non esistono nella situazione
reale.
Le teorie della visione simulate al computer sono applicate
ad immagini reali di oggetti reali.
2) TEORIE ESPLICITE: prima della simulazione al computer,
le teorie della percezione visiva erano vaghe, informali
ed incomplete, puntavano su leggi concettuali e tutto
ciò portava a tralasciare importanti dettagli.
La simulazione al computer ha cambiato questo stato
di cose, perché una delle qualità caratteristiche
della programmazione al computer è quella di
cercare di rendere esplicita ogni cosa.
Questi cambiamenti hanno portato alla consapevolezza
che la visione è qualcosa di estremamente difficile:
è difficile far si che il computer "veda"
le cose più semplici. Inoltre tutte le concezioni,
che gli psicologi avevano precedentemente studiato,
hanno richiesto un'enorme fatica per essere tradotti
in termini computazionali.
MONDO
DEI BLOCCHI (blocks world). All'inizio le teorie della
visione simulate al computer consideravano le scena
come un mondo composto da blocchi: un micromondo nel
quale tutti gli oggetti che possono essere percepiti
sono dei solidi geometrici, semplici, colorati uniformemente
e posti su una superficie. Una delle prime simulazioni
significative della visione fu un programma di Roberts
(1965).
Fig. 2.2.2:Una immagine video di una configurazione
in blocchi (parte a) viene elaborata nei bordi locali
(parte c), che vengono poi uniti in contorni continui
(d,e). Questa configurazione di linee viene poi uniformato
attraverso l'individuazione di volumi, che dovrebbero
condurre insieme alla creazione di una forma corretta
(f) e dovrebbero predire la sua apparenza in un'altra
prospettiva (b).
L'APPROCCIO
COMPUTAZIONALE ALL'OTTICA ECOLOGICA: i progressi più
recenti nello studio della visione al computer sono
il risultato di un'analisi formale dell'informazione
disponibile nell'immagine ottica. Questo approccio fu
sostenuto dai lavori sull'ottica ecologica di Gibson.
Viene posta una nuova enfasi sull'analisi di come la
struttura ambientale è riflessa in una struttura
immaginativa. Il risultato di questo cambiamento fu
che i teorici cercarono di capire i modi di recuperare,
direttamente dall'immagine, delle informazioni complete
sulla scena visiva (particolarmente sulla profondità
e sulle inclinazioni delle superfici nelle condizioni
tridimensionali).
I pionieri di questo approccio furono due psicofisici
olandesi Jan Koenderink e Andrea Van Doorn. Essi applicarono
le sofisticate tecniche matematiche della geometria
differenziale ai problemi come la percezione del movimento
dal flusso ottico, la percezione della profondità
dall'informazione stereoscopica
Loro non crearono
programmi per il computer, ma i loro lavori hanno ispirato
altri a farlo. L'approccio matematico, che ha portato
alla creazione de questi programmi, era stato formulato
all'Istituto di Tecnologia nel Massachusetts (M.I.T.)
da David Marr e dai suoi collaboratori. Questa ricerca
è caratterizzata da analisi matematiche di come
la luminanza nell'immagine bidimensionale porta informazioni
sulla struttura delle superfici e degli oggetti nello
spazio tridimensionale.
CONNESSIONISMO
E RETI NEURALI: I modelli delle reti connesionistiche
e neurali sono basati sull'assunzione che la visione
umana dipende dalla struttura parallela di circuiti
neuronali nel cervello. Questi modelli sono reti composte
da molte unità interconnesse. Lo stato di attivazione
di queste unità, che corrisponde approssimativamente
all'attivazione dei neuroni, avviene attraverso di reti
di connessioni, che, come le sinapsi, sono eccitatorie
o inibitorie.
Fig. 2.2.4. Rete connesionista usata nell'apprendimento
per back propagation(all'indietro) formata da tre layers
(strati): l'input, la trasformazione dall'input all'output
e l'output.
Sebbene questi modelli connessionisti possono essere
specificati matematicamente, il loro comportamento dipende
generalmente da equazioni non lineari, che non sono
facilmente risolvibili in maniera analitica (vd. Appendice
B). Questo significa che per determinare come si comporta
una rete, l'operazione va simulata su un computer.
I precursori storici delle teorie connessionistiche
moderne della percezione sono gli studi sui "perceptrons",
una particolare classe di modelli di reti studiate da
Frank Rosenblatt e coll. Questi perceptrons ci consentono
di apprendere come vengono identificate nuove categorie,
aggiustando dei pesi sulle loro connessioni secondo
delle regole specifiche.
Rosenblatt voleva dimostrare come una semplice regola
di apprendimento era sufficiente alle reti per imparare
a fare una discriminazione categoriale.
In questo stesso periodo lo psicologo Donald Hebb ha
sintetizzato una grande quantità di ricerche
sull'apprendimento umano ed animale in una struttura
neurale in cui le associazioni sono formate all'interno
e tra complessi di cellule, che si attivano nello stesso
tempo. Nonostante questi progressi, Marvin Minsky e
Seymour Papert (1969) indicarono come questi perceptrons
avessero dei seri limiti. Fu proprio la loro critica
ad arrestare la ricerca nel campo delle reti neurali
per più di una decade. Solo pochi ricercatori
tenaci hanno continuato a sostenere l'approccio delle
reti neurali e, nei primi anni del 1980, un gruppo di
scienziati cognitivi, che lavorano nel dipartimento
di psicologia all'università della California,
hanno ottenuto importanti risultati, che hanno rivitalizzato
questo approccio. Chiamando la loro teoria PDP ( modelli
dell'elaborazione distribuita in parallelo), D. Rumelhart,
James McClelland, Geoffrey Hinton, Paul Smolensky, Micheal
Jordan e i loro coll. Hanno dimostrato che i modelli
delle reti neurali hanno importanti vantaggi sui programmi
più tradizionali della scienza al computer.
2.2.2.
L'ELABORAZIONE DELL' INFORMAZIONE IN PSICOLOGIA.
Un
altro importante evento per lo sviluppo della scienza
della visione fu la comparsa dell'approccio basato sull'elaborazione
dell'informazione in psicologia. A partire dal 1920,
gran parte della psicologia era dominata dal comportamentismo.
I comportamentisti credevano che la psicologia doveva
avere come oggetto di studio il comportamento osservabile.
Dal punto di vista metodologico, questo voleva dire
abbandonare il metodo introspettivo; dal punto di vista
teoretico, si doveva purificare le teorie psicologiche
da tutti quei concetti che si riferivano a processi
interni.
Tenendo conto di queste cose, la percezione non è
tanto importante, dato che è un tipo di esperienza
interna del mondo esterno.
Il comportamentismo ha dominato la scena durante gli
anni 1940-1950, soprattutto nel campo dell'apprendimento.
Alla fine del 1950, iniziò ad emergere un nuovo
approccio, che contestò il dogma comportamentista,
considerando importanti i processi e gli stati interni.
L'idea, che contraddistingue questo movimento, era che
i processi interni potevano venire compresi in termini
di elaborazione di informazioni, sulla base di nuovi
concetti che si erano sviluppati nei campi dell'ingegneria
elettrica, della scienza del computer e della teoria
dell'informazione. Questo portò al fatto che
gli psicologi formulavano le loro teorie sulla visione
all'interno di un nuovo, più preciso linguaggio
che era strettamente collegato ai programmi del computer.
A poco a poco l'approccio dell'elaborazione dell'informazione
si consolidò nella psicologia cognitiva, diventando
la struttura dominante per capire la percezione visiva
e molti altri tipi di attività mentali.
Una delle più grandi pubblicazioni in questa
area fu il libro di Broadbent:" Percezione e comunicazione"
1958, nel quale viene analizzato il modo in cui si presta
attenzione all'informazione uditiva, che va da un orecchio
all'altro. Broadbent suggerì che l'attenzione
opera come un filtro che seleziona le informazioni,
attraverso dei canali che elaborano l'informazione dopo
un'iniziale analisi degli aspetti sensoriali ( vd. Fig.
2.2.5).
Broadbent fu tra i primi a proporre una teoria psicologica
nella forma di un diagramma di flusso, che specifica
la struttura temporale degli eventi dell'elaborazione
delle informazioni.
Una pietra miliare nello sviluppo dell'elaborazione
dell'informazione visiva, fu la scoperta da parte i
George Sperling della memoria iconica, un particolare
tipo di memoria visiva a brevissimo termine. I suoi
esperimenti ci hanno fatto vedere molte proprietà
affascinanti di questo sistema di memoria ed hanno generato
centinaia di studi.
Tutti questi sviluppi sono contrapposti all'approccio
del comportamentismo, dato che l'approccio dominante
era quello di capire l'attività cognitiva umana.
Un evento importante fu la pubblicazione del libro di
Neisser " La psicologia cognitiva" nel 1967,
perché ha allontanato definitivamente gli psicologi
dal comportamentismo, indirizzandoli verso lo studio
della cognizione(percezione, attenzione, ecc.).
2.2.3.
ELABORAZIONE DELL'INFORMAZIONE IN BIOLOGIA.
Il
terzo importante sviluppo, che ha contribuito all'emergere
del paradigma dell'elaborazione dell'informazione fu
l'invenzione di una tecnica fisiologica per studiare
l'attività neurale nel sistema visivo. Questo
nuovo metodo ha portato gli studiosi a chiedersi come
l'informazione visiva viene elaborata nella retina e
quali sono i centri coinvolti nel cervello. L'esistenza
di un metodo per lo studio dell'attività neuronale
significa poter tracciare un diagramma funzionale dell'intero
sistema visivo, neurone per neurone, specificando quale
compito ha ciascun neurone. Così anche in campo
biologico si è insediati l'approccio dell'elaborazione
delle informazioni.
PRIMI
SVILUPPI: prima del 1950 il cervello era semplicemente
visto come un organo puramente biologico i cui meccanismi
erano oscuri. Infatti ci sono voluti molti anni di studi
prima che i biologi scoprano che i neuroni non sono
direttamente collegati tra di loro, ma sono delle entità
separate che comunicano tra di loro attraverso trasmissioni
chimiche lungo sinapsi. L'idea del cervello come elaboratore
di informazioni viene accettata solo quando inizia a
prendere piede l'analogia tra computer e cervello.
Il matematico John von Neumann (1951) rese esplicita
l'analogia, dicendo che gli impulsi neurali che viaggiano
lungo gli assoni sono codici digitali, analoghi al processamento
binario (0,1)del computer digitale. Pochi neuroscienziati
presero seriamente questa semplice analogia, affermando
che ci sono molte differenze tra il cervello e i moderni
computer digitali. Ma l'idea che il cervello è
un elaboratore di informazioni ora è universalmente
accettata ed i risultati dei più moderni studi
psicologici delle funzioni cerebrali sono interpretati
all'interno di questo contesto.
I primi studi sulle funzioni cerebrali furono gli esperimenti
sulle lesioni, dove il cervello dell'animale veniva
intenzionalmente lesionato o asportato, che portarono
alla localizzazione delle funzioni cerebrali. Lo stesso
si può dire per le tecniche di stimolazione elettrica
cerebrale, che consistono nell'introduzione nel cervello
dell'animale di elettrodi e nell'emissione di piccole
scosse elettriche, per vedere quale comportamento viene
elicitato.
Entrambe queste tecniche si sono rivelate importanti
per la comprensione delle strutture dei centri visivi
cerebrali, ma nessuna di queste è adeguata per
lo studio dell'elaborazione dell'informazione, che ha
luogo nel normale funzionamento del cervello, perché
esse non misurano il comportamento elettrochimico dei
singoli neuroni.
REGISTRAZIONE
DELLE SINGOLE CELLULE: tecnica fisiologica creata durante
il 1950 per studiare l'elaborazione delle informazioni
eseguito dai singoli neuroni.
Fig.2.2.6. Un microelettrodo viene inserito nel sistema
visivo dell'animale, mentre patterns di luce sono presentati
alla retina. L'attività elettrica degli impulsi
neurali viene registrata dall'elettrodo e monitorata
dal ricercatore.
Pochi elettrodi sono posizionati su un assone del neurone
in modo che possano registrare i piccoli cambiamenti
nel potenziale elettrico, che avvengono ogni volta che
un impulso neuronale passa lungo l'assone. L'output
dell'elettrodo può poi essere registrato ed analizzato
per determinare le condizioni stimolo che attivano il
neurone. Nel caso della visione, questo è stato
scoperto proiettando specifici patterns di luce sulla
retina dell'animale per vedere se la loro presenza rende
il neurone più o meno attivo.
La più importante scoperta è stata fatta
da Stephen Kuffler, David Hubel e Torsten Wiesel all'università
di Harvard. Kuffer (1953) ha usato la tecnica di registrazione
delle singole cellule per determinare i campi recettivi
delle cellule gangliari retiniche: la regione della
retina che influenza l'attivazione base del neurone
aumentandola (eccitazione) o diminuendola (inibizione).
Lo stimolo ottimale per attivare le cellule gangliari
era un punto luminoso al centro del campo recettivo,
circondato da un disco nero oppure il pattern inverso.
Fig. 2.2.7. CAMPI RECETTIVI NELLE CELLULE DEI GANGLI
RETINICI. L'attivazione ON-CENTER, OFF-SURROUND c'è
quando la luce stimola la regione centrale, decresce
quando la luce stimola il contorno ed è immutato
dalla luce fuori dal contorno. L'attivazione dell'OFF-CENTER,
ON-SURROUND avviene nel modo opposto.
Fig. 2.2.8.I premi Nobel Hubel e Wiesel hanno cominciato
a studiare la corteccia visiva, scoprendo molte proprietà
dei campi recettivi delle cellule della corteccia visiva
primaria. Loro usarono la tecnica di registrazione delle
singole cellule.
Fig. 2.2.9.CAMPI RECETTIVI NELLE CELLULE CORTICALI.
Le cellule che si trovano nella prima area della corteccia
visiva si prolungano nei campi recettivi, che rispondono
più vigorosamente, se sono stimolate da un bordo
o da una linea con una particolare posizione ed orientamento.
AUTORADIOGRAFIA:
tecnica usata per studiare simultaneamente l'attività
in un'ampia area di tessuto cerebrale. Nell'animale
viene iniettato uno zucchero radioattivo, che viene
accumulato all'interno dei neuroni attivati. Poi viene
fatto un autoradiogramma, che è un'immagine fotografica
dei pattern di radioattività.
Fig. 2.2.10. Un'autoradiografia di colonne orientate
nella corteccia visiva. Le cellule corticali si colorano
in nero se sono state attivate, mentre vengono presentate
striscie verticali. Le bande verticali nere sono le
colonne orientate negli strati più alti della
corteccia. La banda nera orizzontale è lo strato
4, che riceve l'input dai nuclei genicolati laterali
e risponde a tutto l'orientamento.
I
METODI DI BIOIMMAGINE: metodi non invasivi che costruiscono
delle immagini del cervello umano. Essi sono:
· la TOMOGRAFIA COMPUTERIZZATA (TC)
· la RISONANZA MAGNETICA (MRI)
· la TOMOGRAFIA AD EMISSIONE DI POSITRONI (PET)
· La costruzione dell'immagine TC dipende dalla
trasmissione attraverso una sottile sezione dell'encefalo
di un fascio di raggi X. Questo fascio viene poi misurato
sull'altro lato e tale misurazione viene poi utilizzata
per costruire la struttura tridimensionale del cervello
con l' aiuto di un computer, che usa sofisticati modelli
algoritmici. Alla fine la mappa costruita, rappresenta
una singola sezione del cervello, ma si possono considerare
molti altri livelli, ottenendo così diverse sezioni,
in modo tale che si può ottenere un'immagine
relativamente completa della struttura anatomica del
cervello.
Fig. 2.2.12. Numerose immagini di sezioni del cervello
umano.
Questi diagrammi mostrano le mappe computerizzate di
un cervello, che ha una grande lesione nel lobo parietale
destro. Le scansioni sono state prese dai livelli indicati
nella prima immagine, dove è raffigurato un lato
del cervello.
· Nella MRI il cervello è sottoposto ad
un forte campo magnetico, che polarizza le molecole
al suo interno, così tutti i poli magnetici sono
allineati con i campi magnetici. Poi vengono pulsate
onde radio e così le molecole emettono segnali
radio, che portano l' informazione sulle loro proprietà
chimiche. Questa informazione è ricopiata da
rivelatori posti intorno alla testa. Le loro misurazioni
vengono poi elaborate da algoritmi ed usate per costruire
la struttura tridimensionale del cervello. La MRI produce
delle immagini del cervello molto più dettagliate
di quelle prodotte con la TC, ed inoltre con la MRI
c'è il vantaggio di non esporre il cervello agli
effetti dei raggi X.
· Nel PET viene iniettata nel sangue una sostanza
radioattiva, che entra così nel flusso sanguigno.
Questa sostanza è poi presente nei tessuti cerebrali.
L'isotopo radioattivo emette spontaneamente positroni
e questa emissione di positroni viene poi misurata fuori
dalla testa ed elaborata da un computer che utilizza
algoritmi per costruire una mappa tridimensionale dell'attività
del cervello. La tecnica PET misura l'attività
in modo indiretto, attraverso il flusso cerebrale. Quando
un'area del cervello è attivata, riceve una maggiore
quantità di sangue e questo fatto porta ad un
aumento delle emissioni di positroni.
Uno
dei più recenti sviluppi nelle tecniche di bioimmagine
è stata la modificazione dei metodi MRI, in modo
da tener conto delle misurazioni strutturali e funzionali
dell'attività del cervello. Questa tecnica è
chiamata f-MRI, che significa: risonanza magnetica funzionale.
Come i metodi PET, la f-MRI dipende dal fatto che il
flusso sanguigno aumenta nell'area del cervello attivata,
la misurazione del f-MRI è relazionata alla concentrazione
di ossigeno nel sangue.
2.3 TEORIA DELL'ELABORAZIONE DELL'INFORMAZIONE
In
questa parte del capitolo prepareremo le basi per il
resto del libro. All'inizio esamineremo i fondamenti
teorici dei paradigmi dell'elaborazione dell'informazione
nei quali sono incluse le moderne teorie della visione.
Poi discuteremo i concetti centrali della teoria - rappresentazioni
e processi - e analizzeremo importanti risultati in
merito .Alla fine del capitolo anticiperemo la struttura
teoretica generale che sarà basilare per molte
delle nostre discussioni sulla percezione visiva. Questa
si basa su quattro momenti che partono dall'immagine
retinica per arrivare all'identificazione dell'oggetto.
Si avverte il lettore che il materiale di questa sezione
è astratto e teorico e risulterà forse
difficile perché appare molto presto nel libro,
prima di aver esaminato alcuni esempi specifici.
Il paradigma dell'elaborazione dell'informazione è
un modo di considerare la natura della mente umana come
un processo computazionale. Esso è stato applicato
con considerevole successo non solo nella percezione
visiva ma anche nel vasto ambito dei fenomeni cognitivi
nella percezione uditiva, nella memoria, linguaggio,
giudizi, pensiero e soluzione dei problemi. Infatti
l'approccio dell'elaborazione dell'informazione si è
così imposto su questi argomenti che diversi
scrittori hanno sostenuto che esso costituisce un "paradigma
kuhniano" per la conoscenza (Lachman, Lachman e
Butterfield, 1979; Palmer e Kimchi, 1986).
Il noto filosofo della scienza Thomas Kuhn (1962) definisce
un paradigma scientifico come "un insieme di assunzioni
di lavoro che una comunità di scienziati condivide
(spesso implicitamente) nelle ricerche condotte su un
determinato argomento". Le assunzioni di un paradigma
di solito implicano modi metateorici di concettualizzare
i problemi più importanti e modi rilevanti di
approccio a tali teorie. Kuhn descrive la fisica newtoniana
come un paradigma che sopravvive largamente intatto
dal diciassettesimo secolo fino alla maggior parte del
ventesimo secolo. Sebbene ci siano stati molti sviluppi
teorici seguenti a Newton nessuno di loro pretende di
respingere le assunzioni fondamentali che sottostanno
all'idea di Newton riguardo alla natura del mondo fisico.
Per esempio, Newton e i suoi successori implicitamente
o esplicitamente assumono che c'è una distinzione
qualitativa tra massa ed energia, che il tempo è
assoluto, e che la causalità è deterministica.
Soltanto la meccanica quantistica e la teoria di Einstein
sulla relatività determinarono la morte di questo
paradigma newtoniano e si fece strada un nuovo paradigma
che incorporava una serie di assunzioni quali, per esempio,
che massa ed energia sono equivalenti, che il tempo
è relativo e che la causalità è
connessa con la probabilità.
L'affermazione che l'elaborazione dell'informazione
costituisce un paradigma per le scienze cognitive -
includendo la scienza della visione - è basata
sulla credenza largamente sostenuta che la natura dei
processi mentali può essere colta dalle teorie
che li specificano in termini di eventi dell'elaborazione
dell'informazione (vedi sotto). Sebbene rimanga un piccolo
ma convinto insieme di scienziati della visione che
non vedono la percezione visiva come un processo di
elaborazione - più precisamente proponendo la
teoria di Gibson dell'ottica ecologica - il paradigma
dell'elaborazione dell'informazione è certamente
la struttura dalla quale derivano le più attuali
teorie della percezione visiva.
2.3.1
LA METAFORA DEL COMPUTER
Lo
sviluppo storico delle teorie sulla visione è
stato fortemente influenzato dalle tecniche di ricerca
disponibili. Nel caso della teoria dell'elaborazione
dell'informazione, la forza più significativa
è stata sicuramente l'invenzione dei computer
elettronici. La loro influenza è stata sentita
in due modi distinti ma collegati. Primo, essi sono
diventati lo strumento privilegiato per verificare nuove
teorie sull'elaborazione visiva. Come abbiamo visto
nella sezione 2.2 questo approccio ha fatto emergere
la visione come un settore speciale all'interno della
scienza dei computer. Il suo scopo è programmare
computer così che essi capiscano le parole che
li riguardano nel modo più simile possibile alle
persone.
La seconda influenza dei computer è stata anche
più profonda: essi sono stati usati come la prima
analogia teoretica per i processi mentali all'interno
del paradigma dell'elaborazione dell'informazione. In
poche parole i processi mentali (come tali la percezione
visiva) sostengono la stessa relazione con il cervello
come fanno i programmi con il computer sul quale lavorano;
significa che i processi sono dei "software"
di stime biologiche e i cervelli sono "hardware"
.Il motivo di queste analogie è che molte teorie
della percezione sorpassate da oltre venti o trenta
anni, sono state attualmente implementate dai programmi
di computer e molte di più sono state descritte
all'interno della struttura dell'elaborazione dell'informazione.
In questo capitolo mostreremo quale forma prendono queste
teorizzazioni e perché sono diventate così
popolari.
L'analogia del computer ha largamente sostituito le
analogie teoriche che abbiamo discusso nella sezione
2.1.L'analogia del computer è abbastanza compatibile
con l'analogia deduttiva del costruttivismo.
Alcuni teorici credono che le somiglianze tra mente/cervello
e programma/computer si sono diffuse abbastanza con
una corretta programmazione "vedendo" il computer
come se attualmente avesse l'esperienza di una coscienza
visiva. Questa visione della relazione tra i programmi
di computer e gli eventi mentali è talvolta chiamata
"STRONG AI" (Searle, 1980): vale a dire che
una corretta macchina di programmazione attualmente
esegue processi mentali, includendo esperienze coscienti.
Questa posizione è stata contrastata con la cosiddetta
"WEAK AI", nella quale l'affermazione è
che come una macchina l'intelligenza simula solo gli
eventi mentali, oppure coscienti. Se le affermazioni
della "STRONG AI" siano valide o meno non
si sa, è aperto un serio dibattito, con argomenti
che sostengono entrambi i punti di vista (vedi Searle,
1980 e contributi che seguono).
Senza considerare le più estreme affermazioni
che sono state fatte, se gli eventi mentali accaduti
nel cervello umano sono davvero analoghi ai programmi
di computer, in seguito saranno usati per esaminare
cosa si conosce riguardo all'elaborazione dell'informazione
su dispositivi simili al computer. Questo per cercare
di intuire come la mente può lavorare e come
può essere studiata in modo più vantaggioso.
2.3.2
TRE LIVELLI DELL'ELABORAZIONE DELL'INFORMAZIONE
Nel
suo autorevole libro "Vision" David Marr (1982)
distingue tre differenti livelli di descrizione coinvolti
in un complesso sistema di elaborazione dell'informazione:
COMPUTAZIONALE, ALGORITMICO E IMPLEMENTAZIONALE. Così
facendo egli fornisce un'analisi metateoretica del paradigma
dell'elaborazione dell'informazione. Una metateoria
è una teoria delle teorie, una teoria che cerca
non di analizzare la visione stessa ma di analizzare
la natura delle teorie della visione. Marr dimostra
che ci sono importanti distinzioni concettuali riguardo
a questi tre livelli e che tutti sono essenziali per
comprendere la visione (o qualsiasi altro processo)
come elaborazione di informazioni.
Commento
alla figura 2.3.1 pag.72
La descrizione del livello computazionale di un termostato.
A)Il diagramma mostra gli input e gli output del termostato.
B)Il grafico segna il comportamento di input/output
del termostato per tre particolari misure come una funzione
della temperatura.
IL
LIVELLO COMPUTAZIONALE
La più astratta descrizione che Marr ha proposto
era il livello computazionale. Egli lo definisce come
un insieme di vincoli informazionali disponibili per
rilevare le informazioni in input verso le informazioni
in output. Questo livello di teorizzazione specifica
di che cosa ha bisogno la computazione per essere mostrata
e su quale informazione dovrebbe essere basata, senza
specificare come è realizzata. Per illustrare
questo concetto prenderemo in considerazione un sistema
di elaborazione dell'informazione molto semplice: un
termostato domestico. La "computazione" che
un termostato deve eseguire è la rilevazione
sia del valore della temperatura dell'aria in quel momento,
sia la regolazione su una temperatura preferita (l'informazione
di input) verso un segnale di on/off per la caldaia
(l'informazione di output), che cambia in funzione della
temperatura dell'aria a seconda se è minore o
maggiore del punto di regolazione (vedi fig. 2.3.1A).
La figura 2.3.1B mostra questa doppia misura come una
funzione della temperatura dell'aria: se la temperatura
è sotto il punto di regolazione l'impianto va
su on, se è uguale o sotto l'impianto va su off.
Possiamo riassumere la descrizione di questo livello
computazionale in forma matematica come una funzione
doppia a due variabili
1 se e solo se T<S
0(T,S) =
0 se e solo se T³S
dove
0 è l'output della funzione, T è la temperatura
e S è il punto di regolazione.
Non diremo come questa funzione matematica è
stata ottenuta, abbiamo soltanto definito cosa sono
gli input e come sono stati relazionati formalmente
agli output. Questa è la descrizione del livello
computazionale del termostato.
IL
LIVELLO ALGORITMICO
Il livello che sta nel mezzo della gerarchia di Marr
è il livello algoritmico. Le descrizioni algoritmiche
sono più specifiche di quelle computazionali
nelle quali si specifica come è eseguita una
computazione in termini di elaborazione dell'informazione.
In principio ci sono molti modi diversi nei quali un
dato livello computazionale potrebbe realizzare una
rilevazione dall'input all'output, nello stesso modo
in cui ci sono molti differenti programmi di computer
che potrebbero realizzare lo stesso compito computazionale.
Di conseguenza il livello algoritmico corrisponde più
strettamente al concetto di programma così come
è compreso nella scienza del computer. Per costruire
un algoritmo per un certo compito bisogna decidere prima
una rappresentazione per l'informazione di input e output
e poi costruire una serie di processi che trasformeranno
la rappresentazione dell'input nella rappresentazione
di output in una maniera ben definita. I concetti di
"rappresentazione" ed "elaborazione"
saranno discussi a fondo fra breve, ma per ora, si può
pensare alla rappresentazione come un modo di codificare
l'informazione e l'elaborazione è un modo di
cambiare una rappresentazione in un'altra. Nel nostro
esempio del termostato l'algoritmo più semplice
è usare una variabile continua per codificare
la temperatura e un'altra per codificare il punto di
regolazione; poi mostrare un'operazione di confronto
tra queste due grandezze per determinare se la temperatura
è più alta o più bassa del punto
di regolazione. Un diagramma corrispondente a questo
algoritmo è dato dalla figura 2.3.2. Questo è
l'algoritmo standard per molti termostati, ma ne sono
possibili anche altri. Bisogna infatti sottolineare
che più di un algoritmo può soddisfare
una data descrizione computazionale.
Commento
alla figura 2.3.2 pag. 73
Descrizione del livello algoritmico di un termostato.
Il diagramma mostra una scomposizione del diagramma
computazionale della fig. 2.3.1 nella codificazione,
comparazione e operazioni di output.
Commento
alla figura 2.3.3 pag. 73
Descrizione del livello implementazionale di un termostato.
Un diagramma schematico mostra un dispositivo fisico
che compie l'operazione indicata nello schema del livello
algoritmico in fig.2.3.2
IL
LIVELLO IMPLEMENTAZIONALE
Il più concreto livello di descrizione è
il livello implementazionale. Esso permette di capire
che un algoritmo può essere realizzato come un
processo fisico all'interno di un sistema fisico. Così
come lo stesso programma può essere applicato
su molti computer che si differenziano nella loro struttura
fisica così lo stesso algoritmo può essere
implementato usando materialmente molti diversi dispositivi.
Per illustrare concretamente il livello di implementazione
la figura 2.3.3 mostra un modo per costruire un termostato
fisico usando il primo algoritmo che abbiamo descritto.
La doppia linea curva rappresenta una striscia bimetallica,
costituita dall'unione di due strisce di metallo che
hanno differenti movimenti di dilatazione termica. La
differenza di dilatazione dei due metalli alle diverse
temperature causa la larghezza che piega la striscia
più o meno a seconda dei cambi di temperatura.
Il punto finale, non collegato a nessun altro dispositivo
di questa striscia, è parte di uno scambio di
contatto che completa un circuito elettrico quando tocca
il contatto stesso. La posizione verticale del contatto
è modificata da chi regola il setting del termostato;
sollevandolo aumenta il punto di rilevazione e abbassandolo
diminuisce. Se l'interruttore si chiude o meno dipende
da due fattori: l'altezza della fine della striscia
bimetallica (determinata dalla temperatura) e l'altezza
del contatto (determinata dal setting).
Ci sono innumerevoli modi alternativi per implementare
la funzione continua della temperatura e classificare
le variabili cosicché possano essere paragonate
ad un semplice processo fisico.
2.3.3
TRE ASSUNZIONI SULL'ELABORAZIONE DELL'INFORMAZIONE
Palmer
e Kimchi (1986) hanno fornito una differente analisi
metateorica del paradigma dell'elaborazione dell'informazione
secondo una prospettiva psicologica. Sebbene la loro
analisi all'inizio possa apparire abbastanza diversa
da quella di Marr, vedremo invece che è ad essa
strettamente collegata.
DESCRIZIONE
DELL'INFORMAZIONE
Palmer e Kimchi (1986) analizzarono le assunzioni implicite
che sottolineano le teorie dell'elaborazione dell'informazione
nella psicologia cognitiva. Le tre teorie più
importanti sono elencate in questa e nella seguente
sezione.
1)
Descrizione dell'informazione
Gli eventi mentali possono essere descritti funzionalmente
come eventi informazionali, ciascuno dei quali è
diviso in tre parti: l'informazione in input, l'operazione
rappresentata nell'input, l'informazione di output.
Commento
alla figura 2.3.4 pag.74
Diagramma di una scatola nera. Gli eventi mentali possono
essere descritti come eventi informazionali definiti
dall'informazione di input, output e dalle operazioni
che mappano l'input verso l'output.
Questa
prima assunzione afferma che gli eventi mentali, includendo
la percezione visiva, possono essere considerati come
un'operazione che trasforma un insieme iniziale di informazioni-input
in informazioni-output. Così l'evento informazionale
può essere rappresentato come una "scatola
nera" in un diagramma di flusso, come illustrato
in figura 2.3.4. Se il rilievo dell'input/output è
ben definito, ci sarà un modo di specificare
l'operazione cosicché conoscendo l'input e l'operazione
si determina l'output. Una teoria cognitiva a questo
livello di astrazione corrisponde al livello computazionale
di Marr perché specifica quale informazione è
mappata dall'input all'output ma senza specificare come
questa trasformazione può essere compiuta. Una
funzione matematica che mette in relazione l'input all'output
è il modo ideale di specificare l'operazione,
come abbiamo fatto per l'esempio del termostato, ma
più avanti ne faremo una descrizione migliore.
SCOMPOSIZIONE
RICORSIVA
Sebbene la descrizione informazionale è una condizione
necessaria per una teoria dell'elaborazione dell'informazione,
essa non è sufficiente perché ci sono
teorie che si basano sull'assunzione della descrizione
informazionale ma che non sono tuttavia teorie dell'elaborazione
dell'informazione. La teoria della raccolta dell'informazione
di Gibson, per esempio, specifica le corrispondenze
informazionali tra input e output e quindi soddisfa
l'assunzione della descrizione informazionale. Tuttavia
la teoria di Gibson non è una teoria dell'elaborazione
dell'informazione perché esplicitamente nega
la necessità di analizzare le rappresentazioni
interne o i processi che compiono la mappatura. Palmer
e Kimchi (1986) specificano questa nuova cruciale istanza
delle teorie dell'elaborazione dell'informazione come
assunzione della scomposizione ricorsiva. Essa è
usata per formulare descrizioni più complete
di che cosa deve andare all'interno della scatola nera.
2)
Scomposizione ricorsiva
Alcuni complicati eventi informazionali possono essere
spiegati più completamente a partire da un basso
livello di scomposizione e con un diagramma di flusso
che specifica le relazioni di ordine temporale tra le
componenti. L'importante concetto introdotto da questa
assunzione è che si può definire una scatola
nera in termini di un numero di più piccole scatole
nere dentro di essa, oltre che da una specificazione
di come esse sono interconnesse. Queste più piccole
scatole nere sono spesso chiamate "stages"
e sono indipendenti da altri "stages". Un
piccolo esempio di scomposizione è l'analisi
di un sistema stereo nei suoi componenti funzionali:
sintonizzatore, lettore cd, piastra di lettura/registrazione
cassette, preamplificatore, amplificatore e microfono
(vedi figura 2.3.5). In molti casi, tutti questi componenti
sono protetti da una vetrinetta, in altri casi ognuno
di essi ha una propria chiusura con dei fili collegati
tra loro che corrispondono alle frecce del flusso di
informazioni della figura 2.3.5.
Commento
alla figura 2.3.5 pag.74
Diagramma di flusso di un sistema stereo. La scomposizione
funzionale di un tipico sistema stereo lo separa nelle
diverse componenti e nelle relazioni tra le varie parti.
Dicendo
che la scomposizione è ricorsiva significa che
può derivare dal risultato della scomposizione
precedente. Così tutte le componenti dell'esempio
dello stereo possono essere scomposte ulteriormente
nei suoi circuiti interni in un processo interattivo
di ulteriore scomposizione.
Questi diagrammi di flusso scomposti in singole componenti
di un sistema di elaborazione dell'informazione possono
corrispondere a quello che Marr chiamava "livello
algoritmico". Ma è presente una differenza
tra i due: Marr vedeva questo livello algoritmico come
singolo, di unitaria entità, mentre Palmer e
Kimchi lo concepiscono come composto da molte gerarchie
di livelli incastrati. Anche un programma di computer
può essere visto come una singola entità
o come una gerarchia di incastri di diagrammi di flusso.
Palmer e Kimchi (1986) ritengono che la scomposizione
ricorsiva per gli psicologi giace nel cuore dell'approccio
dell'elaborazione dell'informazione perché riflette
come tipicamente essi lavorano: cercando di specificare
e testare successivamente e più dettagliatamente
i diagrammi di flusso.
Commento
alla figura 2.3.6 pagina 75
La scomposizione ricorsiva nella cognizione umana. La
mente può essere descritta come un evento informazionale
a diversi livelli di dettaglio. Ogni diagramma di flusso
mostra una scomposizione funzionale della scatola nera
sotto (unita dalla linea tratteggiata) in un set di
semplici operazioni e flusso di informazioni fra essi.
Questa
figura illustra un esempio di scomposizione ricorsiva
applicata alla cognizione umana. La mente come "tutto"
è rappresentata da una singola scatola nera nella
figura 2.3.6A. Gli psicologi la scompongono in rapporto
ad un piccolo numero di componenti base illustrati in
fig. 2.3.6B ed evidenziano le loro connessioni. Ricordiamo
che l'argomento di questo libro - la percezione visiva
- è rappresentato come un singolo processo in
questo diagramma di flusso.
La scomposizione ricorsiva ammette che si comprenda
gradualmente la complessità di un sistema di
elaborazione di informazione. È importante ricordare
che gli eventi informazionali al livello più
basso devono anche avere una descrizione informazionale
che specifica cosa fanno quando mappano input e output
ma non hanno bisogno di specificare come lo fanno. Il
"come" si può capire scendendo di livello
nella via gerarchica della nuova scomposizione.
Questa impresa di scomposizione ricorsiva in una gerarchia
di componenti sarà un successo solo nell'estensione
del sistema stesso. Il Nobel Herbert Simon (1969) ha
avanzato diverse argomentazioni sul fatto che il sistema
del processo di elaborazioni di informazioni è
strutturato in questo modo. Egli caratterizza la cognizione
umana come "quasi scomponibile" per distinguerla
da alcuni sistemi costruiti dall'uomo, come lo stereo
del nostro esempio precedente, che sono del tutto scomponibili.
La distinzione di Simon confronta le interazioni che
esistono all'interno delle componenti con quelle che
esistono tra le componenti. Un sistema scomponibile
è uno nel quale le interazioni tra le componenti
sono irrilevanti se confrontate con quelle all'interno
di esse. In una più recente terminologia, questi
sistemi sono chiamati modulari, significando che sono
scomponibili in un set di processi indipendenti: il
filosofo Jerry Fodor (1983) ha confermato la verità
dell'ipotesi modulare del pensiero umano. Un sistema
quasi scomponibile è quello in cui le interazioni
tra le componenti sono deboli ma non irrilevanti, e
un sistema non scomponibile è quello in cui le
interazioni tra le componenti sono tanto forti quanto
quelle all'interno delle componenti.
Alcuni teorici della percezione - in particolare Gestaltisti,
della scuola ecologica e di quella connessionista del
pensiero - sono sensibilmente meno ottimisti di Simon
(1969) e Fodor (1983) riguardo al dominio verso il quale
il pensiero umano è anche quasi scomponibile
in moduli. Molti Gestaltisti credevano che gli eventi
mentali dovessero essere compresi in termini di insieme
di più parti, olistico, come un'area di interazione
che prende posto nel cervello. Questa concezione non
si adatta all'idea che i processi cognitivi formano
un "quasi sistema" scomponibile, caratterizzato
da un diagramma di flusso della scomposizione ricorsiva.
Più recentemente alcuni teorici connessionisti
hanno anche messo in discussione la validità
della scomposizione ricorsiva confermando la spiegazione
dei livelli neurali di percezione e cognizione. Essi
spiegano che alcune descrizioni dei più alti
livelli - che sono dimostrati nei diagrammi di flusso
- sono solo una semplice approssimazione della vera
e propria descrizione del livello neurale (Smolensky,
1988). Gibson e alcuni dei suoi seguaci prendono la
posizione opposta, concentrandosi prima sulla descrizione
informazionale della percezione al più alto livello
computazionale senza cercare di analizzarlo nei suoi
processi interni.
L'idea |