HOME Italia
HOME USA
Curriculum
Ricerca
Risorse
Psicologia della Percezione
Links
Scrivi
Ti serve acquistare il Palmer per l'esame di Psicologia della Percezione? Clicca qui!
Amazon & Psiconet

 

 

Capitolo 2

Le traduzioni che potrete trovare su questo sito sono unicamente destinate ad uso interno per il corso di Psicologia della Percezione dell'Università degli studi di Trieste. Nascono con l'intento di fornire un ausilio a quegli studenti che non hanno molta dimestichezza con la lingua inglese. Le traduzioni sono opera degli stessi studenti del corso di Psicologia della Percezione 1999 - 2000. Nell'utilizzo di questo materiale va tenuto conto che la correttezza dello stesso va verificata confrontando le traduzioni con il testo originale. Per ulteriori domande, clicca qui.

Approcci Teorici alla Visione


tradotto e curato da:
Laura Bortolossi
Cristina Silvestri
Elena Vittone
Elena Burlon
Cristina Zomero


Approcci teorici alla visione 2

2.1 Teorie classiche sulla visione
2.1.1 Strutturalismo
2.1.2 Gestaltismo
Olismo
Isomorfismo Psicofisico
2.1.3 Ottica Ecologica
Analisi della struttura dello stimolo
Percezione diretta
2.1.4 Costruttivismo
Inferenza Inconscia
Interpretazione euristica
2.2 Una breve storia dell'Information Processing
2.2.1 Computer Vision
L'invenzione dei computer
Mondo dei blocchi
Approccio computazionale all'Ottica Ecologica
Connessionismo e Reti Neurali
2.2.2 Psicologia dell'Information Processing
Primi Sviluppi
Registrazione di una singola cellula
Autoradiografia
Tecniche di Brain Imaging
2.3 Teorie dell'Information Processing
2.3.1 La metafora del computer
2.3.2 Tre livelli dell'Information Processing
Il livello computazionale
Il livello algoritmico
Il livello implementazionale
2.3.3 Tre assunzioni sull'Information Procesing
Descrizioni informazionali
Decomposizione ricorsiva
Incorporazione Fisica
2.3.4 Rappresentazioni
2.3.5 Processi
Informazioni Implicite versus Esplicite
Processamento come Inferenza
Assunzioni Nascoste
Processamento Euristico
Assunzioni Nascoste versus Validità Ecologica
Processi Top-down versus Validità Ecologica

2.4 Quattro Stadi della Percezione Visiva
2.4.1 Immagine Retinica
2.4.2 Stadio Basato sull'Immagine
2.4.3 Stadio Basato sulle Superfici
2.4.4 Stadio Basato sugli Oggetti
2.4.5 Stadio Basato sulle Categorie

Gli scienziati della visione cercano di capire come la conoscenza dell'ambiente può essere estratta dalla luce che entra negli occhi. Il sapere scientifico di un dominio complesso, quale è quello della percezione visiva, richiede molto di più che una semplice conoscenza dei fatti; richiede una teoria. Una teoria è un integrato set di asserzioni (chiamate ipotesi) sui meccanismi costitutivi o principi che, non solo organizzano e spiegano i fatti, ma fanno anche delle predizioni.
Esamineremo molte teorie in questo libro. Molte di queste hanno qualcosa in comune: non sono corrette. Conoscere teorie diverse, anche incomplete o sbagliate, è importante perché anch'esse possono contenere importanti elementi veri o possono proporre un nuovo e illuminante punto di vista.
Come decidere qual è la teoria migliore? Gli scienziati usano un principio chiamato rasoio di Ockham: la miglior teoria è quella più parsimoniosa, cioè la teoria che spiega i risultati empirici con meno assunzioni. Alla parsimonia, come criterio di valutazione, va aggiunta alla consistenza logica e all'adeguatezza empirica.


________________________________________________________________________________


2.1 TEORIE CLASSICHE DELLA VISIONE

Kurt Koffka (1935), psicologo gestaltista, enucleò meglio di chiunque altro il problema della percezione visiva in una semplice domanda: "Perché le cose appaiono come appaiono?" Ecco tre classiche risposte che formano il cuore di teorie psicologiche della percezione visiva:
1. Ambiente versus organismo. Una possibile risposta al quesito di Koffka è "Perché il mondo è fatto così". Questa frase rimanda all'analisi delle condizioni esterne per capire la percezione. In particolare, suggerisce che si potrebbe esaminare se il tipo di informazione dello stimolo prossimale corrisponde a quella dello stimolo distale. Una risposta alternativa potrebbe essere "Perché il nostro sistema nervoso della visione è fatto così". Qui si richiama all'analisi della natura dell'organismo piuttosto che alla natura esterna del mondo. Facendo un compromesso è possibile trovare una posizione intermedia: sia la struttura degli stimoli esterni, che la struttura interna dell'organismo sono importanti.
2. Acquisito versus innato. "Perché abbiamo imparato a vedere in quel modo": è la visione empirista in accordo con il fatto che noi vediamo in quel modo grazie alle conoscenze accumulate con la nostra personale interazione con il mondo. Una risposta alternativa è "Perché siamo nati per vedere in quel modo", questo è il punto di vista innatista per cui noi non abbiamo bisogno di acquisire specifiche conoscenze durante la nostra vita perché l'evoluzione ci ha forniti del necessario meccanismo neuronale. Questa spiegazione in termini di maturazione può considerarsi innatista.
3. Atomismo versus olismo. "In funzione del modo in cui appare ogni piccolo pezzo del campo", questa è la visione atomistica per cui la percezione dell'intero campo visivo si può raggiungere semplicemente mettendo insieme ogni pezzo dell'esperienza visiva di ogni regione locale. Ciò contrasta con la risposta " In funzione del modo in cui è organizzato l'intero campo visivo ": questa è la visione olistica che suggerisce che pezzi singoli non possono essere semplicemente messi insieme ma devono essere integrati globalmente.
4. Introspezione versus comportamento. Questa controversia concerne se la teoria della percezione può derivare dalle osservazioni fenomenologiche della nostra esperienza conscia (introspezione) o da misurazioni obiettive della performance umana (comportamento). Koffka presupponeva un approccio introspettivo chiedendosi "Perché le cose appaiono come appaiono?", infatti "come appaiono " presuppone l'esperienza cosciente. Un comportamentista si sarebbe chiesto "Che cosa ci rende capaci di fare la visione?"

Con queste domande in mente analizziamo ora quattro teorie diverse della percezione visiva; tre di queste, strutturalismo, gestaltismo e ottica ecologica, sono facilmente identificabili con le quattro questioni chiave, l'ultima, il costruttivismo è una specie di mix delle altre tre. Il costruttivismo rappresenta la corrente dominante e ci porta direttamente al moderno punto di vista dell'Information Processing.


TEORIA INNATISMO VSEMPIRISMO ATOMISMO VS OLISMO ORGANISMO VS AMBIENTE PRINCIPALE ANALOGIA METODO
Strutturalismo Empirismo Atomismo Organismo Chimica Introspezione
Gestaltismo Innatismo Olismo Organismo Fisica Introspezione
Ottica Ecologica Innatismo Olismo Ambiente Risonanza meccanica Analisi dello stimolo


2.1.1 STRUTTURALISMO

Il primo approccio psicologico alla teoria della percezione è chiamato strutturalismo: mette radici nella scuola filosofica dell'empirismo inglese (Locke , Berkeley, Hume). Queste idee furono introdotte in psicologia dal suo padre fondatore, W.Wundt in Germania e furono più tardi portate negli Stati Uniti da uno dei suoi allievi, E.Titchener.
Lo strutturalismo vede la percezione come un processo che sorge da atomi sensoriali base, primitivi, indivisibili elementi dell'esperienza specifica di una modalità (visiva, uditiva), che rimandano a ricordi di altri atomi sensoriali che sono stati associati (raggruppati assieme) nella memoria attraverso avvenimenti ripetuti precedentemente. Queste associazioni si verificano quando l'esperienza sensoriale è abbastanza chiusa in uno spazio e in un tempo e dopo un sufficiente numero di presentazioni. Nel caso della visione gli atomi sensoriali sono le esperienze visive di colore in ogni piccola regione del campo visivo risultanti presumibilmente dall'attività di ogni fotorecettore nella retina. Queste locali sensazioni sono assunte come combinazione da semplici concatenazioni in percezioni: immaginiamo di unire assieme pagine trasparenti ognuna delle quali contiene una piccola macchia di colore ad una singola locazione al fine di creare un disegno unitario.
Inoltre le esperienze visive suscitano ricordi di altre modalità sensoriali tramite associazione. Ad esempio la memoria di com'è un cane può essere associata a come abbaia, al suo odore, etc.; e una parte del cane, ad esempio la testa, può essere associata ad un'altra parte del corpo come le gambe, il corpo e la taglia. La percezione è concepita come un processo di associazione molto rapido e inconscio che permette l'accesso alla memoria attraverso l'esperienza con il mondo. Secondo il Strutturalismo, un osservatore apprende sempre di più grazie alle associazioni, e le sue percezioni diventano più ricche, più accurate, e più complesse. Le sensazioni sono tenute assieme in percetti più complessi, che sono il risultato di associazioni nella contiguità spazio-temporale delle esperienze passate.
Un altro fondamento su cui il strutturalismo è costruito è il metodo dell'introspezione "allenata". Gli strutturalisti ritengono che uno può scoprire le unità elementari della percezione spostando l'attenzione all'interno (introspezione) e osservando la sua stessa esperienza. Prima la persona deve essere addestrata ma, ad ogni modo, rimane un metodo poco credibile in quanto ha forti influenze rilevabili nei risultati ottenuti
Comunque il strutturalismo può essere visto come una fase di transizione tra il periodo filosofico all'inizio della storia della teoria della percezione e un periodo psicologico più sofisticato. Senza benefici per le scoperte dei nuovi scienziati, il strutturalismo ha cercato di tradurre la visione filosofica degli empiristi inglesi più o meno direttamente nell'emergente disciplina della psicologia.

2.1.2 GESTALTISMO

Storicamente il movimento gestaltista è considerato una reazione contro il strutturalismo; i suoi leader furono Max Wertheimer, Wolfang Kohler, Kurt Koffka.

Olismo. Gestalt è una parola tedesca che significa "forma intera" o "configurazione". Come il nome suggerisce, l'idea strutturalista che i gestaltisti rifiutarono più veemente è quella secondo cui la percezione e costruita da atomi di sensazioni uniti da una semplice concatenazione. Infatti il loro grido di battaglia era "L'intero è diverso dalla semplice somma delle parti"; un esempio sono le configurazioni che hanno delle proprietà emergenti che non sono divisibili in nessuna delle loro parti locali. I Gestaltisti rifiutano le idee strutturaliste perché la semplice concatenazione delle parti può raramente catturare la struttura percepita dell'intero. Il merito dei psicologi Gestaltisti fu quello di teorizzare quegli aspetti della percezione che dipendono dalla qualità della figura intera o dalla configurazione.
Ovviamente i Gestaltisti rifiutano l'analogia classica del strutturalismo con la chimica perché è una visione troppo atomistica. Preferiscono riferirsi ai processi mentali come una analogia alle forze dei campi magnetici della fisica. L'aspetto cruciale dei campi magnetici a cui si appellano i gestaltisti è la loro natura olistica. Per esempio, una singola particella caricata positivamente definisce un campo magnetico che si estende in uno spazio. Ma se si aggiunge una seconda particella, la struttura dell'intero campo magnetico cambierà, è cambierà in relazione alla carica delle due particelle. Questo esempio è conforme all'idea gestaltista della struttura delle configurazioni come un intero, piuttosto che come una concatenazione di parti.
Come ulteriore reazione contro lo strutturalisno i Gestaltisi rifiutano l'empirismo come base della percezione. Per esempio, essi credevano che il meccanismo dell'organizzazione percettiva non richiede apprendimento dall'esperienza, ma avviene grazie all'interazione delle strutture del cervello con la struttura dello stimolo. Comunque, la posizione innatista nella teoria gestaltista è meno centrale di quella olistica.

Isomorfismo Psicofisiologico. I Gestaltisti formularono la loro posizione nella relazione tra mente e cervello nella loro dottrina dell'isomorfismo psicofisico. Esso consiste nel fatto che le esperienze percettive sono strutturalmente le stesse (isomorfiche) ai sottostanti eventi mentali (fisiologici). Un esempio è la teoria dell'isomorfismo psicofisiologico della teoria dell'opponent process (Hering): cioè ci sono sei colori primari strutturati come tre paia di opposti: rosso vs verde, blu vs giallo, nero vs bianco. Questa analisi è basata su osservazioni intuitive grazie alle esperienze visive del colore. La dottrina Gestaltista dell'isomorfismo psicofisiologico, asserisce che ci potrebbero essere delle strutture neurali corrispondenti che governano la percezione del colore. Ci sono delle evidenze sperimentali che confermano questa ipotesi: nel sistema visivo umano ci sono tre tipi di neuroni che codificano il colore in tre paia di opposti rosso/verde, blu/giallo, nero/bianco, proprio come l'analisi dell'esperienza del colore di Hering suggerisce. Questa corrispondenza tra esperienze del colore e eventi neuronali opposti supporta la dottrina Gestaltista dell'isomorfismo psicofisiologico.
Ma l'isomorfismo psicofisiologico non è sufficiente a definire una teoria neurologica delle funzioni mentali. Wolfang Kohlerhikkokkh (1920/1950), esplorò in modo più approfondito le connessioni tra le idee della teoria della Gestalt e i meccanismi del cervello sottostanti. Il cervello stesso è un esempio di ciò che chiamiamo Gestalt fisica: un sistema fisico dinamico che converge verso uno stato di equilibrio spendendo energia il meno possibile. I Gestaltisti usano spesso la metafora della bolla di sapone: esse hanno l'interessante proprietà per cui, non importa la loro forma iniziale, esse inevitabilmente si evolveranno in una sfera perfetta. I cambiamenti avvengono perché la distribuzione locale della tensione allo sforzo si propaga in tutta la superficie finché la bolla di sapone raggiungerà lo stato di stabilità globale. Ci sono molte altre "gestalten" fisiche definibili con questa proprietà dinamica, e i Gestaltisti credono che il cervello sia il primo esempio.
Il secondo, più specifico principio di Kohler dice che i meccanismi del cervello che sottostanno alla percezione sono campi elettromagnetici generati da milioni di neuroni. Molti esperimenti per testare questa ipotesi fallirono e, ne conseguì che la teoria della Gestalt perse i favori della comunità scientifica. Oggigiorno però le idee gestaltiste hanno avuto un ritorno nella forma di teorie dinamiche connessioniste, come vedremo più avanti.

2.1.3 OTTICA ECOLOGICA

Questa teoria della visione è il risultato primariamente di un uomo: James.J,Gibson della Cornell University. Anche Gibson si oppose vigorosamente agli strutturalisti e, allo stesso tempo, fu influenzato fortemente dal movimento Gestaltista, in particolare per l'enfasi olistica. Diversamente dai gestaltisti essi però, rifiutava l'idea che la struttura organismica è alla base della percezione. Gibson propose invece che la percezione può essere capita meglio analizzando la struttura dell'ambiente in cui è inserito l'organismo. Questa è l'ecologia.
L'ottica ecologica è più una teoria sulle basi informazionali della percezione dell'ambiente piuttosto che sulle basi del meccanismi nel cervello. Questo approccio segna una drastica divisione dalle teorie precedenti e precede di un bel po' i moderni lavori nella visione computazionale.

Analisi della struttura dello stimolo. La meta della teoria ecologica della visione di Gibson è sottolineare che come il mondo viene strutturato dalla luce nell'ambiente dell'optic array (AOA), così le persone sono capaci di percepire l'ambiente campionando informazione. In termini diversi Gibson si propose di trovare quali caratteristiche dello stimolo prossimale producono l'informazione sullo stimolo distale. In particolare l'intero pattern di stimolazione prossimale contiene molta più informazione sullo stimolo distale di quanto si sospettava. Per esempio Gibson teorizzò il gradiente di tessitura ovvero un graduale cambiamento in termini di diminuzione di grandezza, di aumento di densità e di proiezione in 2-D in corrispondenza all'allontanamento delle superfici. Molte superfici nel mondo hanno un'approssimativa tessitura uniforme: prati erbosi, muri di pietra, pareti tappezzate, piastrelle…solo per nominarne alcune. Gibson identifica nel gradiente di tessitura l'origine dell'informazione sulla profondità, l'inclinazione, e la grandezza degli oggetti nell'ambiente e dimostra come i soggetti possono percepire queste proprietà.
La teoria ecologica è anche importante perché enfatizza il ruolo della visione come attività esploratrice del mondo, con le relative conseguenze di tipo informazionale. Quando l'osservatore si muove attorno al mondo il pattern spaziale di stimolazione della retina cambia costantemente nel tempo (concetto di optic flow e di AOA dinamica). Infatti, il sistema visivo degli organismi si evolve con il movimento adattivo: cercare cibo, acqua, compagni, riparo. L'ottica ecologica cerca anche di specificare, per un osservatore in movimento, quali informazioni ricavate dall'ambiente sono utilizzabili. Un altro dei più importanti insight nello studio della "informazione utile" nella dinamica AOA è che la stessa informazione ottica che specifica l'informazione ambientale specifica anche la traiettoria dell'osservatore.
Gibson credeva che l'informazione sufficiente ricavabile dalla stimolazione della retina permette ad un organismo di esplorare attivamente l'ambiente e di percepirlo senza ambiguità. Questo processo, che si completa nel cervello, si chiama information pick up e si basa sulla metafora della risonanza, per specificare come avviene questo processo. Semplicemente, l'informazione nello stimolo produce l'attivazione delle appropriate strutture neuronali appropriate, analogamente al modo in cui una data vibrazione meccanica dell'aria mette in vibrazione un diapason con la stessa frequenza caratteristica.

Percezione diretta. L'aspetto più controverso della teoria di Gibson è l'assunto della percezione diretta: l'idea che la percezione visiva dell'ambiente è pienamente specificata dall'informazione ottica ricavabile dalla retina in movimento, dall'esplorazione di un organismo attivo senza nessun processo di mediazione di rappresentazioni interne. Gibson infatti era contrario all'idea che la percezione è possibile solo facendo delle "inferenze inconsce" in aggiunta all'informazione strettamente percettiva. Egli rifiuta questa influenza aggiunta alla percezione, sostenendo invece che non c'è nessun bisogno di quelle inferenze se si considerano le molte potenzialità dell'informazione ottica, in particolare quella ricavata dall'optic flow dell'organismo che esplora l'ambiente.
Sfortunatamente, la brillante analisi dell'informazione ricavabile nella dinamica AOA ha dei limiti nel spiegare la fondamentale indeterminazione nella ricostruzione del mondo reale a 3-D dalla piatta informazione retinica 2-D (the inverse problem, sezione 1.2.3.). Gibson enfatizza ancora una volta il ruolo dell'osservatore esplorativo, che risolve il problema aggiungendo la dimensione temporale allo stimolo prossimale. Ma nella dinamica AOA, questa informazione aggiunta è ancora insufficiente in quanto gli eventi ambientali sono effettivamente a quattro dimensioni (tre spaziali più una temporale) e l'informazione nella dinamica AOA è solo tridimensionale (due dimensioni spaziali e una temporale), anche quando sono usati i due occhi contemporaneamente. L'informazione addizionale della dimensione temporale vincola le soluzioni al problema inverso (cioè restringe il numero delle soluzioni valide), ma non lo risolve completamente.

2.1.4 COSTRUTTIVISMO

Molti teorici della percezione, discutendo sul problema inverso, hanno concluso che, nel processo della visione, ci deve essere qualche tipo addizionale di informazione in aggiunta all'immagine retinica. In un modo o nell'altro, il nostro sistema visivo dalle informazioni che contribuiscono a formare l'immagine retinica arriva alla soluzione più idonea tra quelle logicamente infinite. Questa è la posizione a cui si rifà il costruttivismo.
Il costruttivismo, che è il classico approccio dominante alla teoria della visione, combina i più diversi aspetti delle teorie precedenti; per questo si può definirla una teoria eclettica.
Il moderno costruttivismo intende essere primariamente una teoria del meccanismo interno della percezione, piuttosto che centrata sull'ambiente esterno. Comunque il meccanismo interno delle teorie costruttiviste si basa spesso sull'estrazione di informazioni ambientali dai pattern di stimolazione ottica che Gibson ha descritto all'interno dell'ottica ecologica. Il costruttivismo perpetua l'idea che i percetti globali sono costruiti dall'informazione locale. Allo stesso tempo sottolinea l'importanza delle proprietà emergenti quali linee, bordi, angoli e anche le figure intere dei gestaltisti. Rispetto alla controversia innato-acqusito, il moderno costruttivismo è neutrale. Per certi aspetti il processo percettivo deve essere sicuramente innato per altri, invece, sono appresi attraverso l'interazione con il mondo. Definire quali aspetti sono innati e quali acquisiti è un problema che deve essere affrontato studiando lo sviluppo infantile. Infine i più moderni costruttivisti sono, metodologicamente parlando, comportamentisti. Cioè, essi estraggono inferenze sui processi percettivi studiando misure quantitative di comportamenti umani e animali piuttosto che ( o in aggiunta) introspettivamente. In questo essi si scontrano sia con i strutturalisti che con i gestaltisti, anche se non ci sono dubbi che l'analisi introspettiva è il primo passo importante nella teoria costruttivista; la differenza è che i costruttivisti poi procedono nella raccolta di misure comportamentali per dimostrare la loro ipotesi oggettivamente.

Inferenze inconsce. Il padre della teoria costruttivista è Hermann von Helmholtz, brillante fisico, matematico e psicologo tedesco. Molte delle sue idee base sono state pubblicate già nel 1867, nel libro Trattato di Ottica Fisiologica, e sono sorprendentemente rimaste intatte. Nonostante i molti contributi significativi allo studio della percezione visiva, uno dei concetti helmholtziani più "duraturi", è l'idea centrale che la percezione dipende da inferenze inconsce. Diversamente da Gibson, Helmholtz conosceva il buco esistente tra l'informazione ottica direttamente ottenuta dalla stimolazione retinica e la conoscenza percettiva che ne deriva (gap(=buco, divario) richiama la natura indeterminata dell'inverse problem). Helmholtz sosteneva che il buco poteva essere coperto. Egli sosteneva che la visione richiede un processo di inferenze, o qualcosa di molto simili ad esse, che trasformi le informazioni insufficienti a 2-D, in un'interpretazione percettiva dell'ambiente a 3-D. Il processo di inferenza percettiva è inconscio perché le persone non hanno coscienza di come , quando, perché, avvengano. Più recentemente, Richard Gregory(1970), Julian Hochberg (1964), e Irvin Rock (1983), hanno rimodernizzato e rielaborato l'idea helmholtziana.
Se il sistema visivo fa inferenze sulla natura dell'ambiente dalle informazioni ottiche derivanti dalla stimolazione retinica, è importante conoscere le basi sulle quali vengono fatte queste inferenze. Questo proposito viene chiamato likelihood principle: è un modo probabilistico di vedere la percezione per cui il sistema visivo computa l'interpretazione con la più alta probabilità determinata dalla stimolazione retinica.
Il likelihood principle è spesso confuso con il principio della Gestalt di Pregnanza (chiamato anche principio del minimo), che sta alla base della selezione sopra le possibili interpretazioni secondo la "bontà" e la "semplicità" tra le alternative.
Per esempio, il fatto che le persone percepiscono la prima figura come un cerchio dietro un quadrato, piuttosto che come un quadrato dietro tre quarti di cerchio (terza figura), viene spiegato dal likelihood principle costruttivista come conseguenza del fatto che è molto più probabile che un cerchio intero sia in parte occluso da un quadrato. Lo stesso esempio può essere spiegato dal principio gestaltista della Pregnanza, per cui un cerchio intero è una figura "migliore" di tre quarti di cerchio nella direzione di una forma più regolare, semplice, e più simmetrica.


Interpretazione euristica. La prospettiva teorica di questo libro fa riferimento largamente alla nozione helmholtziana dell'inferenza inconscia. In particolare svilupperemo l'idea che il sistema visivo va oltre l'informazione ottica facendo un alto numero di possibili assunzioni sulla natura dell'ambiente e sulle condizioni sotto le quali è visto. Quando queste assunzioni vengono "accoppiate" con l'immagine sensoriale, danno come risultato un processo di interpretazione euristica, con cui il sistema visivo fa inferenze sulla migliore condizione ambientale che può aver prodotto l'immagine. Questo processo è euristico perché usa le regole probabilistiche che sono spesso, anche se non sempre, vere. Se, per esempio l'inferenza è falsa, avremo delle conclusioni sbagliate, le illusioni visive (sezione 2.3.5).
Il likelihood principle è strettamente in connessione con la nozione costruttivista della percezione come processo euristico. L'utilità evoluzionistica della visione è massimizzata dall'uso della più probabile ipotesi per arrivare ad una interpretazione corretta della realtà esterna.
Le ipotesi "nascoste" fatte dal sistema visivo sono molte e varie. Un esempio è il fatto che gli ambienti interni, quali soffitti, piani, muri sono tutti allineati verticalmente e perpendicolarmente dalla forza gravitazionale.
Un'interpretazione letterale dell'inferenza inconscia è che la percezione è accompagnata da un modo sequenziale di applicare le regole della logica simbolica o risolvendo equazioni matematiche. Inoltre, questo è il tipo di processo che Helmholtz sembrava avere in mente quando propose la sua interpretazione di inferenza inconscia. Fortunatamente, oggigiorno ci sono interpretazioni più plausibili che utilizzano il modello computazionale che si adatta allo schema generale inferenziale dei costruttivisti. Per esempio reti connessioniste possono arrivare a conclusioni percettive basate parzialmente su dati sensoriali in entrata e con l'aggiunta di elementi inclusi in pattern di interconnessioni di elementi simili ai neuroni. Tali reti sono in grado di "fare inferenze" sulla base di assunzioni euristiche senza operazioni né logiche né matematiche.


2.2 UNA BREVE STORIA DELL' INFORMATION PROCESSING (elaborazione delle informazioni).

La scienza della visione nasce negli anni 1950-60, quando tre importanti cambiamenti hanno modificato il modo di concepire la visione:
l'uso della simulazione al computer
l'applicazione delle concezioni base dell'elaborazione delle informazioni alla psicologia
l'emergere dell'idea che il cervello è un elaboratore biologico di informazioni.

2.2.1 LA VISIONE NEL COMPUTER.

Nello sviluppo della scienza della visione ha avuto un ruolo centrale l'idea che i moderni computer digitali potevano venire usati per simulare la complessa elaborazione percettiva. In precedenza la visione era considerata una funzione esclusiva degli organismi viventi e gli scienziati testavano le ipotesi che formulavano solo su esseri viventi. L'avvento della simulazione al computer ha radicalmente cambiato la situazione: gli scienziati lavoravano così su sistemi le cui regole di funzionamento erano conosciute in anticipo ed utilizzavano il computer per confrontare il comportamento del computer con quello degli organismi viventi.

L'INVENZIONE DEL COMPUTER. Il computer è stato inventato nel 1930 da un brillante matematico inglese : Alan Turing. Egli inventò una serie di macchine ipotetiche, che noi conosciamo ora come le macchine universali di Turing. Queste macchine potevano essere programmate per elaborare in maniera automatica le informazioni. La macchina di Turing era ipotetica nel senso che era un'astrazione matematica.
Nel 1946 il matematico John von Neumann costruì il primo computer digitale, che fu chiamato ENIAC.
Da allora il computer è stato sempre più perfezionato, comunque i moderni computer digitali sono tutti degli esempi delle macchine universali di Turing.
Sin dal 1940 Turing capì le incredibili capacità della sua macchina per simulare il pensiero intelligente. E' proprio questa idea che da origine all'INTELLIGENZA ARTIFICIALE, la branca della scienza del computer nella quale i programmi vengono scritti con lo scopo di simulare il comportamento intelligente. All'inizio i teorici dell'intelligenza artificiale cercavano di simulare dei compiti cognitivi difficili, come giocare a scacchi e dimostrare i teoremi matematici. Solamente in seguito vennero creati dei programmi che consentivano una simulazione della percezione visiva.
Questo sforzo porta alla nascita di quella branca della scienza della visione, che si occupa di come il computer può essere programmato ad estrarre dall'immagine ottica informazioni sulle condizioni ambientali.
Lo studio della visione al computer(computer vision) ha promosso due importanti cambiamenti:
1) IMMAGINI REALI: le teorie della visione simulate al computer possono venire applicate ad immagini su scala grigia, ottenute registrando con una videocamera scene del mondo reale. Le teorie classiche della percezione visiva sono state generalmente costruite per tenere conto di condizioni stimolo che non esistono nella situazione reale.
Le teorie della visione simulate al computer sono applicate ad immagini reali di oggetti reali.
2) TEORIE ESPLICITE: prima della simulazione al computer, le teorie della percezione visiva erano vaghe, informali ed incomplete, puntavano su leggi concettuali e tutto ciò portava a tralasciare importanti dettagli.
La simulazione al computer ha cambiato questo stato di cose, perché una delle qualità caratteristiche della programmazione al computer è quella di cercare di rendere esplicita ogni cosa.
Questi cambiamenti hanno portato alla consapevolezza che la visione è qualcosa di estremamente difficile: è difficile far si che il computer "veda" le cose più semplici. Inoltre tutte le concezioni, che gli psicologi avevano precedentemente studiato, hanno richiesto un'enorme fatica per essere tradotti in termini computazionali.

MONDO DEI BLOCCHI (blocks world). All'inizio le teorie della visione simulate al computer consideravano le scena come un mondo composto da blocchi: un micromondo nel quale tutti gli oggetti che possono essere percepiti sono dei solidi geometrici, semplici, colorati uniformemente e posti su una superficie. Una delle prime simulazioni significative della visione fu un programma di Roberts (1965).
Fig. 2.2.2:Una immagine video di una configurazione in blocchi (parte a) viene elaborata nei bordi locali (parte c), che vengono poi uniti in contorni continui (d,e). Questa configurazione di linee viene poi uniformato attraverso l'individuazione di volumi, che dovrebbero condurre insieme alla creazione di una forma corretta (f) e dovrebbero predire la sua apparenza in un'altra prospettiva (b).

L'APPROCCIO COMPUTAZIONALE ALL'OTTICA ECOLOGICA: i progressi più recenti nello studio della visione al computer sono il risultato di un'analisi formale dell'informazione disponibile nell'immagine ottica. Questo approccio fu sostenuto dai lavori sull'ottica ecologica di Gibson. Viene posta una nuova enfasi sull'analisi di come la struttura ambientale è riflessa in una struttura immaginativa. Il risultato di questo cambiamento fu che i teorici cercarono di capire i modi di recuperare, direttamente dall'immagine, delle informazioni complete sulla scena visiva (particolarmente sulla profondità e sulle inclinazioni delle superfici nelle condizioni tridimensionali).
I pionieri di questo approccio furono due psicofisici olandesi Jan Koenderink e Andrea Van Doorn. Essi applicarono le sofisticate tecniche matematiche della geometria differenziale ai problemi come la percezione del movimento dal flusso ottico, la percezione della profondità dall'informazione stereoscopica…Loro non crearono programmi per il computer, ma i loro lavori hanno ispirato altri a farlo. L'approccio matematico, che ha portato alla creazione de questi programmi, era stato formulato all'Istituto di Tecnologia nel Massachusetts (M.I.T.) da David Marr e dai suoi collaboratori. Questa ricerca è caratterizzata da analisi matematiche di come la luminanza nell'immagine bidimensionale porta informazioni sulla struttura delle superfici e degli oggetti nello spazio tridimensionale.

CONNESSIONISMO E RETI NEURALI: I modelli delle reti connesionistiche e neurali sono basati sull'assunzione che la visione umana dipende dalla struttura parallela di circuiti neuronali nel cervello. Questi modelli sono reti composte da molte unità interconnesse. Lo stato di attivazione di queste unità, che corrisponde approssimativamente all'attivazione dei neuroni, avviene attraverso di reti di connessioni, che, come le sinapsi, sono eccitatorie o inibitorie.
Fig. 2.2.4. Rete connesionista usata nell'apprendimento per back propagation(all'indietro) formata da tre layers (strati): l'input, la trasformazione dall'input all'output e l'output.
Sebbene questi modelli connessionisti possono essere specificati matematicamente, il loro comportamento dipende generalmente da equazioni non lineari, che non sono facilmente risolvibili in maniera analitica (vd. Appendice B). Questo significa che per determinare come si comporta una rete, l'operazione va simulata su un computer.
I precursori storici delle teorie connessionistiche moderne della percezione sono gli studi sui "perceptrons", una particolare classe di modelli di reti studiate da Frank Rosenblatt e coll. Questi perceptrons ci consentono di apprendere come vengono identificate nuove categorie, aggiustando dei pesi sulle loro connessioni secondo delle regole specifiche.
Rosenblatt voleva dimostrare come una semplice regola di apprendimento era sufficiente alle reti per imparare a fare una discriminazione categoriale.
In questo stesso periodo lo psicologo Donald Hebb ha sintetizzato una grande quantità di ricerche sull'apprendimento umano ed animale in una struttura neurale in cui le associazioni sono formate all'interno e tra complessi di cellule, che si attivano nello stesso tempo. Nonostante questi progressi, Marvin Minsky e Seymour Papert (1969) indicarono come questi perceptrons avessero dei seri limiti. Fu proprio la loro critica ad arrestare la ricerca nel campo delle reti neurali per più di una decade. Solo pochi ricercatori tenaci hanno continuato a sostenere l'approccio delle reti neurali e, nei primi anni del 1980, un gruppo di scienziati cognitivi, che lavorano nel dipartimento di psicologia all'università della California, hanno ottenuto importanti risultati, che hanno rivitalizzato questo approccio. Chiamando la loro teoria PDP ( modelli dell'elaborazione distribuita in parallelo), D. Rumelhart, James McClelland, Geoffrey Hinton, Paul Smolensky, Micheal Jordan e i loro coll. Hanno dimostrato che i modelli delle reti neurali hanno importanti vantaggi sui programmi più tradizionali della scienza al computer.

2.2.2. L'ELABORAZIONE DELL' INFORMAZIONE IN PSICOLOGIA.

Un altro importante evento per lo sviluppo della scienza della visione fu la comparsa dell'approccio basato sull'elaborazione dell'informazione in psicologia. A partire dal 1920, gran parte della psicologia era dominata dal comportamentismo. I comportamentisti credevano che la psicologia doveva avere come oggetto di studio il comportamento osservabile. Dal punto di vista metodologico, questo voleva dire abbandonare il metodo introspettivo; dal punto di vista teoretico, si doveva purificare le teorie psicologiche da tutti quei concetti che si riferivano a processi interni.
Tenendo conto di queste cose, la percezione non è tanto importante, dato che è un tipo di esperienza interna del mondo esterno.
Il comportamentismo ha dominato la scena durante gli anni 1940-1950, soprattutto nel campo dell'apprendimento. Alla fine del 1950, iniziò ad emergere un nuovo approccio, che contestò il dogma comportamentista, considerando importanti i processi e gli stati interni. L'idea, che contraddistingue questo movimento, era che i processi interni potevano venire compresi in termini di elaborazione di informazioni, sulla base di nuovi concetti che si erano sviluppati nei campi dell'ingegneria elettrica, della scienza del computer e della teoria dell'informazione. Questo portò al fatto che gli psicologi formulavano le loro teorie sulla visione all'interno di un nuovo, più preciso linguaggio che era strettamente collegato ai programmi del computer. A poco a poco l'approccio dell'elaborazione dell'informazione si consolidò nella psicologia cognitiva, diventando la struttura dominante per capire la percezione visiva e molti altri tipi di attività mentali.
Una delle più grandi pubblicazioni in questa area fu il libro di Broadbent:" Percezione e comunicazione" 1958, nel quale viene analizzato il modo in cui si presta attenzione all'informazione uditiva, che va da un orecchio all'altro. Broadbent suggerì che l'attenzione opera come un filtro che seleziona le informazioni, attraverso dei canali che elaborano l'informazione dopo un'iniziale analisi degli aspetti sensoriali ( vd. Fig. 2.2.5).
Broadbent fu tra i primi a proporre una teoria psicologica nella forma di un diagramma di flusso, che specifica la struttura temporale degli eventi dell'elaborazione delle informazioni.
Una pietra miliare nello sviluppo dell'elaborazione dell'informazione visiva, fu la scoperta da parte i George Sperling della memoria iconica, un particolare tipo di memoria visiva a brevissimo termine. I suoi esperimenti ci hanno fatto vedere molte proprietà affascinanti di questo sistema di memoria ed hanno generato centinaia di studi.
Tutti questi sviluppi sono contrapposti all'approccio del comportamentismo, dato che l'approccio dominante era quello di capire l'attività cognitiva umana.
Un evento importante fu la pubblicazione del libro di Neisser " La psicologia cognitiva" nel 1967, perché ha allontanato definitivamente gli psicologi dal comportamentismo, indirizzandoli verso lo studio della cognizione(percezione, attenzione, ecc.).

2.2.3. ELABORAZIONE DELL'INFORMAZIONE IN BIOLOGIA.

Il terzo importante sviluppo, che ha contribuito all'emergere del paradigma dell'elaborazione dell'informazione fu l'invenzione di una tecnica fisiologica per studiare l'attività neurale nel sistema visivo. Questo nuovo metodo ha portato gli studiosi a chiedersi come l'informazione visiva viene elaborata nella retina e quali sono i centri coinvolti nel cervello. L'esistenza di un metodo per lo studio dell'attività neuronale significa poter tracciare un diagramma funzionale dell'intero sistema visivo, neurone per neurone, specificando quale compito ha ciascun neurone. Così anche in campo biologico si è insediati l'approccio dell'elaborazione delle informazioni.

PRIMI SVILUPPI: prima del 1950 il cervello era semplicemente visto come un organo puramente biologico i cui meccanismi erano oscuri. Infatti ci sono voluti molti anni di studi prima che i biologi scoprano che i neuroni non sono direttamente collegati tra di loro, ma sono delle entità separate che comunicano tra di loro attraverso trasmissioni chimiche lungo sinapsi. L'idea del cervello come elaboratore di informazioni viene accettata solo quando inizia a prendere piede l'analogia tra computer e cervello.
Il matematico John von Neumann (1951) rese esplicita l'analogia, dicendo che gli impulsi neurali che viaggiano lungo gli assoni sono codici digitali, analoghi al processamento binario (0,1)del computer digitale. Pochi neuroscienziati presero seriamente questa semplice analogia, affermando che ci sono molte differenze tra il cervello e i moderni computer digitali. Ma l'idea che il cervello è un elaboratore di informazioni ora è universalmente accettata ed i risultati dei più moderni studi psicologici delle funzioni cerebrali sono interpretati all'interno di questo contesto.
I primi studi sulle funzioni cerebrali furono gli esperimenti sulle lesioni, dove il cervello dell'animale veniva intenzionalmente lesionato o asportato, che portarono alla localizzazione delle funzioni cerebrali. Lo stesso si può dire per le tecniche di stimolazione elettrica cerebrale, che consistono nell'introduzione nel cervello dell'animale di elettrodi e nell'emissione di piccole scosse elettriche, per vedere quale comportamento viene elicitato.
Entrambe queste tecniche si sono rivelate importanti per la comprensione delle strutture dei centri visivi cerebrali, ma nessuna di queste è adeguata per lo studio dell'elaborazione dell'informazione, che ha luogo nel normale funzionamento del cervello, perché esse non misurano il comportamento elettrochimico dei singoli neuroni.

REGISTRAZIONE DELLE SINGOLE CELLULE: tecnica fisiologica creata durante il 1950 per studiare l'elaborazione delle informazioni eseguito dai singoli neuroni.
Fig.2.2.6. Un microelettrodo viene inserito nel sistema visivo dell'animale, mentre patterns di luce sono presentati alla retina. L'attività elettrica degli impulsi neurali viene registrata dall'elettrodo e monitorata dal ricercatore.
Pochi elettrodi sono posizionati su un assone del neurone in modo che possano registrare i piccoli cambiamenti nel potenziale elettrico, che avvengono ogni volta che un impulso neuronale passa lungo l'assone. L'output dell'elettrodo può poi essere registrato ed analizzato per determinare le condizioni stimolo che attivano il neurone. Nel caso della visione, questo è stato scoperto proiettando specifici patterns di luce sulla retina dell'animale per vedere se la loro presenza rende il neurone più o meno attivo.
La più importante scoperta è stata fatta da Stephen Kuffler, David Hubel e Torsten Wiesel all'università di Harvard. Kuffer (1953) ha usato la tecnica di registrazione delle singole cellule per determinare i campi recettivi delle cellule gangliari retiniche: la regione della retina che influenza l'attivazione base del neurone aumentandola (eccitazione) o diminuendola (inibizione). Lo stimolo ottimale per attivare le cellule gangliari era un punto luminoso al centro del campo recettivo, circondato da un disco nero oppure il pattern inverso.
Fig. 2.2.7. CAMPI RECETTIVI NELLE CELLULE DEI GANGLI RETINICI. L'attivazione ON-CENTER, OFF-SURROUND c'è quando la luce stimola la regione centrale, decresce quando la luce stimola il contorno ed è immutato dalla luce fuori dal contorno. L'attivazione dell'OFF-CENTER, ON-SURROUND avviene nel modo opposto.
Fig. 2.2.8.I premi Nobel Hubel e Wiesel hanno cominciato a studiare la corteccia visiva, scoprendo molte proprietà dei campi recettivi delle cellule della corteccia visiva primaria. Loro usarono la tecnica di registrazione delle singole cellule.
Fig. 2.2.9.CAMPI RECETTIVI NELLE CELLULE CORTICALI. Le cellule che si trovano nella prima area della corteccia visiva si prolungano nei campi recettivi, che rispondono più vigorosamente, se sono stimolate da un bordo o da una linea con una particolare posizione ed orientamento.

AUTORADIOGRAFIA: tecnica usata per studiare simultaneamente l'attività in un'ampia area di tessuto cerebrale. Nell'animale viene iniettato uno zucchero radioattivo, che viene accumulato all'interno dei neuroni attivati. Poi viene fatto un autoradiogramma, che è un'immagine fotografica dei pattern di radioattività.
Fig. 2.2.10. Un'autoradiografia di colonne orientate nella corteccia visiva. Le cellule corticali si colorano in nero se sono state attivate, mentre vengono presentate striscie verticali. Le bande verticali nere sono le colonne orientate negli strati più alti della corteccia. La banda nera orizzontale è lo strato 4, che riceve l'input dai nuclei genicolati laterali e risponde a tutto l'orientamento.

I METODI DI BIOIMMAGINE: metodi non invasivi che costruiscono delle immagini del cervello umano. Essi sono:
· la TOMOGRAFIA COMPUTERIZZATA (TC)

· la RISONANZA MAGNETICA (MRI)

· la TOMOGRAFIA AD EMISSIONE DI POSITRONI (PET)

· La costruzione dell'immagine TC dipende dalla trasmissione attraverso una sottile sezione dell'encefalo di un fascio di raggi X. Questo fascio viene poi misurato sull'altro lato e tale misurazione viene poi utilizzata per costruire la struttura tridimensionale del cervello con l' aiuto di un computer, che usa sofisticati modelli algoritmici. Alla fine la mappa costruita, rappresenta una singola sezione del cervello, ma si possono considerare molti altri livelli, ottenendo così diverse sezioni, in modo tale che si può ottenere un'immagine relativamente completa della struttura anatomica del cervello.
Fig. 2.2.12. Numerose immagini di sezioni del cervello umano.
Questi diagrammi mostrano le mappe computerizzate di un cervello, che ha una grande lesione nel lobo parietale destro. Le scansioni sono state prese dai livelli indicati nella prima immagine, dove è raffigurato un lato del cervello.

· Nella MRI il cervello è sottoposto ad un forte campo magnetico, che polarizza le molecole al suo interno, così tutti i poli magnetici sono allineati con i campi magnetici. Poi vengono pulsate onde radio e così le molecole emettono segnali radio, che portano l' informazione sulle loro proprietà chimiche. Questa informazione è ricopiata da rivelatori posti intorno alla testa. Le loro misurazioni vengono poi elaborate da algoritmi ed usate per costruire la struttura tridimensionale del cervello. La MRI produce delle immagini del cervello molto più dettagliate di quelle prodotte con la TC, ed inoltre con la MRI c'è il vantaggio di non esporre il cervello agli effetti dei raggi X.

· Nel PET viene iniettata nel sangue una sostanza radioattiva, che entra così nel flusso sanguigno. Questa sostanza è poi presente nei tessuti cerebrali. L'isotopo radioattivo emette spontaneamente positroni e questa emissione di positroni viene poi misurata fuori dalla testa ed elaborata da un computer che utilizza algoritmi per costruire una mappa tridimensionale dell'attività del cervello. La tecnica PET misura l'attività in modo indiretto, attraverso il flusso cerebrale. Quando un'area del cervello è attivata, riceve una maggiore quantità di sangue e questo fatto porta ad un aumento delle emissioni di positroni.

Uno dei più recenti sviluppi nelle tecniche di bioimmagine è stata la modificazione dei metodi MRI, in modo da tener conto delle misurazioni strutturali e funzionali dell'attività del cervello. Questa tecnica è chiamata f-MRI, che significa: risonanza magnetica funzionale. Come i metodi PET, la f-MRI dipende dal fatto che il flusso sanguigno aumenta nell'area del cervello attivata, la misurazione del f-MRI è relazionata alla concentrazione di ossigeno nel sangue.


2.3 TEORIA DELL'ELABORAZIONE DELL'INFORMAZIONE

In questa parte del capitolo prepareremo le basi per il resto del libro. All'inizio esamineremo i fondamenti teorici dei paradigmi dell'elaborazione dell'informazione nei quali sono incluse le moderne teorie della visione. Poi discuteremo i concetti centrali della teoria - rappresentazioni e processi - e analizzeremo importanti risultati in merito .Alla fine del capitolo anticiperemo la struttura teoretica generale che sarà basilare per molte delle nostre discussioni sulla percezione visiva. Questa si basa su quattro momenti che partono dall'immagine retinica per arrivare all'identificazione dell'oggetto. Si avverte il lettore che il materiale di questa sezione è astratto e teorico e risulterà forse difficile perché appare molto presto nel libro, prima di aver esaminato alcuni esempi specifici.
Il paradigma dell'elaborazione dell'informazione è un modo di considerare la natura della mente umana come un processo computazionale. Esso è stato applicato con considerevole successo non solo nella percezione visiva ma anche nel vasto ambito dei fenomeni cognitivi nella percezione uditiva, nella memoria, linguaggio, giudizi, pensiero e soluzione dei problemi. Infatti l'approccio dell'elaborazione dell'informazione si è così imposto su questi argomenti che diversi scrittori hanno sostenuto che esso costituisce un "paradigma kuhniano" per la conoscenza (Lachman, Lachman e Butterfield, 1979; Palmer e Kimchi, 1986).
Il noto filosofo della scienza Thomas Kuhn (1962) definisce un paradigma scientifico come "un insieme di assunzioni di lavoro che una comunità di scienziati condivide (spesso implicitamente) nelle ricerche condotte su un determinato argomento". Le assunzioni di un paradigma di solito implicano modi metateorici di concettualizzare i problemi più importanti e modi rilevanti di approccio a tali teorie. Kuhn descrive la fisica newtoniana come un paradigma che sopravvive largamente intatto dal diciassettesimo secolo fino alla maggior parte del ventesimo secolo. Sebbene ci siano stati molti sviluppi teorici seguenti a Newton nessuno di loro pretende di respingere le assunzioni fondamentali che sottostanno all'idea di Newton riguardo alla natura del mondo fisico. Per esempio, Newton e i suoi successori implicitamente o esplicitamente assumono che c'è una distinzione qualitativa tra massa ed energia, che il tempo è assoluto, e che la causalità è deterministica. Soltanto la meccanica quantistica e la teoria di Einstein sulla relatività determinarono la morte di questo paradigma newtoniano e si fece strada un nuovo paradigma che incorporava una serie di assunzioni quali, per esempio, che massa ed energia sono equivalenti, che il tempo è relativo e che la causalità è connessa con la probabilità.
L'affermazione che l'elaborazione dell'informazione costituisce un paradigma per le scienze cognitive - includendo la scienza della visione - è basata sulla credenza largamente sostenuta che la natura dei processi mentali può essere colta dalle teorie che li specificano in termini di eventi dell'elaborazione dell'informazione (vedi sotto). Sebbene rimanga un piccolo ma convinto insieme di scienziati della visione che non vedono la percezione visiva come un processo di elaborazione - più precisamente proponendo la teoria di Gibson dell'ottica ecologica - il paradigma dell'elaborazione dell'informazione è certamente la struttura dalla quale derivano le più attuali teorie della percezione visiva.

2.3.1 LA METAFORA DEL COMPUTER

Lo sviluppo storico delle teorie sulla visione è stato fortemente influenzato dalle tecniche di ricerca disponibili. Nel caso della teoria dell'elaborazione dell'informazione, la forza più significativa è stata sicuramente l'invenzione dei computer elettronici. La loro influenza è stata sentita in due modi distinti ma collegati. Primo, essi sono diventati lo strumento privilegiato per verificare nuove teorie sull'elaborazione visiva. Come abbiamo visto nella sezione 2.2 questo approccio ha fatto emergere la visione come un settore speciale all'interno della scienza dei computer. Il suo scopo è programmare computer così che essi capiscano le parole che li riguardano nel modo più simile possibile alle persone.
La seconda influenza dei computer è stata anche più profonda: essi sono stati usati come la prima analogia teoretica per i processi mentali all'interno del paradigma dell'elaborazione dell'informazione. In poche parole i processi mentali (come tali la percezione visiva) sostengono la stessa relazione con il cervello come fanno i programmi con il computer sul quale lavorano; significa che i processi sono dei "software" di stime biologiche e i cervelli sono "hardware" .Il motivo di queste analogie è che molte teorie della percezione sorpassate da oltre venti o trenta anni, sono state attualmente implementate dai programmi di computer e molte di più sono state descritte all'interno della struttura dell'elaborazione dell'informazione. In questo capitolo mostreremo quale forma prendono queste teorizzazioni e perché sono diventate così popolari.
L'analogia del computer ha largamente sostituito le analogie teoriche che abbiamo discusso nella sezione 2.1.L'analogia del computer è abbastanza compatibile con l'analogia deduttiva del costruttivismo.
Alcuni teorici credono che le somiglianze tra mente/cervello e programma/computer si sono diffuse abbastanza con una corretta programmazione "vedendo" il computer come se attualmente avesse l'esperienza di una coscienza visiva. Questa visione della relazione tra i programmi di computer e gli eventi mentali è talvolta chiamata "STRONG AI" (Searle, 1980): vale a dire che una corretta macchina di programmazione attualmente esegue processi mentali, includendo esperienze coscienti. Questa posizione è stata contrastata con la cosiddetta "WEAK AI", nella quale l'affermazione è che come una macchina l'intelligenza simula solo gli eventi mentali, oppure coscienti. Se le affermazioni della "STRONG AI" siano valide o meno non si sa, è aperto un serio dibattito, con argomenti che sostengono entrambi i punti di vista (vedi Searle, 1980 e contributi che seguono).
Senza considerare le più estreme affermazioni che sono state fatte, se gli eventi mentali accaduti nel cervello umano sono davvero analoghi ai programmi di computer, in seguito saranno usati per esaminare cosa si conosce riguardo all'elaborazione dell'informazione su dispositivi simili al computer. Questo per cercare di intuire come la mente può lavorare e come può essere studiata in modo più vantaggioso.

2.3.2 TRE LIVELLI DELL'ELABORAZIONE DELL'INFORMAZIONE

Nel suo autorevole libro "Vision" David Marr (1982) distingue tre differenti livelli di descrizione coinvolti in un complesso sistema di elaborazione dell'informazione: COMPUTAZIONALE, ALGORITMICO E IMPLEMENTAZIONALE. Così facendo egli fornisce un'analisi metateoretica del paradigma dell'elaborazione dell'informazione. Una metateoria è una teoria delle teorie, una teoria che cerca non di analizzare la visione stessa ma di analizzare la natura delle teorie della visione. Marr dimostra che ci sono importanti distinzioni concettuali riguardo a questi tre livelli e che tutti sono essenziali per comprendere la visione (o qualsiasi altro processo) come elaborazione di informazioni.

Commento alla figura 2.3.1 pag.72
La descrizione del livello computazionale di un termostato. A)Il diagramma mostra gli input e gli output del termostato. B)Il grafico segna il comportamento di input/output del termostato per tre particolari misure come una funzione della temperatura.

IL LIVELLO COMPUTAZIONALE
La più astratta descrizione che Marr ha proposto era il livello computazionale. Egli lo definisce come un insieme di vincoli informazionali disponibili per rilevare le informazioni in input verso le informazioni in output. Questo livello di teorizzazione specifica di che cosa ha bisogno la computazione per essere mostrata e su quale informazione dovrebbe essere basata, senza specificare come è realizzata. Per illustrare questo concetto prenderemo in considerazione un sistema di elaborazione dell'informazione molto semplice: un termostato domestico. La "computazione" che un termostato deve eseguire è la rilevazione sia del valore della temperatura dell'aria in quel momento, sia la regolazione su una temperatura preferita (l'informazione di input) verso un segnale di on/off per la caldaia (l'informazione di output), che cambia in funzione della temperatura dell'aria a seconda se è minore o maggiore del punto di regolazione (vedi fig. 2.3.1A). La figura 2.3.1B mostra questa doppia misura come una funzione della temperatura dell'aria: se la temperatura è sotto il punto di regolazione l'impianto va su on, se è uguale o sotto l'impianto va su off. Possiamo riassumere la descrizione di questo livello computazionale in forma matematica come una funzione doppia a due variabili

1 se e solo se T<S
0(T,S) =
0 se e solo se T³S

dove 0 è l'output della funzione, T è la temperatura e S è il punto di regolazione.
Non diremo come questa funzione matematica è stata ottenuta, abbiamo soltanto definito cosa sono gli input e come sono stati relazionati formalmente agli output. Questa è la descrizione del livello computazionale del termostato.

IL LIVELLO ALGORITMICO
Il livello che sta nel mezzo della gerarchia di Marr è il livello algoritmico. Le descrizioni algoritmiche sono più specifiche di quelle computazionali nelle quali si specifica come è eseguita una computazione in termini di elaborazione dell'informazione. In principio ci sono molti modi diversi nei quali un dato livello computazionale potrebbe realizzare una rilevazione dall'input all'output, nello stesso modo in cui ci sono molti differenti programmi di computer che potrebbero realizzare lo stesso compito computazionale. Di conseguenza il livello algoritmico corrisponde più strettamente al concetto di programma così come è compreso nella scienza del computer. Per costruire un algoritmo per un certo compito bisogna decidere prima una rappresentazione per l'informazione di input e output e poi costruire una serie di processi che trasformeranno la rappresentazione dell'input nella rappresentazione di output in una maniera ben definita. I concetti di "rappresentazione" ed "elaborazione" saranno discussi a fondo fra breve, ma per ora, si può pensare alla rappresentazione come un modo di codificare l'informazione e l'elaborazione è un modo di cambiare una rappresentazione in un'altra. Nel nostro esempio del termostato l'algoritmo più semplice è usare una variabile continua per codificare la temperatura e un'altra per codificare il punto di regolazione; poi mostrare un'operazione di confronto tra queste due grandezze per determinare se la temperatura è più alta o più bassa del punto di regolazione. Un diagramma corrispondente a questo algoritmo è dato dalla figura 2.3.2. Questo è l'algoritmo standard per molti termostati, ma ne sono possibili anche altri. Bisogna infatti sottolineare che più di un algoritmo può soddisfare una data descrizione computazionale.

Commento alla figura 2.3.2 pag. 73
Descrizione del livello algoritmico di un termostato. Il diagramma mostra una scomposizione del diagramma computazionale della fig. 2.3.1 nella codificazione, comparazione e operazioni di output.

Commento alla figura 2.3.3 pag. 73
Descrizione del livello implementazionale di un termostato. Un diagramma schematico mostra un dispositivo fisico che compie l'operazione indicata nello schema del livello algoritmico in fig.2.3.2

IL LIVELLO IMPLEMENTAZIONALE
Il più concreto livello di descrizione è il livello implementazionale. Esso permette di capire che un algoritmo può essere realizzato come un processo fisico all'interno di un sistema fisico. Così come lo stesso programma può essere applicato su molti computer che si differenziano nella loro struttura fisica così lo stesso algoritmo può essere implementato usando materialmente molti diversi dispositivi.
Per illustrare concretamente il livello di implementazione la figura 2.3.3 mostra un modo per costruire un termostato fisico usando il primo algoritmo che abbiamo descritto. La doppia linea curva rappresenta una striscia bimetallica, costituita dall'unione di due strisce di metallo che hanno differenti movimenti di dilatazione termica. La differenza di dilatazione dei due metalli alle diverse temperature causa la larghezza che piega la striscia più o meno a seconda dei cambi di temperatura. Il punto finale, non collegato a nessun altro dispositivo di questa striscia, è parte di uno scambio di contatto che completa un circuito elettrico quando tocca il contatto stesso. La posizione verticale del contatto è modificata da chi regola il setting del termostato; sollevandolo aumenta il punto di rilevazione e abbassandolo diminuisce. Se l'interruttore si chiude o meno dipende da due fattori: l'altezza della fine della striscia bimetallica (determinata dalla temperatura) e l'altezza del contatto (determinata dal setting).
Ci sono innumerevoli modi alternativi per implementare la funzione continua della temperatura e classificare le variabili cosicché possano essere paragonate ad un semplice processo fisico.

2.3.3 TRE ASSUNZIONI SULL'ELABORAZIONE DELL'INFORMAZIONE

Palmer e Kimchi (1986) hanno fornito una differente analisi metateorica del paradigma dell'elaborazione dell'informazione secondo una prospettiva psicologica. Sebbene la loro analisi all'inizio possa apparire abbastanza diversa da quella di Marr, vedremo invece che è ad essa strettamente collegata.

DESCRIZIONE DELL'INFORMAZIONE
Palmer e Kimchi (1986) analizzarono le assunzioni implicite che sottolineano le teorie dell'elaborazione dell'informazione nella psicologia cognitiva. Le tre teorie più importanti sono elencate in questa e nella seguente sezione.

1) Descrizione dell'informazione
Gli eventi mentali possono essere descritti funzionalmente come eventi informazionali, ciascuno dei quali è diviso in tre parti: l'informazione in input, l'operazione rappresentata nell'input, l'informazione di output.

Commento alla figura 2.3.4 pag.74
Diagramma di una scatola nera. Gli eventi mentali possono essere descritti come eventi informazionali definiti dall'informazione di input, output e dalle operazioni che mappano l'input verso l'output.

Questa prima assunzione afferma che gli eventi mentali, includendo la percezione visiva, possono essere considerati come un'operazione che trasforma un insieme iniziale di informazioni-input in informazioni-output. Così l'evento informazionale può essere rappresentato come una "scatola nera" in un diagramma di flusso, come illustrato in figura 2.3.4. Se il rilievo dell'input/output è ben definito, ci sarà un modo di specificare l'operazione cosicché conoscendo l'input e l'operazione si determina l'output. Una teoria cognitiva a questo livello di astrazione corrisponde al livello computazionale di Marr perché specifica quale informazione è mappata dall'input all'output ma senza specificare come questa trasformazione può essere compiuta. Una funzione matematica che mette in relazione l'input all'output è il modo ideale di specificare l'operazione, come abbiamo fatto per l'esempio del termostato, ma più avanti ne faremo una descrizione migliore.

SCOMPOSIZIONE RICORSIVA
Sebbene la descrizione informazionale è una condizione necessaria per una teoria dell'elaborazione dell'informazione, essa non è sufficiente perché ci sono teorie che si basano sull'assunzione della descrizione informazionale ma che non sono tuttavia teorie dell'elaborazione dell'informazione. La teoria della raccolta dell'informazione di Gibson, per esempio, specifica le corrispondenze informazionali tra input e output e quindi soddisfa l'assunzione della descrizione informazionale. Tuttavia la teoria di Gibson non è una teoria dell'elaborazione dell'informazione perché esplicitamente nega la necessità di analizzare le rappresentazioni interne o i processi che compiono la mappatura. Palmer e Kimchi (1986) specificano questa nuova cruciale istanza delle teorie dell'elaborazione dell'informazione come assunzione della scomposizione ricorsiva. Essa è usata per formulare descrizioni più complete di che cosa deve andare all'interno della scatola nera.

2) Scomposizione ricorsiva
Alcuni complicati eventi informazionali possono essere spiegati più completamente a partire da un basso livello di scomposizione e con un diagramma di flusso che specifica le relazioni di ordine temporale tra le componenti. L'importante concetto introdotto da questa assunzione è che si può definire una scatola nera in termini di un numero di più piccole scatole nere dentro di essa, oltre che da una specificazione di come esse sono interconnesse. Queste più piccole scatole nere sono spesso chiamate "stages" e sono indipendenti da altri "stages". Un piccolo esempio di scomposizione è l'analisi di un sistema stereo nei suoi componenti funzionali: sintonizzatore, lettore cd, piastra di lettura/registrazione cassette, preamplificatore, amplificatore e microfono (vedi figura 2.3.5). In molti casi, tutti questi componenti sono protetti da una vetrinetta, in altri casi ognuno di essi ha una propria chiusura con dei fili collegati tra loro che corrispondono alle frecce del flusso di informazioni della figura 2.3.5.

Commento alla figura 2.3.5 pag.74
Diagramma di flusso di un sistema stereo. La scomposizione funzionale di un tipico sistema stereo lo separa nelle diverse componenti e nelle relazioni tra le varie parti.

Dicendo che la scomposizione è ricorsiva significa che può derivare dal risultato della scomposizione precedente. Così tutte le componenti dell'esempio dello stereo possono essere scomposte ulteriormente nei suoi circuiti interni in un processo interattivo di ulteriore scomposizione.
Questi diagrammi di flusso scomposti in singole componenti di un sistema di elaborazione dell'informazione possono corrispondere a quello che Marr chiamava "livello algoritmico". Ma è presente una differenza tra i due: Marr vedeva questo livello algoritmico come singolo, di unitaria entità, mentre Palmer e Kimchi lo concepiscono come composto da molte gerarchie di livelli incastrati. Anche un programma di computer può essere visto come una singola entità o come una gerarchia di incastri di diagrammi di flusso. Palmer e Kimchi (1986) ritengono che la scomposizione ricorsiva per gli psicologi giace nel cuore dell'approccio dell'elaborazione dell'informazione perché riflette come tipicamente essi lavorano: cercando di specificare e testare successivamente e più dettagliatamente i diagrammi di flusso.

Commento alla figura 2.3.6 pagina 75
La scomposizione ricorsiva nella cognizione umana. La mente può essere descritta come un evento informazionale a diversi livelli di dettaglio. Ogni diagramma di flusso mostra una scomposizione funzionale della scatola nera sotto (unita dalla linea tratteggiata) in un set di semplici operazioni e flusso di informazioni fra essi.

Questa figura illustra un esempio di scomposizione ricorsiva applicata alla cognizione umana. La mente come "tutto" è rappresentata da una singola scatola nera nella figura 2.3.6A. Gli psicologi la scompongono in rapporto ad un piccolo numero di componenti base illustrati in fig. 2.3.6B ed evidenziano le loro connessioni. Ricordiamo che l'argomento di questo libro - la percezione visiva - è rappresentato come un singolo processo in questo diagramma di flusso.
La scomposizione ricorsiva ammette che si comprenda gradualmente la complessità di un sistema di elaborazione di informazione. È importante ricordare che gli eventi informazionali al livello più basso devono anche avere una descrizione informazionale che specifica cosa fanno quando mappano input e output ma non hanno bisogno di specificare come lo fanno. Il "come" si può capire scendendo di livello nella via gerarchica della nuova scomposizione.
Questa impresa di scomposizione ricorsiva in una gerarchia di componenti sarà un successo solo nell'estensione del sistema stesso. Il Nobel Herbert Simon (1969) ha avanzato diverse argomentazioni sul fatto che il sistema del processo di elaborazioni di informazioni è strutturato in questo modo. Egli caratterizza la cognizione umana come "quasi scomponibile" per distinguerla da alcuni sistemi costruiti dall'uomo, come lo stereo del nostro esempio precedente, che sono del tutto scomponibili. La distinzione di Simon confronta le interazioni che esistono all'interno delle componenti con quelle che esistono tra le componenti. Un sistema scomponibile è uno nel quale le interazioni tra le componenti sono irrilevanti se confrontate con quelle all'interno di esse. In una più recente terminologia, questi sistemi sono chiamati modulari, significando che sono scomponibili in un set di processi indipendenti: il filosofo Jerry Fodor (1983) ha confermato la verità dell'ipotesi modulare del pensiero umano. Un sistema quasi scomponibile è quello in cui le interazioni tra le componenti sono deboli ma non irrilevanti, e un sistema non scomponibile è quello in cui le interazioni tra le componenti sono tanto forti quanto quelle all'interno delle componenti.
Alcuni teorici della percezione - in particolare Gestaltisti, della scuola ecologica e di quella connessionista del pensiero - sono sensibilmente meno ottimisti di Simon (1969) e Fodor (1983) riguardo al dominio verso il quale il pensiero umano è anche quasi scomponibile in moduli. Molti Gestaltisti credevano che gli eventi mentali dovessero essere compresi in termini di insieme di più parti, olistico, come un'area di interazione che prende posto nel cervello. Questa concezione non si adatta all'idea che i processi cognitivi formano un "quasi sistema" scomponibile, caratterizzato da un diagramma di flusso della scomposizione ricorsiva. Più recentemente alcuni teorici connessionisti hanno anche messo in discussione la validità della scomposizione ricorsiva confermando la spiegazione dei livelli neurali di percezione e cognizione. Essi spiegano che alcune descrizioni dei più alti livelli - che sono dimostrati nei diagrammi di flusso - sono solo una semplice approssimazione della vera e propria descrizione del livello neurale (Smolensky, 1988). Gibson e alcuni dei suoi seguaci prendono la posizione opposta, concentrandosi prima sulla descrizione informazionale della percezione al più alto livello computazionale senza cercare di analizzarlo nei suoi processi interni.
L'idea