HOME Italia
HOME USA
Curriculum
Ricerca
Risorse
Psicologia della Percezione
Links
Scrivi
Ti serve acquistare il Palmer per l'esame di Psicologia della Percezione? Clicca qui!
Amazon & Psiconet

 

Capitolo 8

Le traduzioni che potrete trovare su questo sito sono unicamente destinate ad uso interno per il corso di Psicologia della Percezione dell'Università degli studi di Trieste. Nascono con l'intento di fornire un ausilio a quegli studenti che non hanno molta dimestichezza con la lingua inglese. Le traduzioni sono opera degli stessi studenti del corso di Psicologia della Percezione 1999 - 2000. Nell'utilizzo di questo materiale va tenuto conto che la correttezza dello stesso va verificata confrontando le traduzioni con il testo originale. Per ulteriori domande, clicca qui.


La rappresentazione della forma e della struttura

Di tutte le proprietà che percepiamo circa l'oggetto la forma è probabilmente la più importante. Questa importanza le deriva dal fatto che permette ad un osservatore di predire più caratteristiche di un oggetto che ogni altra proprietà ma è anche la più complessa. Sebbene si tenti di pensare alla forma come una proprietà unitaria, essa è sicuramente composta da molte componenti differenti . Nel capitolo 3, per esempio, abbiamo scoperto che la superficie colorata può essere analizzata nelle componenti 3-d di tinta, saturazione e bianchezza. Questa analisi dettagliata porta dei vantaggi in confronto a quella unitaria. Per esempio , la somiglianza di due colori può essere modellata dalla loro prossimità con lo spazio di colore tridimensionale. Colori simili, come due differenti sfumature di rosso, sono vicini tra loro nello spazio dei colori, mentre colori diversi, per esempio il verde e il rosso, sono distanti.
E' possibile compiere una simile analisi della forma in semplici componenti? Se si, quali sono i componenti nei quali può essere analizzata? Se no, può la forma essere in qualche modo rappresentata in modo olistico? In entrambi i casi, come può essere determinata la somiglianza tra due forme? Queste sono le principali domande che ci porremo in questo capitolo. Molte di esse sono legate strettamente agli argomenti che discuteremo nel prossimo capitolo sulla categorizzazione percettiva. La ragione è che la proprietà più importante per determinare la categoria alla quale l'oggetto appartiene è la sua forma. Molte teorie importanti sulla categorizzazione degli oggetti, quindi, dipendono dalla posizione che noi prendiamo rispetto alla loro rappresentazione di forma.
Un'altra tentazione semplicistica circa la percezione della forma è credere che la rappresentazione della forma degli oggetti può basarsi sulla superficie base di 2.5 D. Infatti, il termine inizialmente usato nella letteratura basata sulla visione computazionale si riferiva al processo per il quale la rappresentazione in 2.5 D implica sia così. I moduli principali dalla rappresentazione 2 d alla 2.5 sono spesso chiamati "forma dall'ombra", "forma dal movimento" e così via come se la rappresentazione in 2.5 D contenesse una rappresentazione della forma dell'oggetto. Sfortunatamente non è così.
Sebbene sia vero che le rappresentazioni in 2.5 D contengono informazioni sulla forma questo vale solo implicitamente e localmente. Come detto nel capitolo 5 quello che è attualmente rappresentato in 2.5 D è la distanza e l'orientamento della parte della locale superficie piana e ricordiamo anche che la rappresentazione in 2.5 D non viene differenziata a livello organizzativo: non viene rappresentata esplicitamente la divisione delle superfici visibili in oggetti separati e molte delle loro parti componenti e di inter relazioni, non contiene informazioni di tutte le superfici nascoste dell'oggetto che sono coperte dalle loro superfici frontali. Per tutte queste ragioni è giusto dire che lo schizzo 2.5 D non contiene un'esplicita rappresentazione della forma dell'oggetto 3 D. qualcosa di più globale e complesso viene richiesto nella rappresentazione delle forme in 3 D come affermato alla fine del capitolo 7 la rappresentazione degli oggetti spesso si sviluppa attraverso la loro divisione in parti come succede con gli occhi, il naso e la bocca per la faccia umana come rappresentazione delle varie caratteristiche globali. Le parti nelle quali vengono divisi gli oggetti, le inter relazioni spaziali tra queste parti, e le caratteristiche globali che li definiscono rappresentano tutti aspetti importanti della loro forma. Ribadiamo, nessuna di queste informazioni complesse è disponibile nello schizzo 2.5 D. nella percezione della forma di un oggetto informazioni locali e pezzi della stessa devono in qualche modo venir organizzati all'interno della rappresentazione dell'oggetto, delle sue parti caratteristiche e delle loro complesse inter relazioni all'interno di una struttura globale e coerente. Capire come questo potrebbe compiersi è il obiettivo primario della teoria della percezione delle forme. In questo capitolo esploreremo i problemi e le prospettive relative a questa teoria.

8.1 L'EQUIVALENZA DELLA FORMA

Possiamo cominciare la nostra discussione sulla percezione della forma degli oggetti affrontando un semplice problema: la percezione della forma equivalente. Questo problema implica la comprensione delle condizioni per le quali due persone percepiscono due oggetti differenti come aventi la stessa forma.
Il fenomeno delle percezione di forme equivalenti è strettamente collegato alla costanza della forma. Ricordiamo dalla sezione 7.2 che la costanza della forma è definita come il percepire lo stesso oggetto con la stessa forma malgrado questo presenti delle differenze nelle condizioni di rappresentazione. Di equivalenza della forma si parla invece quando due oggetti differenti sono visti come aventi la stessa forma, malgrado presentino altre differenze spaziali tra di loro. Un'automobile di dimensioni normali appare avente la stessa forma di una miniatura di quel modello nonostante la loro ovvia differenza di misura, per esempio. Come una sedia in posizione verticale avrà la stessa forma di una sedia rovesciata, malgrado la loro differenza di orientamento.


8.1.1 DEFINIRE LA FORMA OBIETTIVA

Ci avvicineremo al problema delle forme equivalenti considerando quali trasformazioni possono essere applicate ad un oggetto senza cambiarne la forma. Dato che la forma è una proprietà della nostra percezione degli oggetti, può sembrare strano parlare di forma come una proprietà obiettiva. La nozione di forma può essere definita in modo significativo come punto d'appoggio nel nostro affrontare il problema della percezione della forma. Di fatto, l'idea che ogni oggetto ha una forma obiettiva non è differente per principio dalla radicata credenza che ogni oggetto ha una misura, una posizione, un orientamento obiettivamente definibili.
Consideriamo la semplice figura geometrica che vediamo nell'immagine 8.1.1 per esempio. Ognuno sarà d'accordo che le figure nella colonna di destra hanno la stessa forma di quelle a sinistra malgrado le differenze nella loro posizione, orientamento, misura o si tratti della stessa immagine riflessa (come in uno specchio). Questo fatto ci permette di definire la forma obiettiva come la struttura spaziale di un oggetto che non cambia quando gli vengono applicate le seguenti trasformazioni spaziali:

1.traslazione, in cui a variare è solo la posizione di un oggetto,
2.rotazione, in cui cambia solo il suo orientamento
3.dilatazione (espansione o contrazione), che cambia solo la sua misura,
4.riflesso in cui varia il suo senso di presentazione
5.tutte le combinazioni di queste trasformazioni.

In matematica questo particolare gruppo di trasformazioni viene chiamato gruppo di similarità ("Similarity group" è il nome matematico di questo set di trasformazioni, esso non può indicare nessuna delle somiglianze tra gli oggetti a cui si riferisce.) Probabilmente avrai incontrato le trasformazioni similari in geometria quando per esempio hai dovuto dimostrare che due triangoli sono "simili", perché presentato tutti e tre gli angoli corrispondenti come uguali.

Sebbene abbiamo dato un esempio del mantenimento della forma usando una figura bidimensionale, la forma obiettiva degli oggetti 3D è comunque mantenuta nella versione tridimensionale dalla stessa gamma di trasformazioni: traslazione, rotazione, dilatazione e riflessione o le loro combinazioni. Noi preserviamo la forma obiettiva in un senso ben definito: cioè quando ogni coppia di oggetti può essere portata in esatta corrispondenza applicando alcune sequenze di queste trasformazioni. Così, le trasformazioni similari forniscono un test obiettivo per capire se ogni data coppia di oggetti abbia o no la stessa forma. Se ogni altra trasformazione spaziale è richiesta per portare l'oggetto in esatta corrispondenza con un altro - come schiacciarlo, allungarlo o deformarlo in qualche modo- noi abbiamo una forma obiettiva differente secondo questa definizione, anche se le loro forme possono apparire come estremamente simili.
Il fatto che le persone percepiscano tutti i vari oggetti nella figura 8.1.1 come aventi la stessa forma ci porta alla ovvia ipotesi che la percezione che noi abbiamo della forma obiettiva è generalmente veridica- cioè due oggetti sono percepiti come aventi la stessa forma ogni qual volta possiedono una forma obiettiva. Qualcuno potrebbe pensare che sia sempre così, ma come vedremo presto ci sono delle importanti eccezioni. Così noi possiamo prendere questa definizione di forma equivalente come uno standard obiettivo ed esaminare come la percezione umana della forma si conformi ad esso.
La situazione non è dissimile dal definire l'orientamento oggettivo di una linea rispetto alla gravità, ed esaminando quanto facilmente la percezione della gente di questa si conformi a questo standard. La percezione può provocare varie illusioni o distorsioni, ma queste possono essere capite in relazione ad orientamenti definiti in via oggettiva. Così può essere per la forma.
La definizione di forma equivalente percepita come invarianza (mancanza di cambiamento) oltre le trasformazioni similari è un livello della teoria computazionale della forma equivalente. Non fornisce nessuna pretesa di specificare quali processi sono coinvolti nel determinare l'equivalenza della forma nel senso definito nel Capitolo 2. A un livello algoritmico, tuttavia, la questione nasce su quali informazioni e operazioni sono implicate nel determinare se due oggetti hanno la stessa forma. Ci sono alla fine tre possibilità:

1.Ipotesi delle caratteristiche invarianti. Questa ipotesi suppone che l'equivalenza della forma si determini confrontando alcuni set di "caratteristiche della forma" dei due oggetti. Se questi due set (o liste) sono uguali, l'oggetto ha la stessa forma percepita. Per questo schema di lavoro, le caratteristiche devono rimanere invariate non solo per la gamma di trasformazioni similari.

2.Ipotesi delle trasformazioni di allineamento. Questa ipotesi assume che la forma equivalente sia analizzata per determinare se due oggetti possano essere portati in esatta corrispondenza attraverso una della possibili trasformazioni del set di similarità . Se ciò è possibile, la forma è equivalente, altrimenti no.

3.Ipotesi della struttura di riferimento centrata sull'oggetto. Questa ipotesi ritiene che la forma equivalente sia accertata confrontando gli oggetti dentro una struttura di riferimento definita dall'intrinseca proprietà dell'oggetto. Se gli oggetti sono uguali rispetto alla loro struttura di riferimento essi sono percepiti come uguali nella forma.

Ci sarebbero approcci ibridi e intermedi ma, per semplicità, noi ora considereremo in dettaglio solo le versioni "pure" di queste ipotesi.

8.1.2 CARATTERISTICHE INVARIABILI

Questa ipotesi assume che la percezione della forma dipenda dal codificare quelle proprietà dell'oggetto che non cambiano (sono invarianti) quando questo è trasformato in qualche modo particolare. Adesso noi esamineremo cosa questo significa e in che modo possa valere per la percezione della forma equivalente.
Ogni serie di trasformazioni divide il set di tutti le possibili proprietà degli oggetti in due sotto-serie mutualmente esclusive: quelle che non cambiano come risultato della trasformazione (chiamate proprietà invarianti) e quelle che lo fanno (caratteristiche varianti). Consideriamo, ad esempio, una traslazione bidimensionale del set di proprietà che troviamo nella figura 8.1.2. Cambiando la posizione di un oggetto si altera la posizione assoluta dei suoi componenti come linee, angoli e così via che sono quindi caratteristiche che variano con la traslazione, come indicato dal segno "-" che troviamo nella prima colonna, prima riga. Questo non influenza la posizione relativa di coppie di questi componenti e comunque non altera nessuna delle altre proprietà elencate, come il numero di linee ed angoli che la figura contiene o l'orientamento e la misura di queste linee e angoli. Queste caratteristiche sono quindi invariabili come indicato dal segno "+" nelle altre colonne della prima riga.
Ora consideriamo cosa succede quando è l'orientamento dell'oggetto a cambiare . La rotazione altera non solo la posizione assoluta e relativa dei suoi componenti ma anche il suo orientamento assoluto, queste sono quindi le caratteristiche variabili della rotazione. Quello che invece non cambia è l'orientamento relativo dei componenti ( cioè la differenza angolare tra loro), e il numero e la misura di angoli e linee che sono quindi invarianti.
Collegate con la precedente definizione di forma equivalente obiettiva nei termini dell'azione del gruppo similare di trasformazione, l'ipotesi delle caratteristiche invarianti suggerisce che la forma può essere rappresentata dalla serie di proprietà che non variano e che non fanno parte del gruppo similare. La riga superiore della figura 8.1.2 indica che le caratteristiche che supportano questa ipotesi sono cose come il numero di angoli, di linee e varie altre componenti come l'orientamento relativo, la misura, la vicinanza e la loro connettività. La ragione è che nessuna di queste caratteristiche cambiano per nessuna delle trasformazioni similari.
Notiamo che questa lista include poche proprietà metriche assolute ma molte relative. Questo è in accordo con le prime osservazioni della psicologia Gestaltista, che sottolineò l'idea della determinazione relazionale; cioè l'idea che la percezione sia dominata dalle relazioni configurate tra parti e proprietà più che da proprietà assolute.
La definizione reale di un set di caratteristiche immutabili come quelle proprietà che non cambiano nonostante l'azione delle trasformazioni, garantisce che ogni due figure che possono essere sovrapposte mediante una trasformazione di similarità avranno una identica rappresentazione di forma in confronto a tali proprietà. Perciò, fin quando l'equivalenza della forma percepita è la stessa dell'equivalenza della forma obiettiva - cioè, come definita dall'azione delle trasformazioni di similarità - rappresentare la forma in termini di caratteristiche di similarità-immutabili garantisce di risolvere il problema della percezione dell'equivalenza di forma.
In una forma o l'altra l'ipotesi delle caratteristiche invarianti ha dominato le teorie della percezione della forma dalle prime storiche esposizioni di Pitts e McCullough (1947) fino a tempi relativamente recenti. Esplicitamente o implicitamente queste assunzioni sottolineano la teoria gestaltista della percezione della forma, la teoria di Gibson sulla costanza della forma e le classiche "feature list" di riconoscimento del modello come la teoria di Pandemonio (Selfridge, 1957; Selfridge & Neisser, 1960).
La teoria basata sulle caratteristiche invarianti è affascinante in parte anche per la sua semplicità: la forma può essere rappresentata come una semplice serie o lista di attributi. Le proprietà all'interno di tale set possono essere valutate in via differenziale in relazione alla loro importanza percettiva, ma l'idea base è che la lista di caratteristiche invarianti è sufficiente per spiegare perché alcune coppie di oggetti distinti sono viste come aventi la stessa forma e altre no.
Sfortunatamente è evidente che questo approccio è imperfetto come la teoria della percezione della forma equivalente. Il problema sorge dalle notevoli differenze tra la forma equivalente percepita e quella obiettiva. Il fenomeno più danneggiato è la ben documentata relazione tra l'orientamento percepito e forma percepita a cui abbiamo accennato brevemente nel capitolo 7. Una delle prime, più semplici e più eleganti dimostrazioni di questa relazione è l'osservazione di Match (1914/1959) che dimostra come quando un quadrato è ruotato di 45° le persone lo percepiscono generalmente come un segno di quadri (come quello delle carte da gioco) o come un diamante piuttosto che come un quadrato inclinato. (vedere la fig. 8.1.3). Si può vedere questa figura come un quadrato inclinato, ovviamente, se solo si considera il lato ruotato di 45° come superiore. Ma se si considera il vertice superiore come punto più alto allora la figura è vista come un diamante.
Il quadrato/diamante di Match pone una serie di problemi per l'ipotesi delle caratteristiche invarianti. Se la forma percepita è definita unicamente tramite gli attributi che non cambiano dopo la rotazione, allora due figure che vengono ruotate in altre- come il quadrato/diamante di Match- possono essere percepite come aventi la stessa forma. Ma ciò non accade. Questo semplice fatto mina seriamente l'ipotesi delle caratteristiche invarianti come una teoria a livello algoritmico della percezione della forma equivalente.
Qualcuno potrebbe pensare che molti problemi potrebbero essere risolti semplicemente eliminando la rotazione dal set di trasformazioni che preserva la forma percepita. Questa soluzione però butta via il bambino con l'acqua sporca, perché ci sono molti casi in cui due figure correlate da una rotazione vengono effettivamente percepite come aventi la stessa forma. Come esempio possiamo guardare la figura 8.1.1B. Esempi come questi effettivamente bloccano ogni tentativo di accomodare questa ipotesi semplicemente tralasciando la rotazione.


8.1.3 ALLINEAMENTO TRAMITE TRASFORMAZIONE (SIMILARE)

Un secondo modo per stabilire se due oggetti hanno la stessa forma si basa sul trovare una trasformazione che porti uno in esatto allineamento con l'altro. Se esiste questa trasformazione e se proviene dalla serie di cambiamenti possibili (traslazione, rotazione, ecc.) allora gli oggetti avranno la stessa forma. Altrimenti no.
Questo approccio alla forma equivalente è plausibile, non solo perché esso è così simile all'oggettiva definizione di forma equivalente data sopra, ma anche per la sua stretta connessione con molti altri fenomeni visivi. Quando discuteremo la percezione del moto, nel cap. 10, troveremo che il sistema visivo ha una forte tendenza a percepire una forma in movimento come deformata e nel cap.12 scopriremo l'importanza dell'uso delle trasformazioni mentali per comparare due oggetti simili. La trasformazione di oggetti e il processo di allineamento appare essere importante anche in certe teorie di riconoscimento di oggetti di cui parleremo nel nono capitolo.
Per illustrare come funziona questo processo immaginate due oggetti bidimensionali con la stessa forma, posizione, orientamento e misura, come nella figura 8.1.4 A e B. entrambi gli oggetti hanno due punti salienti nella stessa posizione, il puntino bianco e quello nero. I due oggetti A e B possono esser messi a confronto con le seguenti procedure:

1. Trovando la corrispondenza tra puntini: nero con nero e bianco con bianco.

2. Determinando la traslazione, rotazione, riflesso e dilatazione necessari per allineare perfettamente i puntini di B con quelli di A.

3. Applicare le stesse trasformazioni a tutta la figura B, includendo tutti i punti piuttosto che solo quelli bianchi e neri.

4. Determinare se le figura B trasformata (figura C) è identica alla figura A. Se è così, la figura A e quella B avranno la stessa forma, in caso contrario no. Questa conclusione è garantita dal fatto che che comunque le trasformazioni usate fanno parte del gruppo similare.

Usare la procedura di allineamento sulle figure reali è più complicato di quanto questo esempio può lasciar credere per una serie di motivi. Uno dei più importanti è che gli oggetti non vengono comodamente marcati con i puntini neri e bianchi. Nonostante questo, un piccolo numero di punti salienti, a volte chiamati punti ancora, possono essere identificati dalla struttura della figura stessa. Punti di massima concavità lungo il contorno- dove solo collocati i puntini bianchi e neri nelle figure 8.1.4- sono dei buoni punti ancora, così come i punti di massima convessità al centro della figura (Hutterlocher & Ullman, 1987).Sebbene due punti ancora siano sufficienti per allineare una figura 2-D in piano frontale, c'è ne vogliono tre non collineari per le figure 3-D. poiché naturalmente i punti ancora non sono colorati non è subito chiaro quali punti di un oggetto corrispondano all'altro. Etichettarli per tipo (concavi, convessi, centrali, ecc.) può aiutare, dal momento che la convessità in uno non può che corrispondere alla convessità di un altro. Così, l'esempio della figura 8.1.4 è ambiguo perché entrambi i punti ancora si trovano in una zona concava. La procedure consiste nel trovare tutte le possibili corrispondenze e determinare così se la figura risulta identica.
Nonostante le sue virtù, l'ipotesi di allineamento mostra alcune difficoltà. Se per esempio una figura è complessa e contiene vari potenziali punti ancora, o se dei metodi di principio devono essere trovati per eliminare tutte tranne alcune possibilità, o se sono molte le differenti corrispondenze che devono essere provate. Senza etichette per aiuto, i punti ancora n di ogni oggetto sono n! (=n x (n-1) x (n-2) x …x1) possibili corrispondenze, e possono essere molte. Un oggetto con 5 punti ancora, per esempio, ha 120 possibili corrispondenze, e uno con 10 ne ha 3.628.800. La serie di possibili corrispondenze deve essere testata fino a quando non si è raggiunto un allineamento accettabile o tutte le combinazioni sono esaurite.
Un secondo problema è che lo stesso set di punti ancora può essere visibile in due figure. Questo non è un problema per le figure bidimensionali che abbiamo considerato nell'illustrazione 8.1.4 o per certe classi di oggetti 3-D (come quelle fatte in fil di ferro dove non compaiono occlusioni), ma diventa un problema importante con molti altri oggetti 3-D per i quali i punti ancora possono essere visibili in un oggetto e non nell'altro.
Un terzo problema consiste nel fatto che esistono degli oggetti che sono tipicamente percepiti come aventi forme diverse anche se possono effettivamente essere portati in perfetto allineamento da una trasformazione similare. Il quadrato/diamante ne è un esempio perché le due figure sono identiche, una è solo ruotata di 45° rispetto all'altra. L'ipotesi di allineamento tramite trasformazione implica che tali figure possano sempre essere viste come equivalenti, ma ciò non accade sempre.
Per render conto di questa discrepanza, questa ipotesi propone una spiegazione per il mancato riconoscimento del quadrato/diamante. Il tipo di punti ancora menzionati sopra - il centro della massa, le convessità e concavità- rimangono invarianti dopo la rotazione quindi non forniscono un valore plausibile a questo fenomeno. Altri tipi di punti ancora e/o schemi di orientamento non obiettivi per stabilire delle corrispondenze tra punti ancora potrebbero essere inventati ma si traterebbe di trucchi. Se l'allineamento fosse definito da un asse di simmetria, allora il quadrato/diamante potrebbe essere allineato come mostrato nella figura 8.1.3 e sarebbe per forza percepito come diverso.


8.1.4 STRUTTURA DI RIFERIMENTO CENTRATA SULL'OGGETTO

Una terza alternativa per risolvere il problema della forma equivalente è quello di definire la forma tramite una struttura di riferimento centrata sull'oggetto. In molte cose questa ipotesi riprende il processo di allineamento che abbiamo già discusso ma è sufficientemente differente da richiedere una descrizione separata.
Il concetto che la percezione della forma deve coinvolgere una struttura di riferimento è suggerita dall'osservazione che una persona può vedere il diamante di Match come un quadrato inclinato se percepisce un lato diagonale come superiore. Cosa significa? Che le figure di Match possono essere percepite una come avente una forma (diamante)relativa alla verticale gravitazionale e un'altra (quadrato) relativa a un orientamento diagonale che ridefinisce la percezione della figura, del sopra, del sotto e dei lati. E' da notare che queste due alternative sono mutualmente esclusive così che la figura non può essere percepita come due figure contemporaneamente. Irvin Rock (1973) fu tra i primi a suggerire che questa relazione tra forma e orientamento nasce perché percepire le forme è una descrizione relativa ad una struttura di riferimento percettiva sebbene l'idea di una struttura di riferimento era stata precedentemente usata dai teorici della Gestalt per spiegare altri fenomeni di percezione dell'orientamento. Rock propose questa idea specificatamente per il caso dell'orientamento ma altre teorici (per esempio Marr & Nishihara, 1978; Palmer, 1975b, 1989) più tardi la generalizzavano per altre proprietà, come posizione e misura attraverso l'analogia con le strutture di riferimento geometriche (vedere sotto).
Nella sua forma generale, questa ipotesi fornisce un'alternativa alle due precedenti sul tema dell'equivalenza della forma. E' basata sull'idea che gli effetti delle trasformazioni similari sulla forma percepita possano essere cancellati dall'imporre una struttura di riferimento intrinseca che effettivamente separa la forma rappresentata dall'azione delle trasformazioni. Per capire come questo sia possibile esamineremo la situazione analoga in geometria analitica nella quale il sistema di coordinate gioca un ruolo di struttura di riferimento degli oggetti geometrici.

SISTEMA DI COORDINATE GEOMETRICHE

Nella geometria analitica, gli oggetti geometrici come linee, curve, cerchi ed elissi sono rappresentati in descrizioni simboliche sotto forma di equazioni. Quello che rende ciò possibile è un sistema di coordinate: una struttura formale, creata dal grande filosofo e matematico francese Renè Descartes, che permette ad ogni punto in un spazio dimensionale n di essere rappresentato come un set ordinato di n numeri chiamato coordinate. La serie di punti che fa si che l'oggetto geometrico sia descritto può allora essere specificato da un'equazione che esprima la relazione tra le coordinate numeriche dei punti che fanno parte dell'oggetto.
Consideriamo per esempio un sistema di coordinate cartesiane standard in uno spazio bidimensionale. Esso serve a stabilire una serie strutturata di riferimenti standard per rappresentare la posizione in coordinate solitamente definite (x,y). Un sistema cartesiano include:

1.un riferimento alla posizione che definisce la sua origine,
2.un riferimento all'orientamento che definisce gli assi,
3.un riferimento alla distanza che definisce l'unità di misura, e
4.un riferimento alla direzione (senso) che definisce la direzione positiva lungo gli assi.

Questi riferimenti standard sono sufficienti, in uno spazio bidimensionale, per assegnare una coppia unica di numeri, (x,y) a ogni punto in un piano 2-d, come illustrato nella figura 8.1.5.
Come esempio concreto di come un sistema di coordinate può produrre una descrizione simbolica consideriamo il cerchio contrassegnato dalla lettera a nella parte sinistra della figura 8.1.6. in quel caso esso può essere descritto dall'equazione

x²+ y² = 1.


In questa particolare equazione per descrivere il cerchio il centro del sistema di coordinate deve essere al suo centro, e la sua unità di misura deve essere uguale al raggio del cerchio. (L'orientamento e la direzione lungo gli assi non è un problema per i cerchi perché la circonferenza non varia -cioè è simmetrica- per tutte le rotazioni e riflessioni). Questa particolare struttura di riferimento permette a questa circonferenza particolare di essere descritta simbolicamente da questa particolare equazione.
Può questa equazione essere usata per rappresentare la forma di tutte le circonferenze? Per scoprirlo consideriamo come l'altra circonferenza, contrassegnata dalla lettera b nella parte sinistra della figura 8.1.6, può essere descritta all'interno dello stesso sistema di coordinate.
Sebbene simili sotto certi aspetti importanti l'equazione di b è in qualche modo diversa:

(x-2)² + (y-2)²= 4.

La differenza nasce dal fatto che la posizione e la misura della circonferenza b è diversa dalla circonferenza a e usando lo stesso sistema di coordinate per descrivere entrambi ne consegue che l'equazione si presenta differente.
La chiave di osservazione per capire l'ipotesi della struttura di riferimento centrata sull'oggetto si basa sul fatto di non usare lo stesso sistema di coordinate per descrivere le due circonferenza ma di usufruire di due sistemi differenti. Se il centro del sistema di coordinate per la circonferenza b si fosse trovato al centro della circonferenza stessa e se l'unità di misura del sistema fosse stato uguale al suo raggio allora l'equazione di b per questo secondo sistema di coordinate sarebbe stato esattamente la stessa di a nell'altro sistema. Questa possibilità è illustrata nella parte destra della figura 8.1.6 che mostra le stesse due circonferenze descritte nei due diversi sistemi di coordinate. L'intuizione importante che deriva da quest'esempio è che, relativamente al loro sistema di coordinate definito intrinsecamente, le due circonferenze hanno la stessa identica equazione. Così, scegliendo il "giusto" sistema di coordinate la variazione della misura e dell'orientamento della circonferenza può essere eliminata dall'equazione. Queste variazioni sono in qualche modo "assorbite" dal sistema di coordinate differenti così che l'equazione non cambia per qualsiasi circonferenza.

STRUTTURA DI RIFERIMENTO PERCETTIVA. Si ipotizza che una struttura di riferimento in percezione sia analoga ai sistemi di coordinate in geometria analitica nel senso che essa può essere usata per mappare un oggetto spaziale in un descrizione simbolica percettiva. Un modo in cui questo può avvenire è tramite la struttura di riferimento centrata sullo spettatore: un singolo sistema di coordinate in cui la struttura standard è scelta in relazione allo spettatore, con il centro che corrisponde al punto di fissazione, il suo orientamento e la direzione positiva allineata con l'orientamento verticale e con il right-ward della retina e la sua scala (unità di misura) definita da alcuni angoli di visione della retina scelti in modo arbitrario. Nella struttura di riferimento centrata sullo spettatore, è come se la retina avesse una grata cartesiana disegnata su di essa grazie alla quale tutti gli oggetti possono essere descritti. Questo è forse il modo più ovvio per descrivere una struttura di riferimento percettiva ma non è l'unica.
Un'alternativa è quella di assegnare a ogni oggetto la sua struttura di riferimento centrata sull'oggetto scelta sulla base delle proprietà intrinseche grazie alle quali un oggetto può essere descritto. Questa ipotesi suggerisce che il sistema di coordinate usato per descrivere ogni oggetto è, in qualche modo, fatta su misura per quel oggetto particolare. Invece, come vedremo, sistemi di coordinate diverse possono essere usate per descrivere parti dello stesso oggetto.
Grossolanamente parlando la struttura di riferimento centrata sull'oggetto tende a produrre descrizioni identiche per oggetti con forme equivalenti perché molte (ma non tutte) le forme sono sufficientemente ben strutturate da indurre il sistema visivo a descriverle dentro la stessa struttura. Facciamo un esempio, se solo l'orientamento di due oggetti altrimenti identici è differente, come una sedia in piedi e una rovesciata, allora l'orientamento della loro struttura basata sull'oggetto sarà definita in modo che entrambe abbiano la stessa descrizione. Ciò vale anche per le differenze di misura come per esempio un'automobile di dimensioni normali e un modellino della stessa, le dimensioni delle loro struttura di riferimento centrata sull'oggetto differiranno in maniera corrispondente. Purché le differenze nella struttura di riferimento siano compensate da una trasformazione similare , la forma equivalente può essere veridicamente percepita. Invece, se si scelgono strutture diverse per qualche ragione - come quando gli assi di simmetria sono allineati con la gravità nel quadrato/diamante di Match - anche le stesse forme possono essere percepite in modo diverso. Questa è l'osservazione chiave che rende questa teoria affascinante per quel che riguarda la percezione della forma.
La struttura centrata sull'oggetto è così chiamata perché sceglie di adattare la sua struttura alle caratteristiche dell'oggetto, come abbiamo visto nella figura 8.1.6 (parte destra). L'idea generale si basa sulla convinzione che due forme siano percepite equivalenti tutte le volte in cui due oggetti hanno la stessa descrizione simbolica - qualsiasi essa sia - all'interno della propria struttura di riferimento centrata sull'oggetto. Così le strutture percettive possono compensare la differenza nell'orientamento di due oggetti nello stesso modo di una differenza di misura o di posizione. Se l'orientamento di due oggetti altrimenti identici differisce, allora gli oggetti saranno percepiti come aventi la stessa forma purché l'orientamento della loro struttura di riferimento corrisponda nello stesso modo al soggetto. Il risultato finale è che se la stessa struttura intrinseca viene usata per la stessa forma in tutte le situazioni allora la forma equivalente sarà perfettamente percepita per tutte le trasformazioni del similarity group.

Motivi di fallimento della percezione di forme equivalenti.

Tutta la forza e la debolezza della struttura di riferimento intrinseca di cui abbiamo parlato sopra stà nella frase condizionale "se la stessa struttura intrinseca viene usata per la stessa forma in tutte le situazioni". Questa è una debolezza perché non è computazionalmente possibile trovare questa situazione. Come può la struttura scelta essere così strettamente legata alle proprietà di un oggetto da essere usata sempre? Questo problema nasce dalla difficoltà di scelta che talvolta ci porta a "sbagliare" struttura intrinseca come si può capire dai fallimenti nella percezione di forme equivalenti. Come teoria della percezione umana, invece, questa difficoltà può essere un punto di forza che porta le persone a sbagliare sempre nelle stesse situazioni.
Possono questi fallimenti essere spiegati dall'ipotesi della struttura di riferimento basata sull'oggetto? Palmer (1985) propone tre importanti assunzioni per il caso di diverso orientamento:

1.descrizione relativa. La forma è percepita in relazione alla struttura di riferimento nella quale un orientamento specifico è standard di descrizione?

Questa assunzione implica che la forma equivalente è determinata dal confrontare le descrizioni simboliche degli oggetti piuttosto che gli oggetti direttamente grazie le trasformazioni di allineamento.

2. tendenze intrinseche. Il sistema percettivo usa delle euristiche (regole empiriche) che sono basate sulla struttura intrinseca dell'oggetto stesso per assegnare una struttura di riferimento a un oggetto.

Noi ci siamo chiesti brevemente cosa queste euristiche possono essere, alcune possibilità riguardano il fatto che la struttura di riferimento possa essere stabilita lungo un asse di simmetria o di proiezione. Così queste euristiche forniscono percezione veridiche di forme equivalenti in molti casi perché le stesse regole applicate agli stessi oggetti generalmente producono gli stessi risultati. Ma essendo le euristiche sono imperfette ci possono essere alcune circostanze - come gli oggetti con molteplici assi di simmetria - in cui i differenti orientamenti possono essere scelti, portando a degli errori principalmente nella forma equivalente.

3.tendenze estrinseche. In aggiunta alla tendenza centrata sull'oggetto nella selezione dell'orientamento ci sono anche tendenze a trovare l'orientamento saliente rispetto alle altre strutture di riferimento o direzione, così come la verticalità gravitazionale, l'orientamento del corpo dell'osservatore o l'asse alto-basso della retina.

Per un osservatore posto verticalmente, queste sono tutte coerenti una con l'altra, ma possono essere messe in conflitto quando la testa dell'osservatore e/o il suo corpo sono inclinati rispetto alla gravità. Le tendenze estrinseche sono a volte abbastanza forti da causare errori nella percezione della forma equivalente.
Queste tre assunzioni insieme implicano che l'orientamento della struttura percettiva per un dato oggetto sarà una funzione unita della sua struttura intrinseca, all'orientamento relativo all'osservatore e all'orientamento relativo all'ambiente. Se per esempio una figura ha due o più assi intrinseci per l'orientamento della struttura basata sull'oggetto e uno di questi viene a trovarsi allineato con la verticale gravitazionale allora si tende a scegliere l'asse verticale come risulta da alcune descrizioni particolari della forma. Se una figura altrimenti identica è vista con un diverso orientamento cioè con un asse diverso da quello allineato con la verticale, questo asse può essere scelto per la struttura di riferimento. Lo stesso oggetto in un orientamento ambientale differente può quindi produrre differenti descrizioni della forma.
Questo è il modo in cui la ipotesi della struttura di riferimento centrata sull'oggetto spiega il fallimento della percezione della forma equivalente nel caso del quadrato/diamante di Match. Esso può portare alla percezione di due forme differenti se l'asse di simmetria è allineato orizzontalmente o verticalmente - cioè con la bisettrice del suo lato o del suo angolo. Quando è la bisettrice del lato a essere allineata orizzontalmente e verticalmente le persone percepiscono la figura come diamante. Così la violazione dell'equivalenza oggettiva della forma può risultare dallo stesso meccanismo della struttura di riferimento che generalmente produce la reale percezione della forma equivalente.
Perché strutture di riferimento diverse possono risultare nelle diverse descrizioni dello stesso oggetto? Palmer (1983) suggerisce che la differente struttura di riferimento crea differenti proprietà relazionali disponibili per la percezione come illustrato nella figura 8.1.7. nel caso del diamante/quadrato, per esempio, la percezione del quadrato rende chiaro il fatto che i suoi lati sono paralleli con gli assi della struttura e l'uno per l'altro come proprietà certe che nascono dalla simmetria del riflesso circa gli assi della struttura -per esempio , i lati opposti sono uguali in lunghezza e gli angoli adiacenti sono di ugual misura (figura 8.1.7 A). questo implica anche che un quadrato può essere visto come più simile a
un rettangolo (che ha la stessa struttura) che un rombo (nel quale gli angoli sono obliqui relativamente all'asse e gli angoli adiacenti non sono uguali). Questo confronto è illustrato nella figura 8.1.8 A, basata su una dimostrazione di Goldmeier. (1936/1972).
La percezione del diamante, invece, rende chiaro che i lati sono obliqui rispetto agli assi, che gli angoli opposti hanno la stessa misura e che i lati adiacenti sono uguali in lunghezza (figura 8.1.8 B). questo implica che il diamante sembrerà più simile al rombo che al rettangolo, ribaltando le relazioni di somiglianza dell'esempio del quadrato. Questo vale anche se le tre figure sono ruotate di 45° rispetto a quelle della figura 8.1.8A.
Hinton (1979,1981) ha compiuto alcune osservazioni circa il fallimento della percezione della forma equivalente dovuti all'uso di strutture di riferimento differenti. Egli studiò un compito di immagine mentale usando un cubo tridimensionale. Prima chiese ai suoi soggetti di immaginare un cubo appoggiato su di un tavolo di fronte a loro (figura 8.1.9A). Dopo gli chiese di ruotare l'immagine di questo cubo così che due vertici opposti venissero a trovarsi allineati verticalmente, come se il cubo fosse in bilico su uno due dei suoi angoli (figura 8.1.9B). Quando i soggetti avevano completato la trasformazione mentale egli chiese loro di puntare la posizione del vertice supplementare (immaginario). Quasi tutti puntarono ai quattro punti che, in una configurazione di un quadrato, giacciono nel piano orizzontale che biseca la linea tra i vertici allineati verticalmente. Infatti questa non definisce un cubo ma una doppia piramide, come illustrato nella figura 8.1.9C. La risposta corretta è molto più complicata: ci sono effettivamente sei vertici che giacciono alternativamente su due piani paralleli connessi dal bordo che scorre tra essi, come mostrato in figura 8.1.9B.
Quello che questa analisi e questa dimostrazione suggeriscono è che l'effetto estremo di selezionare una struttura di riferimento percettiva è quello di fornire all'osservatore differenti serie di relazioni geometriche contenute nella struttura della figura. Poiché è impossibile estrarre tutte le possibili relazioni dalle figure - sono molte - e molto di esse sono estremamente ridondanti, il sistema visivo sceglie la serie più stabile e pratica che riesce a trovare. Questa serie è quella delle relazioni potenzialmente percepibili che, come Palmer (1983) suggerisce, costituiscono la struttura di una struttura di riferimento percettiva. Rimane da determinare precisamente come possono queste relazioni (o se questa è la via migliore) per caratterizzare la struttura di riferimento percettiva.

ORIENTAMENTO E FORMA.

Può sembrare irragionevole fare così tanta confusione a proposito della dimostrazione sul quadrato/diamante di Mach, che potrebbe semplicemente essere un'interessante anomalia. In effetti, comunque, Rock (1973) ha dimostrato che questo fenomeno è di gran lunga più pervasivo di quanto si possa supporre in base all'esperienza quotidiana. L'importanza delle sue scoperte sta nelle loro implicazioni riguardo al fatto che gli schemi di riferimento centrati sull'oggetto siano solitamente chiamati in causa nelle percezioni di equivalenza di forma. Com'è spesso dimostrato, gli insuccessi di un sistema a volte si dimostrano essere più illuminanti per quanto riguarda i meccanismi sottostanti al sistema stesso di quanto lo siano i successi. Ancora, non dobbiamo perdere di vista il fatto che una corretta percezione dell'equivalenza fra forme costituisce la regola, mentre i fiaschi costituiscono l'eccezione. In termini di quadro di riferimento delle ipotesi, ciò significa che il punto di vista è solitamente stabilito in accordo con gli oggetti, solo raramente si dimostra essere allineato in maniera diversa.
Rock (1973) ha dimostrato che in determinate condizioni la percezione di equivalenza di forma riferita a rotazioni di piano è piuttosto difficile da ottenere. Egli mostrò ai soggetti una sequenza di alcune forme amorfe e insolite in un determinato orientamento durante una fase di presentazione iniziale e successivamente li testò riguardo alla memoria di riconoscimento di figure poste nello stesso modo contro figure diversamente orientate (vedi figura 8.1.10A). I risultati dimostrarono che le persone riconoscono con minore probabilità le forme se testate in un orientamento diverso rispetto all'orientamento iniziale. Le loro povere prestazioni di riconoscimento, che si avvicinano al caso per rotazioni di 90 gradi, indicano che i soggetti spesso falliscono nel percepire equivalenza di forma fra le figure presentate inizialmente e presentate durante la prova.
In una serie di ulteriori studi Rock dimostrò che il primo fattore determinante l'orientamento per queste figure poco strutturate non è retinico, ma ambientale e/o gravitazionale. Ad esempio, quando gli osservatori inclinavano le loro teste di 90° fra la presentazione e la fase di test senza che l'orientamento delle figure rispetto all'ambiente fosse cambiato, la prestazione di riconoscimento era assai migliore rispetto a quando cambiava di 90° l'orientamento delle figure senza che le teste degli osservatori venissero inclinate. Rock prese questo e altri risultati collegati come evidenza del fatto che la forma è percepita in relazione ad uno schema di riferimento ambientale in cui la gravità definisce l'orientamento di riferimento, al limite anche in assenza di assi intrinseci all'oggetto stesso. Se l'orientamento delle figure in relazione all'ambiente cambia dal momento della presentazione iniziale a quello della fase di test, la descrizione della figura presentata in fase di test non corrisponderà con quella depositata in memoria, e l'osservatore perciò spesso commetterà errori nel riconoscere l'equivalenza fra le due figure.
La spiegazione classica riferita a Rock per gli insuccessi nella percezione dell'equivalenza fra forme si rifà alla caratteristica di amorfità propria delle forme da lui utilizzate. Ma cosa succede quando vengono utilizzate forme con "buoni" assi intrinseci, in grado di guidare la scelta di appropriati quadri di riferimento centrati sull'oggetto? Wiser (1981) analizzò in modo preciso questo quesito e trovò che le figure con buoni assi intrinseci vengono riconosciute allo steso modo sia quando vengono presentate e testate in orientamenti diversi che quando vengono presentate e testate nello stesso orientamento (figura 8.1.10B). Utilizzando figure amorfe come quelle di Rock, comunque, Wiser replicò i risultati di questo (figura 8.1.10A). Questi risultati sono completamente in accordo con le analisi teoriche di Rock (1973), sebbene quest'ultimo fosse più interessato alla spiegazione dei fallimenti nella percezione di equivalenza fra forme che nella spiegazione dei successi.
In ulteriori esperimenti Wiser (1981) dimostrò che quando una figura ben strutturata viene presentata inizialmente in modo che il suo asse non sia allineato con il piano gravitazionale verticale, il conseguente riconoscimento risulta essere più rapido quando la figura viene presentata nella fase di test nel suo orientamento verticale. Essa interpretò questo risultato a voler significare che la forma è immagazzinata nella memoria anche se è perpendicolare in relazione al suo proprio quadro di riferimento centrato sull'oggetto. Questo risultato è importante soprattutto perché sconferma la semplicistica ipotesi secondo la quale il riconoscimento di forme è sempre migliore nel caso in cui le figure siano presentate e poi testate nello stesso orientamento. E' comunque in accordo con una stima in termini di quadri di riferimento. E' soltanto necessario assumere che il quadro di riferimento centrato sull'oggetto proprio della figura sia stabilito dalla sua struttura interna nel caso in cui questa struttura sia sufficientemente forte. I risultati di Wiser, quindi, implicano che il processo di riconoscimento operi più efficacemente quando il quadro di riferimento centrato sull'oggetto proprio della figura è allineato con il quadro gravitazionale del suo ambiente circostante.
Da notare il fatto che i risultati di Wiser riferiti a figure con buoni assi intrinseci dimostrano la corretta percezione di equivalenza fra forme. La figura è riconosciuta meglio in un orientamento diverso dal momento che è percepita come avente la stessa forma. Comunque, questo succede solo quando la figura è dotata di un buon asse intrinseco che ne guidi l'orientamento di riferimento in relazione allo stesso asse entrambe le volte. Se la figura possiede più di un buon asse (come il quadrato/diamante di Mach) o è priva di buoni assi (come gli stimoli di Rock) l'equivalenza di forma può non venire percepita quando diversi assi sono in linea con un punto di riferimento estrinseco saliente sia in fase di presentazione che in fase di test. Così, sia i risultati degli esperimenti di Rock che quelli di Wiser supportano le ipotesi di quadro di riferimento centrato sull'oggetto.

EURISTICHE NELLA SELEZIONE DI QUADRI DI RIFERIMENTO.
Se la stima di percezione di equivalenza fra forme in termini di quadri di riferimento centrati sull'oggetto è esatta, allora è importante considerare quali fattori potrebbero governare la selezione di schemi appropriati. Per alcune proprietà la risposta è piuttosto ovvia, per altre è sorprendentemente evasiva. La posizione di riferimento per il quadro -corrispondente al centro di un sistema di coordinate geometriche- potrebbe essere identificata con il centro di massa dell'oggetto. Questa è una proprietà dell'oggetto stesso facilmente calcolata che può essere utilizzata per definire il centro del suo proprio schema di riferimento centrato sull'oggetto. La grandezza della scala di riferimento -corrispondente all'unità di distanza in un sistema di coordinate geometriche- può essere identificata con l'estensione dell'oggetto lungo la sua più lunga dimensione. Anche questa è una proprietà dell'oggetto facilmente calcolata che perciò può essere utilizzata per definire la dimensione di un quadro di riferimento centrato sull'oggetto. Così, la posizione assoluta e l'ampiezza assoluta sono due proprietà che possono essere facilmente calcolate nella percezione di forma di un oggetto con esigua o nulla ambiguità (questo è vero soltanto per oggetti 2-D su un piano frontale. Se è chiamata in causa la percezione 3-D, allora la dimensione più lunga può variare sostanzialmente a seconda della prospettiva di vista).
Come si può desumere dalla precedente discussione sull'interdipendenza fra orientamento e forma, il fatto di selezionare l'orientamento di riferimento per un quadro di riferimento intrinseco a un oggetto è molto complesso. Un certo numero di fattori stimolo sembrano essere importanti per la sua determinazione:
1. ORIENTAMENTO GRAVITAZIONALE. Siccome la forza di gravità è un fattore così importante per determinare la struttura di orientamento in riferimento all'ambiente risulta essere molto importante anche per la determinazione di schemi di riferimento centrati sull'oggetto. L'orientamento gravitazionale verticale sembra funzionare come difetto di valore per l'orientamento: l'orientamento che verrà selezionato per uno schema di riferimento centrato sull'oggetto in assenza di una forte struttura di orientamento nell'oggetto stesso. L'orientamento orizzontale è un altro orientamento ambientale saliente che influisce sulla selezione dello schema.
2. ASSI DI SIMMETRIA RELATIVI ALLA RIFLESSIONE. Un tipo di struttura basata sull'oggetto particolarmente utile nel definire l'orientamento di un quadro di riferimento interno è l'asse di simmetria di riflessione (o bilaterale).Se ce n'è solo uno, allora può essere usato senza ambiguità per definire l'orientamento del quadro, come mostrato in figura 8.1.10B. Se ce n'è più di uno -come nell'ambiguo quadrato/diamante di Mach- allora l'orientamento del quadro risulterà potenzialmente ambiguo.
3. ASSI DI ALLUNGAMENTO. Un altro tipo di struttura figurale piuttosto utile nel definire l'orientamento di uno schema di riferimento interno è l'asse di allungamento. Ancora, nell'ampiezza in cui c'è un chiaro asse di allungamento, questo può essere utilizzato per specificare lo schema senza ambiguità, come nella figura 8.1.10B. Ma se più di una soluzione risulta possibile, l'ambiguità rimane.
4. ORIENTAMENTO DEL CONTORNO. Un altro fattore implicato nell'orientamento di uno schema di riferimento centrato sull'oggetto è l'orientamento dei contorni dell'oggetto, soprattutto se questi sono dritti. Un margine inferiore orizzontale è particolarmente importante dal momento che suggerisce stabilità gravitazionale, una proprietà ecologicamente importante che improbabilmente risulta essere casuale. I contorni in altri orientamenti possono anche produrre effetti sostanziali sui quadri di riferimento, soprattutto se sono estesi e/o si trovano in coppie parallele.
5. ORIENTAMENTO STRUTTURALE. L'orientamento di elementi strutturali all'interno di una figura, come ad esempio righe, può essere importante nel definire l'orientamento di un quadro di riferimento, soprattutto se gli elementi sono relativamente grossi e spessi rispetto alla figura.
6. ORIENTAMENTO CONTESTUALE. Anche l'orientamento di oggetti attigui può influenzare l'orientamento di un quadro di riferimento, soprattutto se sono essi stessi fortemente orientati e reggono una stretta relazione strutturale con la figura in questione. Una forte influenza contestuale è esercitata da un rettangolo che circonda. Ad esempio la figura 8.1.11 mostra che un rettangolo inclinato di 45° può provocare il fatto che il diamante dritto di Mach sia percepito come un quadrato inclinato. L'orientamento di righe strutturali nel territorio attorno alla figura può anche influenzare l'orientamento del quadro di riferimento percepito.
7. MOVIMENTO. Anche la direzione del movimento di un oggetto può fortemente influenzare la sua percezione di orientamento e forma. Presumibilmente questo succede perché il movimento distingue l'orientamento allineato con la propria traiettoria da tutti gli altri. La parte dell'oggetto rivolta nella direzione del movimento è generalmente concepita come la parte davanti o sopra dell'oggetto, con uno degli assi del quadro di riferimento allineati lungo la direzione del movimento.
Questi principi di quadro di selezione sono assimilabili ai principi di raggruppamento della Gestalt. Cioè essi sono distorsioni potenzialmente indipendenti che possono essere utilizzate per predire il quadro di riferimento esclusivamente in casi puri o in quei casi in cui diversi fattori convergono per influenzare lo stesso orientamento. In diverse situazioni, comunque, diversi fattori sono in conflitto gli uni contro gli altri, come mostrato in figura 8.1.12. La maggior parte delle persone percepisce questa figura come un poligono asimmetrico capovolto. Non c'è nulla di sorprendente in ciò finchè non viene realizzato che c'è un asse di simmetria lungo un orientamento obliquo. La ragione più probabile che fa all'inizio apparire questa figura come capovolta piuttosto che inclinata è l'orientamento orizzontale del contorno dello sfondo. La percezione risultante di stabilità gravitazionale rinforza così la naturale tendenza a selezionare l'orientamento verticale come l'orientamento di riferimento.
La figura 8.1.13A mostra la stessa figura significativamente allungata lungo il suo asse di simmetria. Adesso è molto più semplice vederla come una figura appuntita simmetrica e inclinata che punta in giù e a sinistra. La figura 8.1.13B mostra la stessa figura 8.1.12 ma ruotata di 180 gradi. In questo orientamento è più probabile che sia percepita come una figura simmetrica inclinata che punta all'insù verso destra dal momento che non è gravitazionalmente stabile. Cioè, sembra che si inclini in senso antiorario in modo che il lato più lungo finisca con l'essere orizzontale e il suo asse di simmetria verticale. La figura 8.1.13C mostra la stessa figura con all'interno spesse righe che influenzano la percezione in direzione di un quadro di riferimento obliquo. La figura 8.1.13D mostra ancora la stessa figura ma posta all'interno di un rettangolo che la circonda e che influenza fortemente un quadro di riferimento in linea con i suoi bordi. Infine la figura 8.1.13E descrive l'influenza del muovere la stessa figura lungo il suo asse di simmetria, che crea una fortissima influenza a percepirla come una forma simmetrica inclinata. Sfortunatamente, non c'è ancora un'unica teoria riguardo alla selezione dei quadri di riferimento in grado di specificare il modo in cui fattori multipli si combinino in una misura unica che predica l'orientamento risultante di un quadro di riferimento centrato sull'oggetto.
E' importante notare che le teorie sull'equivalenza i forma basate su un quadro di riferimento centrato sull'oggetto sono in stretta relazione con quelle basate su allineamenti trasformazionali. La ragione è che in entrambi i casi viene usata una serie di trasformazioni per assorbire, cancellare o rilevare differenze fra i due oggetti. Nelle teorie sull'allineamento uno degli oggetti viene trasformato in esatta corrispondenza con l'altro laddove nelle teorie sui quadri di riferimento il quadro di riferimento viene trasformato in corrispondenza con la struttura dell'oggetto. Questo non significa che le due teorie sono uguali. L'allineamento trasformazionale è basato sull'accoppiamento di due immagini, mentre i confronti di schemi di riferimento sono basati su descrizioni simboliche di forma all'interno dello schema di riferimento. Inoltre, le teorie sull'allineamento sono spesso basate su conteggi su punti fissi, mentre le teorie sullo schema di riferimento sono solitamente basate sulla ricerca di un orientamento intrinseco, attraverso simmetrie, assi di prolungamento, texture e così via, come appena detto. Non è ancora chiaro quale approccio si avvicini maggiormente alla percezione delle forme propria dell'essere umano.

TEORIE SULLA RAPPRESENTAZIONE DELLA FORMA.
L'equivalenza fra forme è solo uno degli aspetti della percezione di forme. Si occupa del problema di decidere quando due oggetti sono identici come forma ma non affronta il problema cruciale della similarità di forma fra oggetti che non sono identici. La somiglianza fra forme è un problema molto più complesso perché richiede una teoria che specifichi come rappresentare la forma in un modo che fornisca una misura graduata corrispondente alla similarità percepita. Da notare che non c'è molto da dire circa la rappresentazione della forma nella nostra discussione sull'equivalenza fra forme perché viene richiesta soltanto una decisione con due alternative: due oggetti hanno o non hanno la stessa forma? Questa semplificazione ci permette di definire le condizioni sotto le quali due oggetti hanno la stessa forma senza però dover proporre una teoria completa sulla percezione della forma. In questa sezione considereremo varie proposte teoriche riguardo a come la forma degli oggetti e le loro parti possano effettivamente venire rappresentate nel sistema di visione umano e come due di queste rappresentazioni possano essere comparate per somiglianza.
Il lettore è preavvisato che tutte le teorie che stiamo considerando risultano inadeguate al fine di catturare il sorprendente potere, la versatilità e la finezza della percezione umana di forme. Il modo in cui le persone percepiscono la forma è sicuramente fra i problemi di più difficile soluzione all'interno della percezione visiva, di così difficile soluzione che nessuna teoria soddisfacente è ancora stata proposta. Ancora, sono stati fatti progressi significativi, e molto può essere appreso considerando le teorie già proposte. Dal momento che non c'è accordo riguardo la soluzione, il nostro intento sarà quello di imparare il più possibile analizzando sia i punti di forza che le debolezza di tutte le maggiori teorie.

TEMPLATES.
L'idea sottostante a quella di templates è semplicemente rappresentare la forma come forma, come farebbe uno strutturalista non corretto. Nelle rappresentazioni templates la forma è specificata dalla concatenazione di cellule recettrici sulle quali l'immagine di un particolare oggetto cade. Un template di quadrato può essere formato, ad esempio, associando insieme tutti i recettori che stimolerebbe più i recettori circostanti che non verrebbero stimolati. Il modo più ovvio per implementare questa idea è costruire una "cellula rilevatrice di quadrato" la cui struttura di campo recettiva incorpori la forma in questione -in questo caso quella di un quadrato contro il suo territorio circostante. Come illustrato nella figura 8.2.1 ciò significa che la regione centrale del quadrato del campo recettivo sarebbe connessa in modo eccitatorio con il rilevatore di quadrato. La regione di fondo attorno al quadrato sarebbe connessa in modo inibitorio al rilevatore di quadrato in modo da penalizzare le partenza che non c'entrano con il quadrato, la maggior parte dei campi recettivi corticali hanno dintorni inibitori. Così, un quadrato bianco su sfondo nero ecciterà al massimo queste cellule rilevatrici di quadrato dal momento che la sua struttura spaziale corrisponde in modo ottimale a quelle del campo recettivo. Chiameremo queste rappresentazioni STANDARD TEMPLATES per differenziarle da quelle alternative più complesse che proporremo in seguito in risposta a certi problemi.
Gli elementi atomici di cui i templates sono composti vengono tipicamente rappresentati come sistemi dalle caratteristiche binarie corrispondenti al fatto che particolari recettori vengano scaricati o meno. Questo significa che ogni elemento all'interno del campo del template è sia eccitatorio (ad esempio risponde positivamente alla presenza di luce) che inibitorio (ad esempio risponde negativamente alla presenza di luce). Questo sistema a due valori non è comunque l'unica possibilità. Si può costruire in modo semplice un template "su scala di grigio" convertendo la rappresentazione di ciascun elemento spaziale da un sistema con caratteristiche binarie (bianco versus nero in un determinato recettore) in una dimensione continua sulla scala del grigio variando i pesi delle connessioni in modo continuo da +1 (legame eccitatorio) a -1 (legame inibitorio). Così, una persona potrebbe costruire un insieme di templates per reticoli locali a onde sinusoidali come base per una teoria della percezione di forma a frequenza spaziale locale. Una persona potrebbe persino costruire un template "rilevatore della nonna" che risponde massimamente all'immagine del viso della nonna sotto particolari condizioni visive: da un particolare angolo visivo e distanza con fonti di luce in particolari collocazioni ambientali. Il fatto che templates su scala di grigio siano possibili non significa necessariamente che possano risolvere i problemi di percezione della forma comunque, come si può notare.
Per poter determinare la somiglianza fra due forme abbiamo bisogno di un metodo per confrontare le rappresentazioni. Due templates possono essere paragonati semplicemente calcolando una misura della loro corrispondenza puntuale o grado di adattamento. Uno schema particolarmente semplice per templates è calcolare la correlazione fra l'immagine in input e il template. Questa misura va da +1.0 per la massima corrispondenza positiva (fra due immagini identiche) a -1.0 per la massima corrispondenza negativa (fra un'immagine e la sua versione al negativo). Il valore atteso per due immagini non correlate è zero. Questa misura comparativa può essere utilizzata sia per templates con sistema binario che per templates su scala di grigio.

PUNTI DI FORZA.
I templates sono tipicamente ridicolizzati nei libri di testo e negli articoli di ricerca, e grossolanamente inadeguati per la rappresentazione di forme. Comunque hanno molte potenti argomentazioni in loro favore: i templates devono per forza essere utilizzati ad un certo punto nel processo di visione per convertire immagini strutturate nello spazio in rappresentazioni simboliche. I templates sono sempre il punto di inizio per discutere a proposito della rappresentazione di forme per il semplice fatto che essi sono il più ovvio meccanismo per eseguire questa conversione. Le teorie sulla rilevazione di linee e margini ad opera di semplici cellule in area V1 sono rappresentazioni template benchè molto semplici. Ciascuna cellula per la rilevazione di linee, ad esempio, risponde massimamente ad una linea in una specifica posizione, orientamento e contrasto (luce e buio versus buio e luce). La percentuale di scaricamento decresce in rapporto al modo in cui ciascuno di questi parametri cambia rispetto al proprio valore ottimale, fornendo così una misura del grado di somiglianza fra la struttura locale dell'immagine che cade all'interno del suo campo e la struttura spaziale del suo campo recettivo. Questa minima percentuale di scaricamento avviene per via della distribuzione opposta della luce all'interno del suo campo recettivo.
Lo stesso ragionamento vale per l'approccio alla frequenza spaziale locale della funzione delle cellule in V1 che abbiamo discusso nella sezione 4.2.2. Ciascuna cellula è deputata al calcolo di una misura della somiglianza fra la struttura spaziale locale dell'immagine in input e la funzione Gabor codificata nel suo campo recettivo. In questo caso la conversione è stata fatta a partire da immagini a componenti a frequenza spaziale locale piuttosto che da linee e margini, ma la rappresentazione di base può ancora essere accuratamente caratterizzata come una forma di template matching. La differenza più grande è che i componenti a frequenza spaziale locale non sono presi per essere aspetti significativi della forma di un oggetto, mentre margini e linee lo sono.
Sappiamo con un certo margine di certezza, allora, che il sistema visivo fa uso di templates per rappresentare forme molto semplici, come linee e margini o frammenti locali di reticoli sinusoidali. La domanda è se ci sono ragioni di principio per le quali questo approccio non possa essere esteso ad includere forme più complesse di oggetti reali, come quadrati, Wolkswagens o il viso della nonna.

PUNTI DEBOLI.
Dopo aver riconosciuto ai templates ciò che gli spetta in quanto primo passo necessario nella creazione di una rappresentazione simbolica di forma, deve essere riconosciuto che i loro punti deboli in quanto teoria generale di rappresentazione di forma sono parecchi e profondi. Consideriamo ora in dettaglio alcune delle più importanti obiezioni, dal momento che potranno anche servire come paragone nei confronti delle altre teorie che potranno essere esaminate.
1. Il problema dei canali sensoriali multipli. Alcuni fattori visivi hanno poco, se non nessuno, impatto nella forma percepita, tuttavia influenzano fortemente la correlazione fra due rappresentazioni template. Forse il fattore più ovvio è rappresentato dalle differenze nei colori. Un quadrato verde su sfondo giallo è visto avere la stessa forma di un quadrato blu su sfondo rosso o di qualsiasi altra combinazione di colori. Questo pone un problema per le rappresentazioni standard template dal momento che queste sono definite in termini di recettori di output specifici. Un template rappresentante un quadrato verde su sfondo giallo non sarà uguale ad un altro identico template per un quadrato blu su sfondo rosso dal momento che gli elementi colorati sottostanti sono diversi. Il problema generale è che le rappresentazioni retiniche basate su template non sono invarianti rispetto ai colori, mentre la percezione di forma lo è.
Come si può vedere, il problema del colore è solo la punta di un enorme iceberg. Ci sono molte altre differenze nei canali visivi all'interno dei quali un quadrato può essere rappresentato, in grado di influenzare profondamente qualsiasi rappresentazione standard template pur avendo pochi o addirittura nulli effetti nella percezione della forma quadrata. Considera il fatto che i quadrati possano venire percepiti per mezzo di contorni illusori, segmenti a tratti e differenti textures, come illustrato in figura 8.2.2. Nemmeno questo esaurisce i possibili canali attraverso i quali un quadrato può venire rappresentato. Il destino comune può fare in modo che una regione quadrata costituita da punti venga vista in contrapposizione sia a uno sfondo statico che a uno sfondo che si muove in una direzione diversa. La disparità binoculare può fare in modo che una regione quadrata costituita da punti emerga in profondità in contrapposizione a uno sfondo di punti messi in modo casuale, come abbiamo visto nel capitolo 5 (vedi figura 5.3.8). I contorni di un quadrato possono anche venire rilevati da una piccola apertura che ne rivela i bordi (vedi sezione 10.2.4) e così via. Il problema generale è che esiste una grande varietà di canali visivi diversi attraverso i quali i contorni di un quadrato possono venire rappresentati, facendo uso di metodi radicalmente diversi di stimolazione sensoriale. La nozione che templates di forma possa essere assicurata mettendo insieme un gruppo di unità di input periferiche è perciò problematica.
Esistono due modi per far fronte a questa difficoltà. Un modo è quello di costruire un template separato per ogni canale sensoriale. Il problema è che ci sarebbero allora una molteplicità di quadrati templates invece che uno solo. Il secondo modo per far fronte al problema dei canali sensoriali è quello di definire templates per la rappresentazione della forma ad un livello più astratto nel sistema visivo, dopo che tutti i canali di estrazione dei contorni (per esempio colore, texture, disparità binoculare, movimento, contorni illusori) hanno avuto i loro effetti. Ciò che è necessario è un template che in qualche modo rappresenti le differenze fra figura (il quadrato) e sfondo (il suo sfondo) indifferentemente rispetto al canale sensoriale che porta le informazioni dei contorni. Una rappresentazione del genere risulterebbe adeguata in accordo con i canali sensoriali.
2. Il problema delle trasformazioni spaziali. Nella prima sezione di questo capitolo abbiamo discusso l'importante evidenza che la forma rimane invariata nonostante le trasformazioni di somiglianza: traslazioni, rotazioni, dilatazioni, riflessioni e le loro varie combinazioni. Uno dei problemi maggiori riguardo agli schemi standard template è che confrontando le rappresentazioni template di due oggetti aventi la stessa forma non si ottiene un buon risultato se questi differiscono esclusivamente rispetto ad una di queste trasformazioni.
La figura 8.2.3, ad esempio, mostra che se un secondo quadrato template viene paragonato con un quadrato iniziale cambiandone posizione, orientamento e forma questo ha devastanti conseguenze nella correlazione. Dal momento che tutti questi oggetti hanno la stessa forma obiettiva, come abbiamo definito nella sezione 8.1.1, il semplice calcolo della correlazione fra due templates non da una misura ragionevole della somiglianza di forma.
Questi sono due metodi per risolvere questo problema per le rappresentazioni template: REPLICAZIONE e NORMALIZZAZIONE. La replicazione è la strategia di costruire un template diverso per ogni forma in ogni possibile posizione, orientamento, dimensione e senso. Poi il template con la corrispondenza migliore rispetto al target costituirà una ragionevole approsimazione della loro "vera" somiglianza all'interno di questo schema di somiglianza di forma. Questo è l'approccio che il sistema visivo utilizza per linee e margini (e/o per componenti a frequenza spaziale locale) nell'area V1, ripetendo la stessa struttura recettiva di campo in continuazione per tutte le possibili posizioni retiniche, orientamenti, dimensioni e sensi. Come si può immaginare, questo approccio è attuabile solo se l'insieme di forme template è molto piccolo. Linee e margini (o funzioni Gabor in fase seno e coseno) sono infatti un insieme molto piccolo. Ma se tutte le forme che la gente riesce a discriminare dovessero venire ripetute in ogni posizione, orientamento, dimensione e senso, la proliferazione di templates che ne risulterebbe -chiamata ESPLOSIONE COMBINATORIA- farebbe inorridire la mente. La replicazione di templates, perciò, non è una soluzione da poter essere presa in considerazione in riferimento al problema generale della rappresentazione di forme, sebbene possa invece essere sufficiente per un insieme minimo di templates molto semplici come linee e margini.
Quello della normalizzazione è un approccio un po' diverso per risolvere il problema delle trasformazioni spaziali, in stretta connessione con due idee che abbiamo già discusso: allineamenti trasformazionali e schemi di riferimento intrinseci. L'assunzione è che una teoria ragionevole della somiglianza di forme basata su template può essere costruita senza replicare i templates se l'immagine in input può prima venire trasformata o "normalizzata" in conformità a un insieme di modelli referenziali. Ad esempio, la posizione di una figura può essere normalizzata in relazione al suo centro di massa, al suo orientamento relativo alla sua dimensione più lunga e così via, come discusso nella sezione 8.1.4 considerando gli schemi di riferimento centrati sull'oggetto. Introdurre un tale processo di normalizzazione all'interno del sistema prima di confrontare i templates per