cours 4

Keine Karten

Ce contenu traite de la discrimination figure-fond et de l'organisation perceptive, notamment de la manière dont le cerveau interprète les informations visuelles pour former une perception cohérente. Il aborde également les théories sur la reconnaissance des objets et la perception de la profondeur, ainsi que les mécanismes de la vision des couleurs et les troubles associés.

La Perception de la Forme, de la Profondeur et de la Couleur

La perception visuelle transforme l'image bidimensionnelle projetée sur la rétine en une représentation tridimensionnelle riche et stable du monde. Ce processus n'est pas une simple capture passive, mais une construction active et inférentielle où le cerveau interprète, complète et résout les ambiguïtés pour extraire des formes, des objets et leur disposition spatiale.

Le Traitement Hiérarchique de l'Information Visuelle

Le système visuel traite l'information de manière hiérarchique : chaque aire visuelle combine les informations des niveaux précédents pour construire des représentations de plus en plus complexes, de simples points de lumière à la reconnaissance d'objets.

Du Signal Rétinien au Cortex Visuel

Rétine : Les cellules photoréceptrices (cônes et bâtonnets) captent la lumière. Les cellules bipolaires servent d'intermédiaire et les cellules ganglionnaires envoient au cerveau l'information finale sous forme de points de contraste locaux. À ce stade, il n'y a pas de détection de lignes, de contours ou de formes.
Cortex Visuel Primaire (V1) : Reçoit les signaux du corps genouillé latéral (CGL). V1 assemble les points de contraste en lignes et contours orientés grâce à des neurones spécialisés (cellules simples et complexes). Les voies ON et OFF, qui traitent respectivement les incréments et les décréments de lumière, restent séparées jusqu'à V1.
Aires Extrastriées (V2, V3, V4, IT, etc.) : Ces aires combinent les sorties de V1.
- V2-V3 : Combinent les lignes pour former des angles, des courbes, et les premiers éléments de forme.
- V4 : Intègre les lignes et traits pour commencer à inférer la profondeur et traiter la couleur.
- Cortex Inférotemporal (IT) : Combine les formes simples en représentations d'objets complexes, menant à la reconnaissance.

Les Cellules End-Stopped (Hypercomplexes)

Ces neurones, principalement situés dans V1 et V2, sont une extension des cellules complexes. Ils sont sensibles non seulement à l'orientation et au mouvement, mais aussi à la longueur des lignes ou des bords.

Définition : Une cellule end-stopped répond de manière maximale à un stimulus (ligne, bord) d'une longueur spécifique. Si le stimulus s'étend au-delà de son champ récepteur, sa réponse diminue ou s'arrête (inhibition).
Fonction : Elles sont cruciales pour détecter les coins, les angles, les courbes et les extrémités de contours.
Exemples Concrets :
- Fenêtre carrée : Ces cellules s'activent pour détecter les quatre coins.
- Pointe d'une flèche : Elles répondent à l'angle aigu ou à l'extrémité de la flèche.
- Objet derrière une occlusion : Si une personne marche derrière une clôture, les cellules end-stopped s'activent lorsque les extrémités de ses membres (bras, jambes) apparaissent et disparaissent entre les barreaux. Elles signalent ainsi la présence d'un contour qui se termine.
- Mouvement derrière un obstacle : En observant une voiture passer derrière des arbres, elles détectent les bords courts du véhicule et leurs extrémités en mouvement qui apparaissent entre les troncs.

La fonction clé des cellules end-stopped est de répondre aux discontinuités de contours (extrémités) qui apparaissent, se déplacent ou disparaissent, mais pas lorsque l'objet est complètement caché.

La Perception de la Forme : Une Construction Cérébrale

La forme perçue n'est pas une donnée directe de l'image rétinienne 2D ; elle doit être inférée par le cerveau pour construire une représentation 3D stable et cohérente.

L'Ambiguïté de la Projection Rétinienne

Dépendance au point de vue : La forme de la projection rétinienne d'un objet change constamment selon l'angle de vue. Un cercle peut apparaître comme une ellipse.
Dépendance à la distance : La taille de la projection rétinienne varie avec la distance.
Points de vue accidentels : Parfois, un point de vue masque la vraie forme d'un objet (ex: trois lignes vues de bout peuvent former un triangle sur la rétine).
Contours illusoires : Nous percevons la continuité d'un contour même lorsque des portions de celui-ci n'ont aucun contraste avec le fond.

Le système visuel résout ces ambiguïtés en utilisant le contexte, les attentes et les régularités statistiques du monde pour choisir l'interprétation la plus probable. C'est un processus inférentiel.

Approches Théoriques : Structuralisme vs. Gestaltisme

Structuralisme (début 20ème siècle)	Gestaltisme (dès 1912)
La perception est l'addition de sensations élémentaires. Une forme est la somme des traits de base (lignes, angles) détectés par les neurones de V1.	"Le tout est plus que la somme de ses parties." La perception est guidée par des configurations globales et des principes d'organisation innés.
Approche ascendante ("bottom-up") pure.	L'organisation perceptive impose une structure à l'information sensorielle.

L'approche gestaltiste a dominé l'étude comportementale de la perception et s'est concentrée sur deux questions clés : l'organisation perceptive et la discrimination figure-fond.

L'Organisation Perceptive : Les Principes de la Gestalt

Le regroupement perceptif est l'ensemble des mécanismes par lesquels le système visuel organise les éléments visuels épars en unités cohérentes (objets, formes). Ces principes ne sont pas localisés dans une seule aire, mais émergent d'un traitement distribué dans les aires extrastriées.

Principe Fondamental : La Prägnanz

Aussi appelé "loi de la bonne forme", ce principe stipule que le système perceptif tend à organiser l'information visuelle de la manière la plus simple, stable, régulière et symétrique possible. C'est l'interprétation qui demande le moins d'effort cognitif.

Les Principes de Regroupement

Proximité : Les éléments proches les uns des autres sont regroupés.
Similarité : Les éléments similaires (en couleur, forme, taille, orientation) sont regroupés.
Bonne Continuité : Les points qui, une fois connectés, forment des lignes droites ou des courbes douces sont perçus comme appartenant à la même unité. Le cerveau préfère les tracés continus. Cela s'applique aussi aux textures.
Sort Commun : Les éléments qui se déplacent dans la même direction et à la même vitesse sont regroupés. Le mouvement est un indice de regroupement plus puissant que la proximité ou la forme.
Connectivité : Les éléments physiquement connectés sont perçus comme un tout.
Région Commune : Les éléments situés à l'intérieur d'une même région délimitée sont regroupés.
Synchronie : Les éléments qui changent d'apparence (ex: clignotent) de manière synchrone sont perçus comme reliés.
Familiarité : Les éléments sont plus susceptibles d'être regroupés s'ils forment une forme familière ou significative.

La Discrimination Figure-Fond

Une fois les éléments regroupés, le cerveau doit déterminer quelles parties de l'image constituent la figure (l'objet d'intérêt) et lesquelles constituent le fond. Cette distinction n'est pas une propriété de l'image, mais le résultat d'un processus perceptif. Dans les figures ambiguës (ex: le vase de Rubin), l'interprétation peut alterner.

Indices Favorisant la Perception d'une Figure

Inclusion : La zone perçue comme figure est souvent incluse ou contenue dans une autre.
Petite Taille : Les zones plus petites sont plus susceptibles d'être vues comme des figures.
Symétrie : Les régions symétriques sont perçues comme des figures.
Convexité : Les formes avec des bords convexes (courbés vers l'extérieur) sont privilégiées comme figures.
Parallélisme : Les régions avec des contours parallèles sont plus susceptibles d'être vues comme des figures.
Mouvement : Des éléments en mouvement se détachent facilement du fond.

Gestion de l'Occlusion : La Complétion Amodale

Le cerveau infère les parties cachées d'un objet en se basant sur la connaissance implicite que les objets sont opaques et continus.

Rattachabilité : Les contours visibles sont "rattachés" en inférant un contour caché. Cette complétion est privilégiée si elle ne nécessite qu'un seul point d'inflexion (changement de sens de la courbure) sur le contour caché.
Intersections de Contours : Les intersections en T sont des indices très forts d'occlusion (la barre du T est devant). Les intersections en Y ou en flèche signalent plutôt des coins ou des jonctions d'un même objet.

La Reconnaissance des Objets

La reconnaissance implique une mise en correspondance entre la représentation perceptive d'un objet et une représentation stockée en mémoire.

Théories de la Reconnaissance

Théorie de l'Appariement de Gabarit (Template Matching) : Le cerveau comparerait l'image rétinienne à des milliers de "gabarits" (images mentales exactes) en mémoire.
- Problème majeur : Cette approche est trop rigide. Elle nécessiterait un gabarit pour chaque objet, vu sous chaque angle, à chaque distance et dans chaque position, ce qui est biologiquement irréalisable.
Théorie de Reconnaissance-par-Composantes (Biederman) : Propose que notre système visuel décompose les objets en un petit nombre de formes volumétriques primitives appelées géons (cylindres, cônes, blocs, etc.).
- Principe : Les objets sont reconnus à partir de l'identification de leurs géons et de leur arrangement spatial. Les géons sont définis par des propriétés invariantes au point de vue (bords droits vs. courbés, symétrie, etc.).
- Limites :
  1. Manque de précision pour distinguer des objets d'une même catégorie (ex: différents modèles de voitures).
  2. Contrairement à la prédiction, la reconnaissance n'est pas parfaitement invariante au point de vue. Les performances diminuent souvent avec la rotation 3D d'un objet.

Le Problème de l'Invariance au Point de Vue et Solutions

La constance de forme est notre capacité à reconnaître un objet comme étant le même malgré les changements de son image rétinienne. Puisque la reconnaissance n'est pas parfaitement invariante, comment le cerveau y parvient-il ?

Processus d'Alignement : Le cerveau pourrait effectuer une rotation mentale de l'objet perçu pour l'aligner avec une représentation canonique stockée en mémoire.
Accumulation en Mémoire Visuelle : Le cerveau stockerait en mémoire plusieurs vues d'un même objet, acquises par l'expérience. La reconnaissance serait plus rapide pour les vues familières.

Spécialisation et Rôle du Cortex Inférotemporal (IT)

Le cortex IT est crucial pour la reconnaissance d'objets complexes.

Il contient des neurones avec une sélectivité élevée pour des formes complexes, des objets entiers, et même des catégories spécifiques (visages, lieux, parties du corps).
Un neurone ne code pas une image exacte, mais plutôt une configuration de traits.
La reconnaissance repose sur le modèle d'activité d'une population de neurones spécialisés.
L'aire FFA (Fusiform Face Area) est un exemple de cette spécialisation, montrant une activité maximale lorsqu'un visage est consciemment reconnu.

Un parallèle existe pour la reconnaissance des visages :

Reconnaître un visage en tant que visage ("niveau de base") est robuste à l'inversion (un visage à l'envers reste un visage).
Identifier une personne spécifique ("niveau subordonné") est très sensible à l'inversion (difficile de reconnaître une personne sur une photo à l'envers).

La Perception de la Profondeur

La perception de la profondeur est la capacité à percevoir le monde en 3D, malgré le fait que l'image sur chaque rétine soit en 2D. Le cerveau y parvient en exploitant plusieurs types d'indices.

Indices Oculomoteurs

Ces indices proviennent de notre propre système oculaire.

Accommodation : Le changement de forme du cristallin pour focaliser l'image sur la rétine. L'effort musculaire fournit une information sur la distance.
Convergence : L'angle formé par nos deux yeux lorsqu'ils fixent un objet. Plus l'objet est proche, plus l'angle de convergence est grand.

Ces indices sont principalement utiles pour des distances courtes (moins de 2-3 mètres).

Indices Monoculaires (Picturaux et de Mouvement)

Ces indices sont disponibles même avec un seul œil.

Occlusion (ou Interposition) : Un objet qui en cache partiellement un autre est perçu comme étant plus proche (indice non-métrique).
Hauteur Relative : Pour les objets au sol, ceux qui sont plus hauts dans le champ visuel sont perçus comme plus éloignés. Pour les objets dans le ciel, c'est l'inverse.
Taille Relative : Si deux objets sont de même taille réelle, celui qui projette une image plus grande sur la rétine est perçu comme plus proche.
Taille Familière : Notre connaissance de la taille habituelle d'un objet nous aide à estimer sa distance à partir de la taille de son image rétinienne. C'est le seul indice monoculaire qui puisse fournir une estimation de la distance métrique absolue.
Perspective Linéaire : Les lignes parallèles dans le monde (rails de train, bords de route) semblent converger vers un "point de fuite" à l'horizon.
Gradient de Texture : Les éléments d'une texture (cailloux sur une plage, briques d'un mur) apparaissent plus petits et plus denses à mesure que la distance augmente.
Perspective Aérienne : Les objets lointains apparaissent plus flous, moins contrastés et bleutés, car la lumière qu'ils réfléchissent est diffusée par les particules de l'atmosphère.
Ombrage : La distribution de la lumière et des ombres sur une surface donne des indices sur son relief et sa forme 3D.
Parallaxe de Mouvement : Lorsque nous nous déplaçons, la vitesse et la direction du mouvement apparent des objets dans notre champ visuel dépendent de leur distance par rapport au point de fixation.
- Les objets plus proches que le point de fixation semblent se déplacer rapidement en sens inverse de notre mouvement.
- Les objets plus éloignés que le point de fixation semblent se déplacer lentement dans la même direction que nous.

Indices Binoculaires

Ces indices reposent sur l'utilisation de nos deux yeux.

Disparité Binoculaire : Comme nos yeux sont séparés, ils voient le monde de deux points de vue légèrement différents. Cette différence dans la projection rétinienne est la disparité binoculaire.
Stéréoscopie : Le cerveau utilise la disparité binoculaire pour créer une impression de profondeur saisissante. Des neurones dans le cortex visuel sont spécifiquement sensibles à cette disparité.

La Perception de la Couleur

La couleur n'est pas une propriété physique de la lumière, mais une expérience perceptive créée par le cerveau en réponse à différentes longueurs d'onde de l'énergie électromagnétique.

Distinction Clé : Longueur d'Onde vs. Couleur

"Il n'y a pas de rouge dans une lumière de 700 nm, pas plus qu'il n'y a de douleur dans les sabots d'un cheval qui donne un coup de pied." – Steven Shevell

Longueur d'onde : Propriété physique de la lumière, mesurée en nanomètres (nm). Existe indépendamment de l'observateur. Le spectre visible s'étend d'environ 400 à 700 nm.
Couleur : Expérience perceptive subjective qui dépend des cônes de la rétine, du traitement neuronal, du contexte, de l'adaptation et des connaissances préalables.

Ce que la science comprend bien est le traitement sensoriel (réponse des cônes, discrimination). Ce qui est encore mal compris est le qualia (l'expérience subjective, pourquoi le rouge "ressent" comme il est).

Dimensions et Mélanges de Couleurs

Dimensions de la couleur :
1. Tonalité (ou Teinte) : La qualité qui distingue le rouge, le vert, le bleu, etc.
2. Clarté (ou Luminosité) : L'intensité lumineuse perçue, allant du sombre au clair.
3. Saturation : La pureté ou la vivacité de la couleur. Une couleur très saturée est vive, une couleur désaturée se rapproche du gris.
Mélanges de couleurs :
- Mélange Additif : Superposition de faisceaux lumineux (ex: écrans RGB). L'énergie lumineuse s'additionne. Rouge + Vert + Bleu = Blanc.
- Mélange Soustractif : Mélange de pigments (peinture, encre). Chaque pigment absorbe certaines longueurs d'onde. Plus on mélange, plus la couleur résultante est sombre.
- Mélange Moyen : Juxtaposition de petites touches de couleur qui se mélangent dans l'œil à distance (ex: pointillisme).

Théories de la Vision des Couleurs

Théorie Trichromatique (Young-Helmholtz)	Théorie des Processus Antagonistes (Hering)
Principe : Toute couleur peut être perçue par le mélange de trois longueurs d'onde primaires. La perception de la couleur résulte du patron d'activité combiné de trois types de récepteurs.	Principe : La perception de la couleur repose sur trois mécanismes antagonistes (opposés) : rouge↔vert, bleu↔jaune, et blanc↔noir. On ne peut pas percevoir un "vert-rougeâtre".
Base physiologique : Les trois types de cônes de la rétine, sensibles aux longueurs d'onde courtes (S, "bleu"), moyennes (M, "vert"), et longues (L, "rouge").	Base physiologique : Les cellules ganglionnaires et les neurones du CGL qui sont excités par une couleur (ex: rouge) et inhibés par sa couleur opposée (ex: vert).
Explique : Les expériences d'égalisation des couleurs (métamères), le daltonisme.	Explique : Les images consécutives négatives, le contraste simultané, l'impossibilité de certaines couleurs mélangées.

Ces deux théories ne sont pas contradictoires mais complémentaires. La trichromie opère au niveau des photorécepteurs (cônes), tandis que les processus antagonistes décrivent le traitement neuronal qui a lieu ensuite, dès les cellules ganglionnaires.

La Constance de la Couleur

La constance de la couleur est notre capacité à percevoir la couleur d'un objet comme étant stable malgré des changements drastiques dans la composition spectrale de l'éclairage (ex: une pomme reste perçue comme rouge à la lumière du jour, sous une ampoule tungstène ou à l'ombre).

C'est un processus inférentiel : le cerveau ne mesure pas la couleur absolue de la lumière reçue, mais estime la courbe de réflectance de la surface de l'objet en "soustrayant" l'effet de l'illuminant.
Base neuronale : Les neurones de l'aire V4 sont sensibles à la réflectance de la surface (la couleur "réelle" de l'objet) et présentent une constance de couleur. En revanche, les cellules de V1 répondent à la composition spectrale de la lumière atteignant l'œil et sont donc affectées par l'éclairage.

Anomalies de la Vision des Couleurs (Dyschromatopsie)

Communément appelé "daltonisme", il s'agit d'une atteinte congénitale due à une anomalie des cônes.

Trichromatisme Anormal : Les trois types de cônes sont présents, mais l'un d'eux a une sensibilité spectrale anormale (protanomalie pour L, deutéranomalie pour M, tritanomalie pour S). C'est la forme la plus courante.
Dichromatisme : Absence complète d'un type de cônes (protanopie, deutéranopie, tritanopie). La personne n'a que deux canaux de couleur.
Monochromatisme : Absence de deux ou trois types de cônes. La vision est en noir et blanc, avec une faible acuité visuelle et une forte sensibilité à la lumière (photophobie).

Faits intéressants : Pour de nombreux daltoniens rouge-vert, le beurre de cacahuète peut paraître vert, et un arc-en-ciel n'a que deux ou trois couleurs principales (bleu et jaune).

Points Clés à Retenir

La perception est une inférence : Le cerveau construit activement notre réalité visuelle à partir d'informations rétiniennes ambiguës, en utilisant des connaissances préalables et des règles (heuristiques).
Traitement hiérarchique : La complexité des représentations visuelles augmente à chaque étape du traitement, des points de contraste (rétine) aux objets reconnus (cortex temporal).
Les principes de la Gestalt sont des règles fondamentales que le cerveau utilise pour organiser le chaos visuel en formes et objets cohérents.
La perception de la profondeur repose sur l'intégration d'indices multiples (oculomoteurs, monoculaires, binoculaires) pour reconstruire la troisième dimension.
La couleur est une création du cerveau, basée sur la réponse relative de trois types de cônes (trichromie) et un traitement neuronal opposant (processus antagonistes).

Quiz starten

Teste dein Wissen mit interaktiven Fragen