Perception et reconnaissance des formes

30 cartes

Ce chapitre explore la perception visuelle, de la capture de l'information par l'œil à la reconnaissance des objets. Il aborde la distinction entre sensation, perception et identification, les mécanismes en jeu dans la perception (couleur, localisation, mouvement), les théories de reconnaissance des formes (gabarits, traits, géons) et l'influence des processus ascendants et descendants. Des troubles tels que la prosopagnosie sont également présentés pour illustrer la complexité des systèmes de traitement visuel du cerveau.

30 cartes

Réviser
La répétition espacée te présente chaque carte au moment optimal pour la mémoriser durablement, en espaçant les révisions de façon croissante.
Question
Comment nomme-t-on les mouvements rapides des yeux ?
Réponse
Des saccades. Aucune information visuelle claire n'est captée pendant ces mouvements.
Question
Quand l'information visuelle est-elle capturée ?
Réponse
Pendant les fixations, lorsque notre regard s'arrête sur un point de la scène visuelle.
Question
Quelle est la définition de la sensation ?
Réponse
Fait de recevoir une stimulation physique via ses sens et de l'encoder dans le système nerveux.
Question
Quelle est la définition de la perception ?
Réponse
Le processus par lequel on interprète les informations transmises par nos sens.
Question
Quelle est la différence entre perception et identification ?
Réponse
La perception peut exister sans identification, qui assigne la représentation perceptive à une catégorie mentale.
Question
Pourquoi "percevoir = voir" est-il incorrect ?
Réponse
La perception concerne d'autres sens et n'est pas une simple copie du monde extérieur, mais une construction.
Question
Quelle est la fonction principale du cristallin ?
Réponse
Focaliser la lumière des objets observés pour former une image nette sur la rétine.
Question
Quels sont les deux types de photorécepteurs de la rétine ?
Réponse
Les cônes et les bâtonnets.
Question
Quelle est la fonction des cônes ?
Réponse
Ils codent les détails précis et la couleur. Ils nécessitent beaucoup de lumière pour bien fonctionner.
Question
Quelle est la fonction des bâtonnets ?
Réponse
Très sensibles à la lumière, ils permettent la vision dans la pénombre mais ne codent pas la couleur.
Question
Où se trouve la tache aveugle de l'œil ?
Réponse
À l'endroit de la rétine où il n'y a pas de neurones car le nerf optique en part.
Question
Qu'est-ce que la mémoire iconique ?
Réponse
Un système de mémoire sensorielle visuelle qui maintient l'information un très bref instant après sa disparition physique.
Question
Qu'a démontré l'expérience de rappel partiel de Sperling (1960) ?
Réponse
Que presque toute l'information d'une scène est disponible en mémoire iconique pendant un très court instant.
Question
Différence entre vision de bas niveau et haut niveau ?
Réponse
Le bas niveau extrait l'information de base (couleurs, contours), tandis que le haut niveau perçoit les objets et visages dans leur globalité.
Question
Comment l'œil perçoit-il les couleurs ?
Réponse
Grâce aux réponses pondérées de trois types de cônes sensibles aux longueurs d'onde du bleu, vert et rouge.
Question
Qu'est-ce que le daltonisme ?
Réponse
Une anomalie de perception des couleurs due à une déficience d'un ou plusieurs des trois types de cônes de la rétine.
Question
Qu'est-ce que la ségrégation figure-fond ?
Réponse
La capacité du système visuel à distinguer les figures de leur arrière-plan pour localiser les objets.
Question
Qu'est-ce que le principe gestaltiste de proximité ?
Réponse
Les éléments qui sont proches les uns des autres ont tendance à être perçus comme un groupe.
Question
Qu'est-ce que le principe de bonne continuation ?
Réponse
Le système perceptif préfère les contours qui continuent sans incident plutôt que ceux qui changent brusquement de direction.
Question
Qu'est-ce que la disparité binoculaire ?
Réponse
Le décalage entre les images d'un même objet sur les deux rétines, qui est un indice de profondeur.
Question
Qu'est-ce que l'akinétopsie ?
Réponse
Un trouble où le patient ne perçoit plus le mouvement visuel, suite à une lésion de l'aire cérébrale V5/MT.
Question
Qu'est-ce que le phénomène phi ?
Réponse
La perception d'un mouvement continu (mouvement apparent) à partir d'une succession rapide d'images fixes.
Question
Quelle est la principale faiblesse de la théorie d'appariement de gabarits ?
Réponse
Son manque de flexibilité face aux variations de taille, d'orientation, de forme ou de position du stimulus.
Question
Quelle est l'idée centrale des théories des traits ?
Réponse
La reconnaissance des formes se base sur la décomposition des patrons visuels en leurs constituants de base, appelés traits.
Question
Que sont les géons dans la théorie de Biederman ?
Réponse
Des composants volumétriques de base (cylindres, cônes...) qui, une fois assemblés, permettent de reconnaître les objets 3D.
Question
Qu'est-ce que le traitement holistique des visages ?
Réponse
Le fait de reconnaître les visages sur la base de leur configuration globale plutôt que par l'analyse de leurs parties isolées.
Question
Qu'est-ce que la prosopagnosie ?
Réponse
Une agnosie visuelle caractérisée par une incapacité à reconnaître les visages familiers, parfois même son propre visage.
Question
Qu'est-ce qu'une double dissociation en neuropsychologie ?
Réponse
L'observation de schémas de déficits inverses chez deux patients, suggérant l'indépendance fonctionnelle et neuronale de deux systèmes cognitifs.
Question
Qu'est-ce qu'un processus ascendant (bottom-up) ?
Réponse
Un traitement de l'information qui commence par les propriétés élémentaires du stimulus pour construire progressivement une représentation complexe.
Question
Qu'est-ce qu'un processus descendant (top-down) ?
Réponse
Un traitement de l'information influencé par les connaissances, les attentes, et le contexte mental de l'individu.

Psychologie Cognitive : La Perception

Ce chapitre est fondamental pour comprendre la base de toute vie mentale, qui commence par la prise d'information, suivie de son traitement.

1. Comprendre le Terme "Perception"

La perception n'est pas une simple copie du monde extérieur, mais une construction active.

Définitions Clés

  • Sensation : Recevoir une stimulation physique via les sens et l'encoder dans le système nerveux. C'est la base de la vie mentale.

    • Exemple : Ondes lumineuses pour les yeux, ondes sonores pour les oreilles, converties en signaux bio-électriques.

  • Perception : Processus par lequel nous interprétons les informations transmises par nos sens. Une fonction cognitive fondamentale.

  • Identification (ou Reconnaissance) : Assigner le produit de la perception (percept) à une catégorie mentale stockée en mémoire.

    • La perception ne mène pas toujours à l'identification.

    • Exemple : Percevoir une forme sans pouvoir l'identifier à une catégorie connue.

Ce que la Perception N'est Pas

  • Percevoir = identifier ? Non, on peut percevoir sans identifier.

  • Percevoir = voir ? Non, car cela réduit la perception à la vision uniquement (alors qu'il y a d'autres sens) et suppose une simple copie du monde extérieur, ce qui est faux.

  • Percevoir = devenir conscient ? Non, des études montrent une perception sans conscience. Des informations peuvent influencer notre comportement sans que nous en ayons conscience.

2. Les Organes Utilisés pour Percevoir

La perception repose sur la sensation. Les cinq sens traditionnels sont la vue, l'odorat, l'ouïe, le toucher, le goût, auxquels s'ajoutent l'équilibre, la température, la douleur.

Dominance de la Vision et de l'Audition

  • Historiquement et subjectivement, la vision et l'audition sont considérées comme les sens les plus importants pour l'exploration de l'environnement.

  • La vision est un sens dominant : Gibson (1933) a montré que la vision prévaut sur le toucher en cas d'informations contradictoires.

  • Ce cours se concentre sur la perception visuelle (Prof. Chetail) et auditive (Prof. Smejkalova).

Le Défi de Comprendre la Perception

  • La perception se déroule extrêmement rapidement et sans effort conscient, ce qui rend son étude difficile.

  • La perception est d'une grande complexité : même un enfant de 5 ans surpasse les ordinateurs actuels en habiletés perceptives (reconnaissance de formes, lettres, objets).

  • Les CAPTCHA exploitent cette supériorité humaine sur les machines.

3. La Perception est une Construction

La perception n'est pas une simple copie du monde extérieur (réalisme naïf) ; elle implique des ajouts et des interprétations.

Illustrations du Caractère Constructif de la Perception

  • Illusions d'optique (ex. Müller-Lyer, Zöllner) : Démontrent que la perception n'est pas une simple retranscription de la réalité physique. Les illusions sont les "coûts" des mécanismes adaptatifs de notre système perceptif face à l'ambiguïté.

  • Illusion de perception des longueurs : Les indices de profondeur peuvent nous faire percevoir des éléments différemment de leur taille réelle.

  • Influence des connaissances sur le monde : L'exemple des concavités/convexités en fonction de l'orientation de l'image (Kleffner & Ramachandran, 1992) montre que notre système cognitif fait des hypothèses (ex: source lumineuse venant du haut) pour construire la perception.

Conclusion sur la Perception Constructive

  • Le réalisme naïf est faux et n'explique pas les mécanismes en jeu.

  • La perception est une interprétation de l'information sensorielle, une construction active de notre cerveau.

4. Bases de la Perception Visuelle

4.1. Quelques Notions d'Anatomie (Oeil et Cerveau)

  • La perception est limitée par les caractéristiques physiologiques de nos systèmes sensoriels (ex: pas d'ultrasons ou d'ultraviolets).

  • La lumière visible est une petite partie du spectre électromagnétique que l'oeil peut détecter.

  • Les rayons lumineux (photons) varient en longueur d'onde et intensité, transportant des informations sur les objets rencontrés.

  • Anatomie de l'oeil :

    • Cristallin : Focalise la lumière sur la rétine, projette des images inversées.

    • Rétine : Contient des récepteurs sensibles à la lumière (cônes et bâtonnets).

    • Ces récepteurs traduisent l'énergie lumineuse en influx nerveux.

    • Cheminement de l'influx : Cônes/Bâtonnets → Cellules bipolaires → Cellules ganglionnaires.

    • Nerf optique : Formé par les axones des cellules ganglionnaires, transmet les signaux au cerveau.

  • Voies visuelles :

    • Croisement au chiasma optique.

    • Atteignent le lobe occipital (cortex visuel primaire V1-V8, MT/VS).

    • Aires spécialisées (Zeki, 1978) : Couleur (V4), Forme (V3, V4), Mouvement (V3), "Bureaux de poste" (V1, V2).

4.2. Points Supplémentaires

  • Tache Aveugle : Zone de la rétine où le nerf optique démarre, sans récepteurs. Nous sommes aveugles à la lumière qui y est projetée, mais le cerveau compense ou l'autre œil prend le relais.

  • Acuité, Cônes et Bâtonnets :

    • Répartition non uniforme sur la rétine : fovea, parafovea, zone périphérique.

    • Macula lutea (fovea + parafovea) : Permet une vision précise.

    • Cônes : Concentrés dans la fovea, nécessitent beaucoup de lumière, codent les détails et les couleurs (forte acuité visuelle).

    • Bâtonnets : Très sensibles aux variations de lumière, permettent la vision dans la pénombre, ne codent pas la couleur.

4.3. Collecte de l'Information Visuelle

  • La prise d'information visuelle n'est pas continue mais discrète.

  • Mouvements oculaires :

    • Saccades : Mouvements très rapides d'un point à un autre (25-100 ms). Pendant les saccades, pas de prise d'information (suppression saccadique).

    • Fixations : Pauses où le regard se fixe (150-250 ms). La prise d'information visuelle se fait pendant les fixations.

  • Nous échantillonnons différentes régions de la scène visuelle, comme un appareil photo (métaphore).

4.4. Mémoire Sensorielle Visuelle (Mémoire Iconique)

  • Système qui reçoit l'information visuelle des yeux et la maintient en mémoire très brièvement (environ 1 seconde).

  • Persistance visuelle : Persistance apparente d'un stimulus au-delà de sa durée physique (ex: éclair). C'est un événement mental.

  • Utilité : Permet au cerveau d'interpréter les signaux visuels, surtout quand le stimulus physique est éphémère.

  • Expériences de Sperling (1960) :

    • Rappel intégral : Présentation de 12 lettres (50 ms), participants rappellent en moyenne 4 lettres.

    • Rappel partiel : Même présentation, mais un signal indique quelle ligne de 4 lettres rappeler. Les participants rappellent ~3 des 4 lettres (80%).

    • Conclusion : Toute la matrice est maintenue en mémoire un bref instant.

    • La performance diminue si le signal de rappel est retardé : 1 seconde après, la performance chute à 33%.

  • Sperling a postulé l'existence d'un registre sensoriel visuel où l'information est stockée et se dégrade rapidement.

5. Vision de Bas Niveau vs. Vision de Haut Niveau

  • Vision de bas niveau : Extraction d'informations de base (couleur, orientation, profondeur, mouvement).

  • Vision de haut niveau : Perception d'éléments dans leur globalité (objets 2D/3D, visages), reconnaissance.

5.1. Perception des Couleurs

  • La couleur est l'effet perceptif des variations de longueur d'onde de la lumière.

  • Système perceptif utilise trois types de cônes (sensibles au bleu, vert, rouge). Le "mélange" de leurs réponses construit la perception des couleurs.

  • Daltonisme : Déficience d'un ou plusieurs types de cônes.

  • Anomalies perceptives : Fatigue visuelle (ex: exposition prolongée au rouge réduit la sensibilité), effets d'adaptation qui peuvent déformer la perception des couleurs.

5.2. Localisation des Objets

Pour localiser un objet, il faut le ségréger, estimer sa distance et sa profondeur, et analyser son mouvement.

5.2.1. La Ségrégation (Figure/Fond)

  • Capacité du système visuel à distinguer les figures de l'arrière-plan.

  • Psychologues de la Gestalt : Ont défini des principes de structuration des scènes visuelles (ex: Proximité, Similitude, Bonne Continuation).

    • Principe de Proximité : Les éléments proches sont groupés ensemble.

    • Principe de Similitude : Les éléments similaires sont groupés ensemble.

    • Bonne Continuation : Le système perceptif préfère les contours qui se poursuivent sans incident (ex: deux lignes qui se coupent plutôt que quatre segments).

  • Le système perceptif peut construire des contours illusoires.

  • La perception est une interprétation : plusieurs organisations figure/fond sont possibles mais non simultanées.

5.2.2. La Distance et la Profondeur

Les images rétiniennes sont plates, mais nous percevons en 3D grâce à de nombreux indices.

  • Indices monoculaires (un seul œil) :

    • Interposition : Un objet couvrant un autre est perçu comme étant devant.

    • Perspective linéaire : Les lignes parallèles qui convergent donnent une impression de profondeur.

    • Taille relative : Objet plus petit perçu comme plus lointain.

    • Ombre projetée : Peut indiquer la position ou la forme de l'objet (souvent avec l'hypothèse d'une source lumineuse venant d'en haut).

    • Mouvement parallaxe (observateur en mouvement, objet immobile) : Les objets proches bougent plus vite sur la rétine que les objets éloignés.

  • Indices binoculaires (deux yeux) :

    • Convergence : Mouvement des yeux vers un objet rapproché. Plus la convergence est forte, plus l'objet est proche. Efficace jusqu'à ~18 mètres.

    • Disparité binoculaire : Légères différences entre les images captées par chaque œil pour un même objet oblique.

  • En général, nous utilisons plusieurs de ces indices simultanément pour percevoir la distance et la profondeur.

5.2.3. Le Mouvement

  • La perception du mouvement est complexe ; elle ne se réduit pas au simple déplacement d'images sur la rétine.

  • Indices de taille relative : Objet qui grandit s'approche, objet qui rapetisse s'éloigne.

  • Mouvement apparent (Phénomène Phi) : Perception du mouvement à partir d'images fixes présentées rapidement (ex: films, flip books).

    • Wertheimer (1912) décrit ce phénomène.

    • Le cerveau "invente" les images manquantes pour créer une perception continue. Le mouvement est une construction de l'esprit.

  • Akinétopsie (absence de perception du mouvement) : Atteinte de la région cérébrale V5 (ou MT) spécialisée dans le traitement du mouvement (Zihl, von Cramon & Mai, 1983 décrit le cas de Mme L.M.).

  • Des perturbations transitoires de la perception du mouvement peuvent apparaître en cas de migraines (aura) ou sous l'influence de certaines substances (palinopsie, persévération visuelle).

6. Reconnaissance des Formes (Perception de Haut Niveau)

Le système perceptif construit une description d'une forme observée et la compare aux descriptions stockées en mémoire. Si un "match" est trouvé, l'objet est reconnu.

6.1. Reconnaissance par Appariement de Gabarits (Template Matching)

  • Première théorie : Une forme perçue est comparée à des gabarits (modèles exacts) stockés en mémoire.

  • Exemple : Un "A" est comparé à un gabarit de "A".

  • Limites de la théorie :

    1. Impossible de stocker un gabarit pour chaque variation (taille, orientation, position) possible d'un même objet.

    2. Le système ne serait pas capable de reconnaître des objets déformés.

    3. N'explique pas comment nous reconnaissons des objets nouveaux ou légèrement différents.

  • Cette théorie fut rapidement abandonnée.

6.2. Reconnaissance par Détection de Traits (Feature Detection)

  • Hypothèse : Nous décomposons les formes visuelles en leurs constituants élémentaires (traits).

  • Chaque forme est une combinaison unique de traits (ex: traits obliques, horizontaux, verticaux pour les lettres).

  • Avantages de cette théorie :

    • Économique : Peu de traits permettent de définir de nombreuses catégories.

    • Compatible avec les observations physiologiques : Hubel et Wiesel (1959) ont démontré l'existence de neurones détecteurs de contours spécifiques dans le cortex visuel du chat (par enregistrement de cellules isolées).

    • Compatible avec les données humaines : Les erreurs de reconnaissance de lettres se produisent entre lettres partageant des traits communs.

  • Modèle du Pandémonium (Selfridge, 1958) : Modèle de traitement séquentiel en 4 étapes :

    1. Démon de l'image : Stocke une trace iconique du stimulus.

    2. Démons des traits : S'activent si le stimulus contient les traits dont ils sont responsables (traitement en parallèle).

    3. Démons des lettres : Reçoivent l'information des démons des traits et s'activent proportionnellement au nombre de traits correspondants (explique les confusions de lettres).

    4. Démon de la décision : Décide de la réponse en fonction du démon des lettres le plus activé.

  • Traitement sériel vs. parallèle : Le Pandémonium suggère un traitement en parallèle des traits visuels.

6.3. Théories Structurelles (pour Objets 3D)

  • Les théories de traits manquent la dimension des relations spatiales entre les traits (ex: T vs L).

  • Les théories structurelles intègrent l'organisation spatiale des traits.

  • Pour les objets 3D, la description par traits est complexe. Il est plus simple de les décrire par volumes (géons).

  • Théorie de Reconnaissance par Composants (Biederman, 1987) :

    • Tous les objets 3D sont composés de 36 géons (geometrical ions), des blocs de construction de base.

    • Processus de reconnaissance :

      1. Segmentation du champ visuel : Distinction de l'objet, extraction des contours et des régions concaves (lieux d'intersections de géons).

      2. Reconnaissance des géons et de leur structuration.

      3. Appariement : Comparaison de l'assemblage des géons avec des patrons en mémoire pour la reconnaissance.

    • L'information sur les intersections des géons est cruciale pour la reconnaissance (Biederman, 1985).

    • Biederman et Cooper (1991) ont montré que la reconnaissance est facilitée si les géons sont préservés dans des images complémentaires.

    • Cette théorie a eu un grand succès, bien qu'elle présente des limites (ex: distinction d'objets avec des parties similaires).

6.4. Reconnaissance des Visages

  • La reconnaissance faciale est extraordinaire malgré de faibles différences et variations.

  • Les visages sont décomposables en traits (nez, yeux, bouche), mais la reconnaissance se base sur un traitement holistique (global).

  • Farah (1992) : Les visages ne sont pas reconnus par décomposition en parties comme d'autres objets.

  • Tanaka et Sengco (1997) : Démontrent que la reconnaissance des parties d'un visage est meilleure lorsque la partie est présentée dans la configuration faciale globale (et non isolément ou dans une configuration nouvelle).

  • Le traitement holistique des visages est privilégié et inné (dès la naissance).

  • Aires cérébrales spécialisées : Des neurones spécifiques dans le lobe temporal répondent sélectivement aux visages (Desimone et al., 1991). Atteinte de cette zone → difficultés à reconnaître les visages.

  • Prosopagnosie : Incapacité à reconnaître les visages familiers. Les patients voient les parties mais ne peuvent les intégrer en un tout signifiant.

6.5. Dissociations et Doubles Dissociations en Neuropsychologie

  • Dissociation : Une fonction est atteinte, une autre est préservée chez un patient cérébro-lésé. Suggère des systèmes de traitement distincts, mais peut être expliquée par des différences de difficulté de tâche.

  • Double Dissociation : Deux patients (A et B) présentent des déficits inverses.

    • Patient A : Atteinte de la fonction 1, fonction 2 préservée.

    • Patient B : Fonction 1 préservée, atteinte de la fonction 2.

  • La double dissociation révèle l'indépendance de systèmes de traitement.

  • Exemple : La prosopagnosie est un cas de dissociation de la reconnaissance des visages (patient A). Le patient CK (Moscovitch, Winocur et Behrmann, 1997), atteint d'agnosie visuelle (incapacité à reconnaître les objets) mais capable de reconnaître les visages, est un équivalent du patient B.

  • Ces cas de double dissociation soutiennent l'idée d'un système cognitif dédié à la perception des visages, distinct de celui des autres objets.

7. Le Rôle du Contexte

7.1. Processus Ascendants (Bottom-Up) et Descendants (Top-Down)

  • Processus ascendants : Traitement de l'information visuelle des propriétés élémentaires (bas) vers une représentation complexe (haut) (ex: détection de longueurs d'onde → couleur).

  • Processus descendants : Influence de facteurs extérieurs au stimulus (connaissances, attentes, contexte) sur la perception (du haut vers le bas).

  • La perception est une interaction des deux types de processus.

7.2. Influence du Contexte Physique et Mental

  • Contexte physique : Informations visuelles environnantes (ex: feuilles de myrtillier aidant à reconnaître les myrtilles).

  • Contexte mental : Connaissances stockées en mémoire, motivation, attentes.

  • Exemple 1 : Figure ambigüe de Boring (1930) (jeune femme/vieille femme). Leeper (1935) a montré que la perception est influencée par une préparation préalable (montrer une figure non ambigüe avant).

  • Exemple 2 : Bruner et Goodman (1947) : Influence de la valeur (connaissances) sur la perception de la taille des pièces de monnaie (surestimation par rapport à des disques de carton de même taille, surtout chez les enfants défavorisés).

7.3. Évolution des Modèles

  • Les modèles de traitement ont évolué pour intégrer l'influence des processus descendants (ex: le modèle du Pandémonium est purement ascendant, des modèles ultérieurs comme celui de McClelland & Rumelhart, 1981 intègrent le contexte).

  • Exemple : La même forme peut être perçue comme un "H" dans "THE" et un "A" dans "CAT" en fonction des lettres voisines (contexte).

Conclusion Générale

  • Percevoir, c'est construire une représentation visuelle à partir de stimulations sensorielles.

  • Cette construction est enrichie par nos connaissances et nos attentes.

  • L'information est captée par l'œil, stockée brièvement dans un registre sensoriel.

  • Une analyse des propriétés (couleurs, traits, dimensions) est effectuée (processus bottom-up).

  • Nos connaissances et le contexte influencent la construction du percept (processus top-down).

  • La représentation est comparée aux connaissances en mémoire pour la reconnaissance.

Lancer un quiz

Teste tes connaissances avec des questions interactives