Nouvelles publications
« Deux compteurs – une solution »: comment le cerveau combine le son et l'image pour appuyer plus rapidement sur un bouton
Dernière revue: 18.08.2025

Tout le contenu iLive fait l'objet d'un examen médical ou d'une vérification des faits pour assurer autant que possible l'exactitude factuelle.
Nous appliquons des directives strictes en matière d’approvisionnement et ne proposons que des liens vers des sites de médias réputés, des instituts de recherche universitaires et, dans la mesure du possible, des études évaluées par des pairs sur le plan médical. Notez que les nombres entre parenthèses ([1], [2], etc.) sont des liens cliquables vers ces études.
Si vous estimez qu'un contenu quelconque de notre contenu est inexact, obsolète ou discutable, veuillez le sélectionner et appuyer sur Ctrl + Entrée.

Lorsqu'un bruissement dans l'herbe et une ombre vacillante se font entendre, nous réagissons plus vite que s'il n'y avait qu'un bruit ou un éclair. Classique. Mais que se passe-t-il exactement dans le cerveau pendant ces quelques secondes? Une nouvelle étude parue dans Nature Human Behaviour montre que la vue et l'ouïe accumulent des preuves séparément et qu'au moment de la décision, leur « somme » déclenche un déclencheur moteur unique. Autrement dit, il existe deux accumulateurs sensoriels dans la tête qui coactivent un mécanisme moteur unique.
Arrière-plan
Comment le cerveau prend des décisions rapides dans un monde bruyant de sons et d'images est une question vieille de plusieurs siècles, mais sans réponse claire. Depuis la fin du XIXe et le XXe siècle, l'« effet des signaux redondants » (RSE) est connu en psychophysique: si une cible est présentée simultanément selon deux modalités (par exemple, un flash et un son), la réaction est plus rapide qu'avec un signal unique. Le débat portait sur le mécanisme: une « course » de canaux indépendants (modèle de course), où le processus sensoriel le plus rapide l'emporte, ou une coactivation, où les preuves provenant de différentes modalités s'additionnent avant de déclencher une réponse. Des tests formels (comme l'inégalité de Miller) ont aidé au niveau comportemental, mais n'ont pas montré où se produit exactement le « pli »: du côté des accumulateurs sensoriels ou déjà au niveau du déclencheur moteur.
Au cours des 10 à 15 dernières années, la neurophysiologie a fourni des marqueurs fiables de ces stades latents. Parmi les plus notables, on trouve la positivité centro-pariétale (CPP), un signal EEG supramodal « d'accumulation jusqu'au seuil » qui s'intègre bien aux modèles de dérive-diffusion de la prise de décision, et la réduction bêta (~20 Hz) sur le cortex moteur gauche comme indice de préparation au mouvement. Ces signaux ont permis de relier les modèles computationnels aux circuits cérébraux réels. Cependant, des lacunes importantes subsistent: les preuves audio et visuelles sont-elles accumulées dans un ou deux accumulateurs distincts? Existe-t-il un seuil moteur unique pour la prise de décision multimodale, ou chaque modalité est-elle « jugée » selon des critères distincts?
Une complication supplémentaire est le timing. En conditions réelles, la vision et l'audition présentent des désynchronisations de l'ordre de la microseconde à la milliseconde: un léger décalage temporel peut masquer la véritable architecture du processus. Il est donc nécessaire de disposer de paradigmes contrôlant simultanément la règle de réponse (répondre à n'importe quelle modalité ou seulement aux deux simultanément), faisant varier l'asynchronisme et permettant de combiner les distributions comportementales des temps de réaction avec la dynamique des marqueurs EEG dans une seule modélisation. C'est cette approche qui permet de distinguer la « somme des accumulateurs sensoriels avec démarrage moteur unique ultérieur » des scénarios de « course entre canaux » ou de « fusion précoce en un seul flux sensoriel ».
Enfin, des motivations pratiques dépassent la théorie fondamentale. Si les accumulateurs sensoriels sont effectivement distincts et le déclencheur moteur commun, alors dans les groupes cliniques (par exemple, maladie de Parkinson, TDAH, troubles du spectre autistique), le goulot d'étranglement peut se situer à différents niveaux: accumulation, convergence ou préparation motrice. Pour les interfaces homme-machine et les systèmes d'alerte, la phase et le timing des signaux sont essentiels: le phasage correct du son et de l'image doit maximiser la contribution conjointe au seuil moteur, et non pas simplement « augmenter le volume/la luminosité ». Ces questions sont au cœur d'un nouvel article paru dans Nature Human Behaviour, qui explore la détection multimodale simultanément au niveau du comportement, de la dynamique EEG (CPP et bêta) et de la modélisation computationnelle.
Qu'ont-ils découvert exactement?
- Dans deux expériences EEG (n = 22 et n = 21), les participants ont détecté des changements dans une animation de points (vision) et une série de tonalités (auditives) en appuyant sur un bouton soit lorsque l'une des deux changeait (détection redondante), soit uniquement lorsque les deux changeaient (détection conjonctive).
- Les chercheurs ont surveillé un « compteur » de données neuronales – la positivité centro-pariétale (CPP) – et la dynamique de l'activité bêta de l'hémisphère gauche (~20 Hz) comme marqueur de la préparation au mouvement. Ces signaux ont été comparés aux distributions des temps de réaction et aux modèles informatiques.
- En résumé: les preuves auditives et visuelles s'accumulent dans des processus séparés et, lorsqu'elles sont détectées de manière redondante, leur contribution cumulative co-active de manière subadditive (moins qu'une simple somme) un processus moteur de seuil - le « déclencheur » même de l'action.
Un détail important est la vérification de la « désynchronisation ». Lorsque les chercheurs ont introduit une légère asynchronie entre les signaux audio et visuels, un modèle dans lequel les accumulateurs sensoriels intègrent d'abord puis informent le système moteur a mieux expliqué les données que les accumulateurs en compétition. Cela renforce l'idée que les flux sensoriels fonctionnent en parallèle, mais convergent vers un seul nœud de décision moteur.
Pourquoi vous devez savoir cela (exemples)
- Clinique et diagnostic. Si les accumulateurs sensoriels sont distincts et que le seuil moteur est commun, différents groupes de patients (avec TSA, TDAH, maladie de Parkinson) peuvent s'attendre à des « nœuds de rupture » différents: en accumulation, en convergence ou en déclenchement moteur. Cela permet de concevoir plus précisément des biomarqueurs et un entraînement attention/réaction.
- Interfaces homme-machine: La conception de signaux d'avertissement et d'interfaces multimodales peut bénéficier d'un phasage optimal des signaux sonores et visuels - de sorte que la coactivation motrice soit plus rapide et plus stable.
- Modèles neuronaux de prise de décision. Les résultats relient les « controverses » comportementales à long terme (race vs. co-activation) à des marqueurs EEG spécifiques (CPP et rythme bêta du cortex moteur), rapprochant ainsi les modèles informatiques de la physiologie réelle.
Comment cela a été fait (méthodologie, mais brièvement)
- Paradigmes: redondant (répond à n'importe quelle modalité) et conjonctif (répond uniquement aux deux à la fois) – une technique classique permettant de « peser » la contribution de chaque branche sensorielle. Une expérience distincte est également proposée avec une asynchronie donnée entre l'audio et la vidéo.
- Neurosignaux:
- CPP - indice « supramodal » d'accumulation de preuves sensorielles jusqu'au seuil;
- La diminution du signal bêta dans le cortex moteur gauche est un indice de préparation au mouvement. La comparaison de leurs profils temporels a montré des amplitudes CPP différentes pour les cibles auditives et visuelles (signe d'accumulateurs distincts) et une action conjointe du mécanisme bêta (signe d'un seuil moteur commun).
- Simulation: ajustement conjoint des distributions comportementales du temps de réaction et de la dynamique EEG. Le modèle intégrant les accumulateurs sensoriels avant le nœud moteur a remporté la comparaison, notamment en présence d'asynchronisme.
Qu’est-ce que cela change dans l’image cérébrale?
- Multimodalité ≠ « mélanger et oublier ». Le cerveau ne regroupe pas toutes les preuves dans un seul récipient; il conserve des enregistrements parallèles sur tous les canaux, et l'intégration se produit au plus près de l'action. Cela explique pourquoi les signaux multimodaux accélèrent le temps de réaction: ils déclenchent simultanément le même signal moteur.
- La sous-additivité est la norme. La somme des entrées sensorielles est inférieure à une simple arithmétique, mais elle suffit à atteindre plus rapidement le seuil moteur. L'objectif de l'interface n'est donc pas d'« ajouter du volume et de la luminosité », mais de synchroniser la convergence.
- Un pont entre la psychophysique et la neurophysiologie: les anciens effets comportementaux des « signaux redondants » reçoivent une explication mécaniste via les marqueurs CPP et bêta.
Limites et prochaine étape
- L'échantillon est constitué d'adultes en bonne santé soumis à des tests de laboratoire; les conclusions cliniques constituent l'étape suivante. Des tests sont nécessaires chez des patients et dans des environnements multimodaux naturels.
- L'EEG fournit une excellente image temporelle mais spatiale limitée; il est logique de la compléter par un enregistrement MEG/invasif et des modèles de connectivité efficaces.
- La théorie prédit que l'entraînement au timing des signaux audiovisuels devrait améliorer sélectivement le stade moteur sans modifier les accumulateurs sensoriels - il s'agit d'une hypothèse testable dans des tâches appliquées (sports, aviation, rééducation).
Résumé
Le cerveau gère des « compteurs » distincts pour la vision et l'audition, mais décide avec un seul bouton. En comprenant précisément où se produit la transformation des informations sensorielles en actions, nous pouvons ajuster plus précisément les diagnostics, les interfaces et la rééducation – des casques de pilote à la télémédecine et à la neuroéducation de l'attention.
Source: Egan, JM, Gomez-Ramirez, M., Foxe, JJ et al. Des accumulateurs audio et visuels distincts coactivent la préparation motrice à la détection multisensorielle. Nat Hum Behav (2025). https://doi.org/10.1038/s41562-025-02280-9