Nouvelles publications
La voix comme analyse: premiers signes de cancer et de lésions bénignes
Dernière revue: 18.08.2025

Tout le contenu iLive fait l'objet d'un examen médical ou d'une vérification des faits pour assurer autant que possible l'exactitude factuelle.
Nous appliquons des directives strictes en matière d’approvisionnement et ne proposons que des liens vers des sites de médias réputés, des instituts de recherche universitaires et, dans la mesure du possible, des études évaluées par des pairs sur le plan médical. Notez que les nombres entre parenthèses ([1], [2], etc.) sont des liens cliquables vers ces études.
Si vous estimez qu'un contenu quelconque de notre contenu est inexact, obsolète ou discutable, veuillez le sélectionner et appuyer sur Ctrl + Entrée.

Des chercheurs de l'Université des Sciences et de la Santé de l'Oregon ont analysé des enregistrements vocaux issus du nouveau jeu de données Bridge2AI-Voice, accessible au public, et ont découvert une caractéristique acoustique simple permettant de révéler une pathologie des cordes vocales. Il s'agit du rapport harmoniques sur bruit (RNB), soit le rapport entre les « harmoniques musicales » et le bruit. Son niveau et sa variabilité permettaient de distinguer les voix des personnes atteintes d'un cancer du larynx et de lésions bénignes de celles des personnes saines et de certains autres troubles de la voix. Cet effet était particulièrement marqué chez les hommes cisgenres; la significativité statistique était insuffisante pour les femmes; les auteurs incriminent la petite taille de l'échantillon et appellent à un élargissement des données. Ces travaux ont été publiés sous forme de bref rapport dans Frontiers in Digital Health.
Contexte de l'étude
- Pourquoi rechercher des « marqueurs vocaux »? L'enrouement est une affection fréquente. Ses causes sont variées: rhumes, reflux, nodules/polypes et cancer du larynx. Actuellement, le diagnostic repose sur une consultation chez un ORL et une endoscopie (caméra nasale/pharyngée). Ce test est précis, mais il n'est pas toujours disponible rapidement et ne convient pas à l'autosurveillance à domicile. Un dépistage préalable est nécessaire: un moyen simple de savoir qui doit consulter un médecin en priorité.
- Qu'est-ce qu'un biomarqueur vocal? La parole est un signal facilement enregistrable sur un téléphone. Son « motif » permet d'évaluer la vibration des cordes vocales. Les lésions rendent les vibrations irrégulières: plus de « bruit » et moins de « musique ».
- Pourquoi les nouveaux ensembles de données sont importants. Auparavant, ces travaux reposaient sur de petits échantillons « maison »; les modèles étaient fragiles. Bridge2AI-Voice est un vaste ensemble multicentrique d'enregistrements audio liés à des diagnostics, collecté de manière éthique. Il a été créé comme un « terrain d'essai commun » pour enfin former et tester des algorithmes sur des données volumineuses et hétérogènes.
- Où sont les principales difficultés?
- La voix change en fonction du microphone, du bruit ambiant, du froid, du tabagisme, de la langue, du sexe et de l'âge.
- Il y a traditionnellement moins de données féminines et la voix féminine est plus fréquente - les mesures se comportent différemment.
- Aucun test « à domicile » ne peut remplacer un examen ou établir un diagnostic - tout au plus, il aide à décider: « est-il nécessaire de consulter d'urgence un ORL? »
- Pourquoi la clinique et les patients en ont-ils besoin? Si les personnes présentant un risque élevé de ganglions/tumeurs peuvent être sélectionnées pour un rendez-vous prioritaire lors d'une courte consultation, cela accélérera le diagnostic, réduira les orientations inutiles et fournira un outil d'autosurveillance entre les visites (après l'opération, pendant le traitement).
- Où cela devrait mener: À des applications/modules de télémédecine validés qui:
- rédiger un discours selon la norme (phrase + « aaa » prolongé),
- calculer les caractéristiques de base (HNR, gigue, scintillement, F0),
- émettre une recommandation de contacter un spécialiste si le profil est alarmant,
- maintenir la dynamique après le traitement.
L’idée est simple: « mettre le téléphone à l’oreille d’un ORL » – non pas pour établir un diagnostic, mais pour ne pas manquer ceux qui ont besoin d’une aide rapide en face à face.
Qu'ont-ils fait exactement?
- Nous avons pris la première version de l'ensemble de données multicentrique Bridge2AI-Voice collecté de manière éthique, un projet phare du NIH où les enregistrements vocaux sont liés aux informations cliniques (diagnostics, questionnaires, etc.).
- Deux échantillons analytiques ont été constitués:
- « cancer du larynx / ganglions bénins / sains »;
- « cancer ou nodules bénins » versus dysphonie spasmodique et paralysie des cordes vocales (autres causes fréquentes d'enrouement).
- Les caractéristiques vocales de base ont été identifiées à partir de phrases standardisées: ton fondamental (F0), gigue, scintillement et bruit de fond (HNR), et les groupes ont été comparés à l'aide de statistiques non paramétriques. Résultat: les différences les plus stables concernaient le bruit de fond (HNR) et le F0, le bruit de fond (HNR) et sa variabilité permettant de mieux distinguer les lésions bénignes de la normale et du cancer du larynx. Ces signaux étaient plus distincts chez les hommes.
Pourquoi est-ce important?
- Dépistage précoce sans sonde. Actuellement, le diagnostic repose souvent sur une nasoendoscopie et, en cas de suspicion, une biopsie. Si de simples fonctionnalités acoustiques combinées à l'IA permettent de prioriser les patients nécessitant une endoscopie, les patients consulteront un ORL plus rapidement et les consultations inutiles seront réduites. Il s'agit d'un complément, et non d'un remplacement, du médecin.
- Big data pour la voix. Bridge2AI-Voice est un projet rare où la voix est collectée selon des protocoles uniformes et liée aux diagnostics; les données sont accessibles aux chercheurs via PhysioNet / Health Data Nexus. Cela accélère le développement de biomarqueurs vocaux fiables plutôt que d'« applications miracles » sur de petits échantillons.
Qu'est-ce que HNR?
Lorsque nous parlons, les cordes vocales vibrent et créent des harmoniques. Mais cette vibration n'est jamais parfaite: le signal est toujours saturé de bruit. Le HNR correspond simplement à la part de « musique » dans la voix qui dépasse le « sifflement ». Lorsque les cordes vocales sont endommagées, la vibration devient moins uniforme: le bruit augmente, le HNR diminue et ses sauts (variabilité) augmentent. C'est ce schéma que les auteurs ont identifié.
Avis de non-responsabilité importants
- Il s'agit d'une analyse pilote exploratoire: sans validation clinique, avec des restrictions sur l'échantillon de femmes; leurs effets n'étaient donc pas significatifs. Des données plus vastes et plus diversifiées, ainsi qu'une « analyse » des modèles dans différentes cliniques et dans différentes langues, sont nécessaires.
- La voix est un élément « multi-valué »: elle est affectée par un rhume, le tabac, un reflux, un microphone, le bruit ambiant. Tout « test à domicile » devrait pouvoir prendre en compte le contexte, tout en servant de filtre pour une orientation vers un ORL, et non de diagnostic instantané.
Quelle est la prochaine étape?
- Élargir l’ensemble de données (y compris pour les femmes et les âges), standardiser les tâches et l’acoustique (lecture d’une phrase, « aaa » prolongé, etc.), essayer des modèles multimodaux (voix + questionnaire symptômes/facteurs de risque).
- Reliez les signes acoustiques aux résultats des examens (endoscopie, stroboscopie) et à la dynamique après le traitement - afin que le profil HNR puisse également être utilisé pour la surveillance.
- Poursuivre la « science ouverte »: Bridge2AI-Voice publie déjà des versions de l'ensemble de données et des outils - c'est une chance d'atteindre rapidement de véritables pilotes dans les cliniques.
Conclusion
Il est possible d'« entendre » les troubles des cordes vocales à partir de la voix, et peut-être d'orienter la personne vers le bon spécialiste plus rapidement. Pour l'instant, il s'agit d'un indice intéressant (le HNR et sa variabilité), mais grâce au big data ouvert, les biomarqueurs vocaux ont enfin une chance de devenir un outil de dépistage fiable.
Source: Jenkins P. et al. La voix comme biomarqueur: analyse exploratoire des lésions bénignes et malignes des cordes vocales. Frontiers in Digital Health, 2025 (accepté pour publication). Données — Bridge2AI-Voice (NIH/PhysioNet).