La Lettre 45 - page 12

La lettre
n°45
ossier
Parallèlement, la reconnaissance du locuteur est influen-
cée par la connaissance de la langue parlée : les auditeurs
sont typiquement moins performants dans l’identification
vocale quand la langue parlée est inconnue – un effet appelé
« effet de familiarité avec le langage » (LanguageFamilia-
rityEffect, LFE)
(8)
. De la même façon, les personnes dys-
lexiques, dont la représentation phonologique est perturbée,
montrent également des troubles de la reconnaissance de
l’identité vocale
(9)
. Les bases cérébrales du LFE, et plus
généralement des interactions entre traitement de la parole
et de l’identité, restent, à ce jour, largement inexplorées.
Les mécanismes cérébraux de la reconnaissance du locu-
teur sont, eux, de mieux en mieux compris. L’imagerie céré-
brale implique en particulier de manière systématique des
régions du lobe temporal antérieur et le lobe frontal inférieur
de l’hémisphère droit. Une étude d’imagerie par résonance
magnétique fonctionnelle (IRMf) vient d’apporter un com-
plément important d’information sur le code utilisé par le
cerveau pour représenter l’identité vocale
(10)
. Cette étude
démontre un codage cérébral de l’identité par référence à
un prototype interne (« norm-basedcoding »). Une « voix
moyenne » a été construite en fusionnant par « morphing »
32 voix différentes prononçant la même syllabe. Puis pour
chaque voix, sa « distance à la moyenne » a été calculée
dans un espace acoustique tridimensionnel (Figure 2) dans
lequel chaque voix est représentée par un point, plus ou
moins éloigné de la voix moyenne.
qu’un rapide coup d’œil peut à l’occasion vous aider à affiner
parfois de manière surprenante.
Une aptitude de « cognition vocale » jouant un rôle particu-
lièrement important dans les interactions sociales est celle
de la reconnaissance du locuteur. Bien qu’un locuteur ne
prononce jamais exactement deux fois le même son, les
auditeurs sont capables d’extraire des caractéristiques inva-
riantes dans le signal vocal et s’en servent pour construire
des représentations « invariantes » de l’identité du locuteur
qui peuvent être utilisées pour reconnaître la personne à
partir d’une nouvelle phrase. Cette faculté est présente très
tôt chez le nouveau-né et nous la partageons avec nombre
d’autres espèces animales.
-Les mécanismes cérébraux sous-tendant la perception de la
parole et la perception de l’identité vocale sont dissociables,
ainsi que le démontre la double dissociation entre d’une
part les patients aphasiques chez qui la perception de la
parole est perturbée mais la reconnaissance de l’identité
intacte ; et d’autre part les patients « phonagnosiques »
qui, à la suite d’une lésion cérébrale, ont un déficit marqué
de reconnaissance des personnes par leur voix alors que
leur compréhension demeure normale
(5,6)
.De même, les
études d’imagerie cérébrale fonctionnelle impliquent des
réseaux cérébraux en partie différents pour des tâches de
perception de la parole versus de l’identité du locuteur
(7)
.
Néanmoins, perception de la parole et du locuteur intera-
gissent aussi à un degré considérable. La reconnaissance
de la parole est influencée par la familiarité avec le locuteur:
les auditeurs comprennent mieux les locuteurs familiers.
Figure 2
- Codage de l’identité vocale par référence à un prototype. A. Chaque voix (cercles rouge = voix de femme ; cercles
bleus : voix d’homme) est représentée par un point dans un espace acoustique à trois dimensions reflétant la variation dans
la population de mesures acoustiques de :(i) la fréquence fondamentale (f0)liée à la hauteur de la voix; (ii) la dispersion
formantique (FD: différence de fréquence moyenne entre formants, c’est-à-dire les zones de fréquence amplifiées par le conduit
vocal); (iii) le rapport harmonique sur bruit (HNR) qui quantifie la présence d’irrégularités spectro-temporales. Pour chaque
voix, sa « distance à la moyenne » peut être mesurée par sa distance Euclidienne à la voix moyenne (triangles, au sommet
de l’espace des voix). B. La carte de couleur représente pour chaque voxel contenu dans les aires de la voix, le coefficient
de corrélation (Spearman, échelle de couleur) entre le signal IRMf dans ce voxel en réponse à chaque voix et la distance à
la moyenne de cette voix: les aires de la voix répondent plus fortement aux voix plus différentes du prototype, le « norm-
basedcoding ».
1...,2,3,4,5,6,7,8,9,10,11 13,14,15,16,17,18,19,20,21,22,...38
Powered by FlippingBook