Kidnapping, menaces de mort, appels malveillants, fausse alerte à la bombe ou revendication d'attentats terroristes, un nombre croissant de cas délictuels ou criminels impliquent l'étude des documents sonores. Les investigateurs comptent de plus en plus sur les experts pour en identifier l'auteur. Mais une voix est-elle unique ? Peut-on identifier formellement un locuteur ? Qu'est ce qu'une voix ? La voix est définie par le dictionnaire Larousse comme "l'ensemble des sons produits par les vibrations périodiques des cordes vocales". Nos cordes vocales sont notre principal instrument, mais pour émettre et moduler un son, nous utilisons de nombreux organes. D'abord, pour créer un son, nous faisons travailler nos abdominaux : le niveau sonore varie en fonction de la quantité d'air expiré des poumons et selon la pression que nous mettons. Ensuite, le voile du palais, la langue et les lèvres nous permettent d'articuler les sons. Enfin, le nez, la bouche et le pharynx servent de caisse de résonance, ils sont utilisés pour moduler le son. Les sons produits sont de nature vibratoire et sont caractérisés par leur fréquence (aiguë, grave, médium). Les vibrations produites sont transmises dans le milieu ambiant et se propagent dans l'air par des variations de pression. Ces sons sont ensuite reçus par un récepteur comme un microphone ou nos oreilles. Nos oreilles sont sensibles aux vibrations de fréquences comprises entre 16 Hz et 20 000 Hz (Hz = HERTZ, unité de mesure de la fréquence, sachant que 1 Hz = 1 oscillation par seconde). Notre système auditif se charge ensuite de transformer ces vibrations de l'air en une information décodable par le cerveau en tant que son. Un enregistrement vocal contiendra deux types d'informations principales à analyser : des informations auditives relatives au contenu et à la phonétique du message et des informations acoustiques propres au signal vocal. Une voix est-elle unique ? Pour cette raison, le terme "d'empreinte vocale" n'est pas adapté. De plus, l'enregistrement d'une voix n'est pas un prélèvement direct sur le corps humain comme une empreinte digitale ou génétique. Or, en criminalistique on parle d'empreinte pour un prélèvement direct sur un individu ou un objet et de trace pour un prélèvement indirect sur les lieux d'infraction. L'enregistrement de la voix d'un individu est la capture indirecte de la parole créée par des mouvements articulatoires complexes. La voix d'un individu est toutefois considérée comme unique. L'identification d'une voix n'en reste pas moins difficile et dépendante de la qualité des enregistrements. Les variations des voix, intra et inter-variabilité Une des difficultés de l'identification vocale réside dans les variabilités qui existent à la fois dans la voix d'un même locuteur, mais aussi dans les voix des différents individus. Les variations propres à chaque individu : Bien que les orateurs ne peuvent pas produire tous les sons et sont limités par leurs capacités propres, ils peuvent moduler leur voix en fonction de leur interlocuteur, de la situation dans laquelle ils communiquent ou encore du niveau de bruit de fond sonore. Avec cette flexibilité, les orateurs savent aussi changer leur voix pour exprimer différentes émotions ou même pour déguiser leur voix. La voix change aussi avec l'état de santé ou la fatigue de l'orateur. Ces sources de variations dépendent uniquement de facteurs propres aux capacités de l'orateur, on parle "d'intra-variabilité". Il manque encore des données sur cette intra-variabilité car très peu d'études à grande échelle ont été réalisées. Ces types d'études sont indispensables pour interpréter les résultats. Par exemple, lors d'une comparaison vocale, si l'expert se trouve confronté à des différences entre deux échantillons de voix, il doit pouvoir dire si ces différences sont dues à une modification de la voix d'un même locuteur ou alors s'il s'agit de deux locuteurs différents. Des études statistiques sur une grande population doivent permettre : - d'évaluer la probabilité des "intra-variations" en fonction de facteurs agissant souvent dans des cas criminels (stress, voix déguisée, émotions) - d'évaluer de manière adéquate l'étendue des variables phonétiques qui pourraient contribuer à l'identification d'un individu parmi une population d'orateurs. Les variations entre différents individus : Les variations de voix sont donc possibles pour un seul individu. Mais les variations de voix sont d'autant plus importantes entre différents individus. En effet, la voix de chaque être humain est influencée par son physique, son apprentissage de la parole, son caractère, sa langue maternelle, sa région, son niveau social et culturel ou encore ses expériences de vie. Tous ces facteurs donnent des spécificités propres aux voix des différents individus. Ces sources de variations dépendent de facteurs propres à chaque individu, on parle alors "d'inter-variabilité". Il est indispensable d'avoir accès à une base de données composée par de nombreux locuteurs. Cela permet d'évaluer la fréquence de certaines caractéristiques vocales dans une population et de déterminer la probabilité que quelqu'un choisi au hasard, ait pu être à l'origine de l'élément vocal suspect. Pour répondre à ces besoins, entre 2005 et 2009, l'université de Cambridge a réalisé une base de donnée comprenant les voix de 100 orateurs, enregistrés sous diverses conditions, au cours du programme nommé Dynamic Variability in Speech. |



