• Reconnaissance automatique de la parole (et réactionnaire inconditionnel)

     


    La reconnaissance vocale se démocratise

    Il y a quelques années, c'était un outil réservé à quelques professions et aux personnes pour qui l'utilisation d'un clavier était difficile. Mais depuis un an, la reconnaissance vocale a fait son apparition dans de nombreux objets du quotidien : systèmes GPS, téléphones mobiles, applications variées...

    L'une des clefs de ce développement, c'est l'essor des téléphones de nouvelle génération. Depuis sa version 3GS, l'iPhone intègre par exemple des fonctions de contrôle à la voix avancées. […]

    "En dix ans, la technologie a fait des progrès incroyables", juge Françoise Mohymont, ingénieure chez Nuance, l'éditeur du logiciel de reconnaissance Dragon naturally speaking, dont une nouvelle version sort cette semaine. "La technologie a atteint aujourd'hui une maturité suffisante." La, ou plutôt les technologies : la reconnaissance vocale touche à plusieurs champs de recherche. Schématiquement, les logiciels et applications découpent les sons pour y identifier des points de repères qu'ils comparent ensuite à une base de données pour identifier les mots prononcés.

    Dans ce processus, toutes les langues et tous les locuteurs ne sont pas égaux. Certains langages disposent de "points de repère" plus facilement identifiables ; la manière dont la personne articule joue aussi un rôle important. C'est pourquoi les applications de reconnaissance vocale se divisent en deux grandes catégories : les "génériques", comme Google recherche vocale ou la version mobile de Dragon, et les "apprenantes", comme la version PC de Dragon, qui créent un profil de leur utilisateur et apprennent au fur et à mesure à mieux reconnaître la voix et le vocabulaire.

    Les applications plus spécialisées, comme celles des systèmes GPS, utilisent une autre astuce pour augmenter leur précision. Le corpus des adresses n'étant pas infini, le logiciel est programmé en amont pour se concenter sur une liste de mots prédéfinies, ce qui permet d'affiner plus facilement la recherche et de diminuer le taux d'erreurs. Car si la technologie continue d'évoluer, elle reste imparfaite. […]

    Entre les progrès de la technologie et sa banalisation dans les objets de la vie quotidienne, Nuance estime que les conditions sont réunies pour aborder le marché du grand public. […]

    Damien Leloup, Le Monde.fr, 19 septembre 2010. (article entier )

     

     


    L'autre jour, pour le cour de spécialité, nous devions faire une activité documentaire sur la reconnaissance vocale dans l'optique du cours de physique des ondes sonores. L'activité contenait l'article ci-dessus.
    En cherchant des réponses des informations plus précises sur internet, je suis retombée sur cet article.
    Et ses commentaires.

    Reconnaissance automatique de la parole (et réacs inconditionnels)

     

     Mmmhhm. 
    (En dehors de l'aspect beauf et réac proéminent dans ce commentaire, remarquez qu'elle trouve le moyen de se la ramener bien plus que Françoise Mohymont.)

    Étant une nostalgique notoire, malgré moi j'ai parfois des réflexes suspicieux sur les nouveautés ; ce que j'essaie vraiment de corriger.
    Mais là. Du grand n'importe quoi. Du réactionnaire pur et dur, pas un millimètre de distanciation et d'analyse cause à effets.
    Certains ont tout de même pris la peine de le lui faire remarquer :

    Reconnaissance automatique de la parole (et réac inconditionnel)

     

     

     

     

     

     

     

    Le pire, c'est qu'elle renchérie :

    Reconnaissance automatique de la parole (et réac inconditionnel)

     

     

     

     

     

     

     

    Bon, arrêtons le massacre là.

    Quelques explications.


    La reconnaissance automatique de la parole (en vrai, reconnaissance vocale n'existe pas en français) est une technologie extrêmement complexe : après avoir capté le signal sonore, il s'agit d'établir le spectre en fréquence (c'est-à-dire une analyse très précise des ondes sonores), repérer les fréquences différentes qui correspondent à différents phonèmes, trouver les lettres correspondantes, coller vos phonèmes entre eux, comparer vos variations de phonèmes à une base de donnée. Reconstituer l'ensemble.
    Ce qui demande déjà de très bons capteurs, un logiciel puissant, une grosse base de données.
    Et encore, là, il ne s'agit que de reconnaissance vocale. 
    Comme vous le savez, les logiciels utilisent votre phrase, pour transmettre votre ordre, l'écrire, voire lui répondre. C'est-à-dire qu'il doit analyser vos mots pour trouver le sens de votre phrase et savoir quoi y répondre. Ce qui demande en soi une macro base de donnée et un logiciel extrêmement puissant.

    Autant d'un point de vue scientifique qu'informatique, c'est un procédé d'une complexité impressionnante, qui mérite rien que pour ça une considération autre que celle de simple gadget technologique.


    Ce procédé fut justement créé pour les handicapés et plus généralement les personnes rencontrant des difficultés à la lecture,  l'écriture (dyslexie, paralysie, vue, vieillesse, …). Pour eux, c'est effectivement une bénédiction, ce que semble totalement mépriser Mme/Mlle Maginot. (Sympathique)

    Bien sûr que l'utilisation par les particuliers peut être remise en question. Moi-même, je ne suis pas complètement pour, mais de là à dire que tout est merdique, il y a un fossé que certains n'ont manifestement pas hésité à franchir.

    Tout cela est relatif. On peut considérer un autre aspect. Le logiciel, pour fonctionner, nécessite une locution correcte et un énoncé grammaticalement parfait. Autrement dit, il est nécessaire de s'appliquer à l'articulation, la syntaxe et la grammaire, bien plus que dans un dialogue courant. 
    Ce qui est mieux que de taper frénétiquement dans un langage SMS fleuri à peine français qui n'est pas propre qu'aux ados.




    Par ailleurs, il y a quelque chose que je trouve réellement fascinant.
    On a tendance à oublier la nécessité d'une base de données immense. Imaginez que pour faire fonctionner ces logiciels, il a fallut enregistrer la langue française dans son exhaustivité et dans toute sa complexité. 
    Avec son vocabulaire, ses multiples exceptions, sa conjugaison légendaire, toutes ses subtilités de syntaxe et de grammaire.

    Vous rendez-vous compte ? Enregistrer la langue française.


    Alors que Machine se plaint du peu d'importance accordé aux documents du Congrès, alors que certains craignent la disparition du français (trop compliquée, pas rentable) au profit de l'anglais, quelque part sur Terre, des gens se sont acharnés à enregistrer la langue française dans son exhaustivité. 



    Par cette seule raison, le système de reconnaissance vocale ne peut être considéré comme un simple outil.


    "On aurait bien fini par enregistrer la langue, comme tu dis, sans ça". Vous croyez que, sans le bénéfice potentiel, on aurait pris la peine de créer des logiciels aussi performants que Siri, sur iPhone 4S ? Non, je ne crois pas. J'ai été moi-même choqué par le degré de perfectionnisme de ce logiciel.

    Oui, nous sommes dans un monde gouverné par le pouvoir financier. Mais, pour une fois cela sert à la civilisation. Car la langue est la base de toute société. C'est la base de notre culture, de notre histoire.
    C'est indissociable du comportement humain, car une des bases de notre humanité, c'est la dépendance à l'altérité.

     

     


  • Commentaires

    1
    Lundi 13 Janvier 2014 à 15:30

    C'est bien cliché de juger sur de nouvelles technologies. Elles font partie de notre génération. Je ne vois pas pourquoi on doit les détester au profit de la précédente.
    Se donner bonne conscience en faisant de la lèche pour la génération précédente, c'est bien connu ! On retrouve ça tellement partout, et en particulier dans la musique, les personnalités connues, les modes, enfin, la société. Toujours des critiques acerbes.
    C'est tout au plus de la généralisation.
    Parce que trop de personnes sont agglutinées à des normes, on en sort complètement.
    Pas forcément par avis personnel, mais parce qu'on veut se sentir différent et exemplaire. Ainsi, on bannit d'emblée toutes ces choses-là.
    Le geste a à peu près la même valeur que les gens qui haïssent One Direction parce que tout le monde les hue.
    C'est pris in extremis et hâtivement. 

    On voit partout "Cette génération part en couilles", avec des milliers de "j'aime"s, où figure une poignée de jeunes fille à la face trop tartinée ou des gosses avec un iPad et un iPhone, et des gens qui disent qu'à cet âge là, ils avaient des Barbies et des petites voitures. 
    Ces jugements sont tout autant clichés que celui de la Madame qui, Ô Jésus, Marie, Joseph, se croit meilleure parce qu'elle est en retrait par rapport aux modes actuelles.

    Il y a plus de mauvais aujourd'hui, mais il reste une bonne partie du bon. 
    Ce sont de mauvais préceptes que ceux qui disent que ce qui est fait aujourd'hui est une merde intersidérale.

    Je ne trouve pas ça valorisant de se revendiquer non possesseur d'un smartphone, ça instaure justement un côté égocentrique et pessimiste du reste, et toujours aussi généraliste, se basant sur de stupides poncifs sociétaux plutôt que d'aller explorer ce qu'il en est plus en détail et en suivant nos goûts. 

    2
    Mercredi 15 Janvier 2014 à 20:34

    Il faut rester lucide, une grande part des nouvelles technologies commercialisées ne nous servent strictement à rien. Certaines sont même mauvaises pour nous. Mais on est martelés à grands coups de pub et de messages subliminaux que, oh oui, c'est bon pour nous, on a vraiment besoin de l'acheter. La société de consommation marche comme ça. 
    La reconnaissance vocale, soyons honnêtes, pour la majorité des possesseurs de logiciel, ne sert strictement à rien. Mais, d'une part, ce n'est pas non plus mauvais, et d'autre part, c'est réellement utile chez certaines personnes souffrant de troubles divers. Par ailleurs, c'est une avancée considérable dans la science. C'est pour ces raisons qu'on ne peut pas, malgré le mercantilisme abusif évident, placer ça de but en blanc dans la case gadget technologique régressif. 

    C'est crétin d'être pour ou contre, il faut considérer les deux aspects, et essayer de déterminer ce qui est mauvais ou non, et ce qui est vraiment utile. Mais cela nécessite un minimum de prise de distance que la plupart des gens ne cherchent pas, suivant tel ou telle opinion répandue, consommant abusivement, que ce soit les produits-nostalgie-de-nos-anciennes-années ou les jouets high-tech. Comme tu dis, on devrait explorer un peu plus en détail et veiller en premier lieu à suivre nos goûts.

    En revanche, ce n'est pas du tout dans ce sens-là que je parlais de smartphone. C'est par choix personnel que je n'en ai pas, et cela n'a rien à voir avec les modes, l'argent et les nouvelles technologies. C'était pour préciser que je n'écris pas ça en tant que pro-nouvelles techno consommatrice, et ce n'est pas non plus parce qu'on ne possède pas certaines nouvelles technologies qu'on est forcément contre; comme tu dis, il faut suivre nos goûts, mais certaines personnes ne comprennent pas ça, trop habitués à mettre dans des cases… T'inquiète pas, je n'en tire aucune fierté, c'est même plutôt l'inverse.
    ( D'ailleurs je veux virer cette phrase depuis que j'ai posté l'article, j'avais voulu faire un effet de style mais ç'a foiré. Et en plus c'est compris dans le mauvais sens. Hop, viré. )

    Ça ne me choque pas énormément qu'il y ait des réticences aux nouveautés. C'est logique, dans une société où tout va de plus en plus vite, notamment en matière de progrès technique, que les gens essaient de se raccrocher au passé ; car leurs repères sont sans arrêt chamboulés. Mais ce qui est vraiment détestable, c'est de rejeter tout, de cracher sur tout et tout le monde, les riches, les ados, les ingénieurs, juste parce qu'on est frustré du changement. Et c'est vraiment un comportement d'adulte déplorable.

    Suivre le flux RSS des commentaires


    Ajouter un commentaire

    Nom / Pseudo :

    E-mail (facultatif) :

    Site Web (facultatif) :

    Commentaire :