Ingénieurs israéliens chez Google: c'est pourquoi Google Assistant ne connaît pas encore l'hébreu

37
Ingénieurs israéliens chez Google: c'est pourquoi Google Assistant ne connaît pas encore l'hébreu


Attendez-vous également que Google Voice Assistant commence à parler et à comprendre l'hébreu? Les ingénieurs israéliens de Google, qui sont en charge du développement, nous expliquent pourquoi cela ne se produit pas encore

Photo de John Tekeridis provenant de Pexels

Lors de l'événement Google Announcement au salon CES 2020 de Las Vegas, la société a présenté plusieurs innovations dans son assistant vocal populaire et à succès. L'une des innovations les plus notables a été la possibilité de lire les nouvelles pages Web de l'assistant. Derrière ce développement impressionnant se trouve une équipe d'ingénieurs du Google Development Center de Tel Aviv, dont certains ont même été invités à participer à l'événement après un développement mouvementé de deux ans. Nous avons rencontré Shlomi Ben Shimon, ingénieur logiciel Google, et David Kadosh, chef de produit Google, pour comprendre comment Pitcher a été développé et aussi pour répondre à la question: pourquoi n'y a-t-il pas encore d'assistant en hébreu?

Le nouveau défi des fonctionnalités: ignorer les distracteurs


La nouvelle fonctionnalité de l'Assistant permet essentiellement aux utilisateurs de parcourir des sites Web avec du texte et de simplement demander à l'assistant de les lire. Apparemment, la synthèse vocale n'est pas trop complexe. Mais ce n'est pas le cas. Ben Shimon nous explique que l'un des défis les plus difficiles était de construire un mécanisme intelligent qui pourrait ignorer les éléments textuels problématiques sur les pages Web telles que les descriptions d'images, les menus, les dates de publication des articles, les publicités et autres textes qui vous auraient dérouté et vous auraient fait cesser d'utiliser la fonctionnalité.

Dans une démonstration pour nous lors d'un événement Google, Feature a travaillé de manière impressionnante et a lu le texte en continu dans la voix synthétisée mais familière et confortable de l'assistant, ignorant complètement les éléments distrayants dans le corps de l'article tels que les publicités, les boutons et divers éléments de navigation de page. Cependant, même si Google a annoncé que Fitzcher prend en charge la lecture dans 42 langues, malheureusement – encore cette fois – l'hébreu n'est pas sur la liste de Google, même si le développement de Fitzcher était au centre israélien.



Désormais, les geek sont aussi sur télégramme


Désormais, les geek sont aussi sur télégramme
Pour rejoindre notre chaîne de télégramme, cliquez ici

Bien qu'elle ne prenne pas officiellement en charge l'hébreu, la nouvelle fonction de lecture vous permet d'entrer des pages dans des langues étrangères et de lire le texte en anglais après la traduction. Nous avons essayé Feature avec un article GeekTic et il a juste réussi à traduire l'article de manière impressionnante en un instant, plutôt que le mépris que nous appelons "Google Translate", qui n'est pas une traduction automatique intelligente. Malgré la démonstration réussie, ce n'est pas un succès à 100%, et certains contextes et significations ont été perdus lors de la traduction.

Qui pensait que la notation deviendrait un tel problème?

Shlomi Ben Shimon, ingénieur logiciel (à gauche), et David Kadosh, chef de produit (à droite). Photo: Gictim

Parler à Ben Shimon et à un saint indique que le manque de soutien de Pitcher pour la lecture en hébreu est en fait la même raison pour laquelle l'assistant de Google ne prend pas encore en charge l'hébreu: "Comprendre quelqu'un qui parle l'hébreu n'est pas un problème. Prendre le son d'une personne qui parle et le déchiffrer en mots – c'est possible – en hébreu et dans d'autres langues », expliquent les deux. Selon eux, il existe des fonctionnalités qui ne fonctionnent pas aussi mal que la recherche vocale dans Ways, par exemple, mais le problème commence lorsque vous devez répondre à un utilisateur avec une voix synthétisée en hébreu.

Kadosh explique comment l'hébreu défie l'équipe de Google de manière significative, en particulier à la lumière du langage "économique" des lettres: "Une fois qu'il n'y a pas de notation, il est difficile de savoir lire correctement les mots. Le contenu en hébreu n'est pas pointillé. Lorsque les humains lisent sans marquer, ils décodent le mot correct avec le contexte du texte. Ils savent distinguer le mot «train» (véhicule de transport, AB) et «train» (c'est-à-dire train dans le passé. AB). Cet ordinateur est beaucoup plus compliqué. "

Kadosh et Ben Shimon expliquent que la qualité du mécanisme de lecture de texte n'est tout simplement pas assez bonne pour le moment pour Google pour le démontrer. Mais cela révèle comment l'entreprise aborde ce problème: «Nous avons du personnel de recherche qui travaille sur ce problème et utilise le Machine Learning pour créer des algorithmes appropriés. Certains mots sont parfois liés à d'autres mots et à des contextes différents. Les règles de la langue sont insuffisantes, et les autres mots doivent également être compris, qui ne sont pas non plus ponctués. Il s'agit d'un problème très compliqué qui rend impossible l'écriture de règles simples. "

Kadosh, qui définit le sujet hébreu comme un "défi personnel", explique que les mêmes algorithmes ont besoin d'articles en pointillés sur Internet, et comme il n'y en a pas beaucoup, ils nécessitent beaucoup de main-d'œuvre hautement spécifique pour produire des données de qualité. Même après que l'assistant peut parler parfaitement l'hébreu, l'équipe devra attendre quelques défis supplémentaires pour déchiffrer les commandes et diverses instructions qui permettront à l'assistant de se lancer en hébreu. "Je crois que cela se produira", conclut Kadosh de manière semi-optimiste.

Et Apple? Depuis plusieurs années, elle a un assistant vocal qui parle hébreu

«La dernière fois que j'ai testé Siri en anglais, elle n'a pas atteint les capacités de l'assistante. Les tests le prouvent également. Ils ont décidé que pour Siri ce qu'ils avaient fait assez bien et c'était leur continent. Chacun fait son propre truc. "

Pensez-vous que le marché israélien et le locuteur hébreu sont suffisamment importants pour Google?

"La politique de Google est de lancer dans autant de langues que possible. Mais il a un parti pris. L'hébreu a deux problèmes: c'est à la fois une langue difficile et ce n'est pas le plus grand marché. Ensemble, dans le domaine de l'assistant, des ressources lui sont allouées, mais il se peut que d'autres marchés nous contournent. C'est la vie. "

Ben Shimon explique que d'autres défis auxquels l'équipe est confrontée, pas nécessairement liés à l'hébreu, résident principalement dans la vitesse de réponse du mécanisme à partir du moment où l'utilisateur demande à lire le contenu jusqu'à ce qu'il soit fait: «Nous avons un pipeline qui commence à partir du moment où l'utilisateur donne la commande. Il existe des modèles ML qui optimisent l'extraction et l'amélioration des informations des pages, ainsi que des mécanismes de mise en cache intelligents et une diffusion rapide de l'audio vers l'utilisateur tout en l'optimisant. "

Les deux disent que Pitcher est en développement depuis longtemps, et l'équipe dirigée par Yossi Matias, VP R&D Israël, a estimé qu'il devait maintenant être rendu public. La combinaison des avancées dans le développement de produits CES et de l'approche du temps a permis à l'équipe et à Google de démontrer la fonctionnalité. «Notre équipe utilise Fitcher régulièrement. Nous nous sommes sentis suffisamment en sécurité pour venir ici et le démontrer. C'est toujours un aperçu et nous avons encore du travail à faire, mais la fonctionnalité atteindra les utilisateurs plus tard. "

Nous avons donc compris le problème, mais quand pouvons-nous réellement voir un support complet en hébreu? Malheureusement, les ingénieurs se sont remplis la bouche d'eau et nous n'avons pas pu obtenir de réponse de leur part. Malheureusement, au moins maintenant, cela ne semble pas se produire dans un avenir proche.



Une bonne vieillesse

Né avec un joystick à la main. Il a beaucoup trop de gadgets et beaucoup trop de temps libre pour jouer avec tout le monde. Possède un marteau inexpliqué pour effectuer les étalonnages de la batterie de l'appareil. Quand il n'est pas occupé à écrire sur la technologie, il aime en parler, et beaucoup