in

Caption Bot, la légende de Microsoft ?

Caption Bot

Microsoft n’a pas dit son dernier mot avec les intelligences artificielles. Si Tay a fait rire les internautes avec ses tweets conspirationnistes, Caption Bot rattrape le tir…ou du moins essaye. La branche Microsoft Cognitive Service a dévoilé fin mars une nouvelle intelligence artificielle, dont le but est de s’exercer à décrire des photos. Une tâche qui se révèle bien ardue pour le nouveau programme… 

Décrire des photos, ce n’est pas une première pour Microsoft. Bien avant Caption Bot, existait How Old Do I Look, dont le but était de déterminer votre âge à partir d’une seule photo. Êtres en mal de vieillesse, s’abstenir ! Aujourd’hui, il effectue un come-back dans l’analyse d’images grâce un logiciel de vision API (Application Programming Interface) de Machine Learning.

Caption Bot, un logiciel pour les décrire tous

Pour effectuer sa description, CaptionBot identifie plusieurs éléments de l’image, qu’il soumet aux données récoltées par le moteur de recherche Bing. Une fois l’analyse finie, ce sera à Emotion API d’entrer en jeu. Ce logiciel passe au crible les visages et détecte leurs expressions. On sent une nette évolution par rapport à How old I look, qui ne détecte pas toujours les visages. Cependant, Caption Bot se révèle assez simpliste quand il s’agit de détailler une photographie. L’intelligence artificielle sait repérer les éléments principaux mais ne diffuse aucune information quant à l’arrière-plan.

Caption Bot

Ici, seule la table et les chaises (non situées à l’arrière-plan) sont représentées.

Et même en ce qui concerne les protagonistes de l’image, elle fait souvent défaut. Par exemple, Caption Bot reconnait souvent les grandes personnalités…mais pas sur toutes leurs photos :

Caption Bot

 

Ici, l’intelligence artificielle a bien reconnu Angela Merkel de face.

Caption Bot

Tandis qu’ici, elle identifie un portable inexistant et ne reconnait pas la chancelière allemande.

Des fois, il attribue le sexe opposé, comme à Christine Boutin ci-dessous :

Caption Bot

Le manque d’identification laisse également à supposer qu’il ne reconnait que de très grandes personnalités.

Il s’avère que le programme confonde l’être humain avec un objet si ce dernier est assis dessus, par exemple. Ici, nous voyons qu’il reconnait l’homme debout tandis qu’il détecte l’autre personne comme une valise.

Caption Bot

Maintenant, si l’on essaie avec un dessin représentant Sangoku, elle voit en lui une fleur.

Caption Bot

Prenons un autre dessin maintenant. Homer Simpson mange son fameux donut. Elle a bien réussi à identifier une personne mais attribue des gestes inexistants comme le fait de faire du surf…dans un parc de skate.

Caption Bot

On en conclue que ce soit au niveau de la photographie ou du dessin, l’intelligence artificielle de Microsoft peine à identifier les gestes et n’est pas capable encore de décrire une action.

Maintenant, si l’on essaie avec des objets. Prenons la scène où Christian Bale fixe le prozium (pilule annihilant les sentiments) dans le film Equilibrium. Caption Bot identifie bien Christian Bale car c’est un acteur connu. Cependant, elle n’est pas capable de reconnaître la pilule qu’elle nomme de « sandwich ». Peut-être qu’elle lui attribue ce nom d’aliment en raison de la forte proximité entre sa bouche et la pilule.

Caption Bot

Même si Caption Bot s’en tire mieux que ses prédécesseurs, il reste encore du chemin à faire. Heureusement, le programme est fait pour collecter des données et apprendre au fur et à mesure. Même si les premiers résultats peuvent se révéler chaotiques comme ceux de Tay, ces deux bots révolutionnent notre rapport à l’intelligence artificielle en se nourrissant de ce qu’on leur fournit. Cet intérêt pour les bots semble être devenue une véritable passion chez Microsoft et un point de concurrence avec Facebook.

La guerre des bots

Depuis quelques temps maintenant, le bot est devenu le dada de Microsoft. Les bots sont des agents conversationnels ayant pour but d’aider les internautes à réaliser des tâches ou juste faire la conversation avec eux. Avec TwinsOrNot.net, vous pouvez trouver votre jumeau…ou pas. What-Dog.net identifie les races de chien. CelebsLike.me se charge de chercher le nominé aux oscars qui vous ressemble le plus. Et Cortana (Windows 10) vous permet de naviguer sur votre PC en répondant à toutes vos questions.

Ces assistants électroniques font concurrence entre Microsoft et Facebook. Alors que Microsoft exposait son programme Seing Al lors de la conférence BUILD, Facebook vient d’annoncer la mise en place d’une intelligence artificielle aux mêmes fonctions. Dans la continuité de Microsoft, le réseau social lance une application permettant d’aider les personnes âgées ou mal-voyantes avec des descriptions audios des photos partagées sur le réseau. Le réseau va encore plus loin en faisant de Messenger une super plateforme animée par un ensemble de bots. Vous pouvez maintenant avoir une conversation avec le Wall Street Journal, vous aider d’un chat nommé Poncho pour obtenir la météo en temps réel, ou vous faire livrer des fleurs.

De plus en plus, les entreprises comprennent l’intérêt des chatbot et comptent bien s’en servir pour renforcer leur omnicanalité. Alors le test de Turing aurait-il enfin trouvé raison ?

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.