https://frosthead.com

Maintenant, le test de Turing devient visuel

Les algorithmes de Facebook peuvent distinguer votre visage d'une foule (ou essayer de le faire au moins), mais il ne sait toujours pas si vous posez dans un portrait de famille ou si vous buvez avec des copains; il ne peut pas vous dire comment vous interagissez avec les autres. . À l'avenir, les ordinateurs pourront peut-être faire exactement cela. Les chercheurs ont maintenant proposé un moyen de déterminer le degré de reconnaissance visuelle des ordinateurs intelligents. Ils qualifient leur test de test visuel de Turing, après le test du informaticien Alan Turing visant à déterminer si un ordinateur peut afficher une intelligence semblable à celle d'un humain.

La perception courante du test est qu’il est utilisé pour distinguer les humains des ordinateurs - et une version est utilisée à cet effet, lorsque vous faites un CAPTCHA pour vous inscrire à un nouvel email. Mais les chercheurs en intelligence artificielle pensent vraiment que le test est un moyen de mesurer l’intelligence informatique avancée.

"Il y a eu des progrès impressionnants dans la vision par ordinateur ces dernières années", déclare Stuart Geman, professeur de mathématiques à l'Université Brown et l'un des chercheurs proposant la nouvelle évaluation, dans un communiqué de presse. «Nous avons pensé qu'il serait peut-être temps de relever le niveau de la manière dont ces systèmes sont évalués et comparés.»

Au lieu de simplement reconnaître qu'une image montre deux personnes, le test vérifie si les ordinateurs peuvent déterminer si les deux personnes ont une conversation ou même un argument. Actuellement, les chercheurs utilisent des ensembles de données accessibles au public pour tester leurs programmes - le MIT utilise LableMe, qui utilise le crowdsourcing pour identifier la "voiture", "l'arbre" et le "bâtiment" d'images, par exemple. Pour améliorer cela et proposer un défi plus important, les chercheurs de Brown ont mis au point un cadre pour un test de Turing visuel normalisé.

Lee Gomes pour les rapports IEEE Spectrum :

Leur méthode proposée appelle les concepteurs de tests humains à dresser une liste de certains attributs qu’une image peut avoir, par exemple si une scène de rue a des gens, ou si les gens portent quelque chose ou se parlent. Les photographies seraient d'abord gravées à la main par des humains sur ces critères; un système de vision par ordinateur afficherait alors la même image, sans les «réponses», afin de déterminer s’il était capable de repérer ce que les humains avaient repéré.

Au départ, les questions seraient rudimentaires, demandant s'il y avait une personne dans une région désignée de l'image, par exemple. Mais les questions deviendraient de plus en plus complexes à mesure que les programmes deviendraient plus sophistiqués. une question plus complexe pourrait impliquer la nature d'une interaction entre différentes personnes sur la photo.

L'équipe a décrit le test dans Actes de l'Académie nationale des sciences . À ce jour, l’allemand affirme qu’aucun système informatique ne pourrait réussir les versions les plus simples du nouveau test. Mais ils le seront dans le futur. Étant donné que chaque photo présente de nombreux attributs possibles, les chercheurs devraient proposer à leurs ordinateurs des moyens novateurs pour apprendre à évaluer les photos.

«En tant que chercheurs, nous avons tendance à« enseigner jusqu’à l’expérience », a déclaré Geman. «S'il y a certaines compétitions auxquelles tout le monde participe et que ce sont les mesures du succès, c'est ce sur quoi nous nous concentrons. Il serait donc sage de changer le test, de le mettre hors de portée des systèmes de vision actuels. ”

Maintenant, le test de Turing devient visuel