Exalead image : de l’intérêt de l’indexation par le contenu

Tout le monde se souvient de Tom Cruise dans Minority Report, s’agitant comme un
damné devant un mur d’écrans et soumettant son ordinateur (apparemment doué de vie) les questions : « Montre moi les photos de MrX », « Repars en arrière », « Non pas là, à gauche et zoome un peu s’il te plaît» …

Si ce futur technologique ne tient sans doute pas entièrement de l’utopie, on peut
tout de même douter de la capacité des machines actuelles à interpréter aussi
facilement les intentions de son utilisateur.

Que se serait-il par exemple passé si Tom avait subitement demandé (aussi étrange que cela puisse paraître je vous l’accorde) à sa machine de lui montrer quelques images de Jaguar ?

Dans le monde de Minority Report on peut être certain que la machine en question se serait rendu compte de l’ambiguïté et lui aurait demandé d’une voix suave de préciser sa pensée : «La voiture ou l’animal ? »
Mais nous ne sommes pas dans le monde de Minority Report et pour l’instant les
moteurs de recherche (les bons) donneraient à Tom des résultats comme ceux-ci :

jaguar

Rien que de très logique ici : des voitures, des animaux et un avion de chasse (le jaguar est un avion de chasse franco-britannique pour les plus curieux d’entre vous).
Si nous admettons qu’un moteur de recherche ne peut pas deviner l’intention de l’utilisateur (ici le sens qu’il donne au terme « jaguar »), ce dernier se doit d’affiner sa requête en ajoutant certains mots clés discriminants.

Passionné de voiture britannique hors de prix, Tom transformerait ainsi la requête «jaguar» en la requête «jaguar voiture» et obtiendrait finalement les résultats suivants :

jag3

Sur le moteur web une telle méthode de recherche fonctionne systématiquement: il est en effet très vraisemblable qu’une page relative aux voitures de la marque jaguar contienne le terme jaguar tout comme le terme voiture permettant ainsi d’obtenir des résultats corrects pour la requête « jaguar voiture ».

Dans le cas des images, nous venons de voir que cette méthode pouvait aboutir à des résultats probants. Pour autant, reposer uniquement sur le texte s’avère risqué. En effet, le volume de texte associé à une image est nécessairement plus restreint pour éviter les erreurs (une erreur typique consiste à associer à une image contenue dans un tableau d’images le texte de l’image suivante du tableau).

Fort de ce constat, Exalead entreprend de prendre en compte une autre source
d’informations pour améliorer la recherche d’images : à savoir le contenu celles-ci (leurs pixels).
C’est dans cet objectif que le filtre visage a été mis en ligne (avec le succès qu’on lui connait) grâce aux technologies développées par LTU Technologies tout comme le filtre «photo» plus récemment.

Mais l’activité de recherche d’Exalead en image ne s’arrête pas là et Exalead collabore ainsi avec des acteurs académiques de premier plan dans le cadre de plusieurs projets (R2I, GEORAMA, QUAERO), en vue de tester les méthodes d’analyse d’images les plus innovantes qui permettront d’améliorer la pertinence de ses résultats ainsi que l’expérience utilisateur lors de la navigation.

Les commentaires sont fermés.