Un moteur qui me comprend !

Derrière chacune de nos requêtes quotidiennes se cache une question.
Si on classe les requêtes par fréquence d’apparition dans les logs Exalead, il suffit d’un coup d’œil pour voir que les requêtes les plus fréquentes sont celles de type “favoris”.

Lorsque je tape “marmiton” (ouille …), je veux dire “Donne-moi l’url du site marmiton”. Sur les sites connus, c’est tellement plus simple de passer par un moteur que de fouiller les favoris de son navigateur ou les tréfonds de sa mémoire à long terme !

Lorsque je tape un ou deux mots génériques, comme “cuisine” ou “randonnée vercors”, je recherche les sites de référence d’un domaine.

Les algorithmes d’analyse de graphes permettent à nos moteurs préférés de nous apporter des réponses satisfaisantes à ces types de requêtes.

La “long tail” des requêtes utilisateurs cache des questions plus complexes, formulées sous forme de mots-clef ou en langage naturel.

– hauteur eglise madeleine : “Quelle est la hauteur de l’Eglise de la Madeleine ?” (30 mètres)

– définition TCP : “Que signifie TCP ?” (Transmission Control Protocol)

– inventeur barometre : “Qui fut l’inventeur du baromètre?” (Evangelista Torricelli)

Quoi de mieux qu’un système rapportant directement l’information, nous évitant ainsi de devoir aller chercher dans le détail des documents ?! Ces questions s’appellent des questions factuelles.

Dans un texte, on peut trouver la réponse à ces questions sous différentes formes.

Exemples :

* Torricelli, inventeur du baromètre (immédiat !)

* Aussitôt après l’invention du baromètre par Torricelli, (…) (phénomène : dérivation)

* L’italien Torricelli,mathématicien et physicien, découvrit le principe du baromètre. (phénomène : synonymie)

* Le nom de Torricelli est resté associé dans l’histoire au premier baromètre à mercure (phénomène: résolution de la formule « le premier N »)

* Le baromètre a été inventé par Torricelli. (phénomène : dérivation et prise en compte de la forme passive)

* Le mathématicien et physicien italien Evangelista Torricelli était aussi un disciple de Galilée. A la suite de diverses expériences sur la pression atmosphérique, il invente le premier baromètre à mercure. (phénomène : Résolution du pronom « il » avec « Evangelista Torricelli »)

* Zy va c’est pas PasKAL Ka FE le Bar au metre, C Torricelli ! (phénomène : glissement de la langue)



Pas toujours facile de formuler la bonne requête pour trouver LA réponse, mais il est possible au moteur d’avoir une démarche systématique afin de faire avancer le schmilblick.

· Comprendre la requête en identifiant les éléments signifiants (dans l’exemple précédent inventeur et baromètre)

· Identifier le type de réponse attendu (on cherche un nom de personne)

· Reformuler la requête (en tenant compte de la synonymie, des dérivations linguistiques …)

· Faire une analyse textuelle des passages retournés par le moteur

· Identifier les réponses possibles (des noms de personnes en l’occurrence)

· Proposer une réponse (juste !) et mettre en avant les éléments qui la justifient.

C’est un des sujets sur lesquels planchent la R&D d’Exalead, avec nos partenaires toulousains de Synapse Développement pour le Français et l’Anglais dans le cadre de Quaero, et nos partenaires portugais de Priberam pour l’Espagnol et le Portugais. Et un proto devrait prendre corps avant l’été … à suivre.

Et puis, il y a des questions plus difficiles à formuler : “L’écran de mon PC est tout bleu. Comment y remédier ? ». Là, il est peut-être un peu ambitieux de prétendre apporter une réponse toute faite :o) … Mais pointer vers des pages qui font référence à un problème peut s’avérer d’une grande utilité.

Et puis, il y a des convergences possibles avec la reconnaissance vocale, la localisation géographique. Posez la question à votre IPhone …

Et puis, … bref, tant qu’on se posera des questions, on ne risque pas de s’ennuyer !

Les commentaires sont fermés.