4 questions à… Sébastien

Sebastien Polaroid

Sébastien, Responsable Recherche et Développement du Moteur de Recherche Web chez Exalead, répond à quelques questions, pour que vous en sachiez plus sur ce qu’il se passe derrière l’interface.

1/ La récente mise à jour de l’interface du moteur de recherche Exalead a-t’elle une influence sur le travail de ton équipe ?

En théorie, non, car nous utilisons une API XML pour envoyer les requêtes et recevoir les réponses. Mais en pratique, cela a eu pas mal d’impact sur notre travail puisque la façon de naviguer a été modifiée. Nous avons aussi rajouté des fonctionnalités comme l’auto-suggestion de requêtes qui s’incrémentent au fur et à mesure que l’utilisateur formule sa recherche. De plus, la grande variété des possibilités de navigation impose forcément une richesse de l’API entre l’interface visible et la technologie qu’il y a derrière.

Maintenant, cette mise à jour va aussi nous inciter à développer de nouvelles choses, visibles, qui pourraient accompagner les résultats.
En effet, cette nouvelle interface est beaucoup plus facilement configurable que la précédente ainsi nous pourrons ajouter régulièrement de nouvelles fonctionnalités à droite et à gauche.

2/ Pendant une année, peu de modifications ont été faites sur le moteur Exalead, aussi bien sur l’interface qu’au niveau des fonctionnalités. Que faisait ton équipe ?

Nous avons pas mal travaillé sur la pertinence en remettant à plat beaucoup de choses, essentiellement dans la détection des sites les plus pertinents sur les requêtes à forte concurrence et en éliminant au mieux les spammeurs, tout en gardant les bons signaux faibles. Nous avons aussi migré l’ensemble de la plate-forme du moteur web pour utiliser les mêmes technologies que la nouvelle version du produit Exalead CloudView. Cette migration nous offre de plus d’ores et déjà de belles opportunités car elle nous permet de mettre à disposition d’entreprises tierces des pans entiers de web personnalisé. Par exemple, nous fournissons aujourd’hui sur la base du moteur web Exalead que vous utilisez un service de recherche verticale sur le web britannique pour Yell.com.

3/ Quelles sont vos priorités actuelles concernant l’amélioration du moteur ?

Nous sommes en train de préparer de nouvelles fonctionnalités sur la Recherche Images, vous en saurez plus d’ici quelques semaines..
Et toujours, l’amélioration de la pertinence et de la rentabilité de notre stock de 8 milliards de pages.
En deux ans, on estime avoir amélioré de 75% notre utilisation de ces 8 milliards de pages, en allant plus profond sur les domaines intéressants, avec moins de résultats commerciaux, moins de pages dans des langues exotiques et moins de pages au contenu très similaire les unes des autres.
Nos 8 milliards de pages aujourd’hui correspondent donc à 14 milliards de pages si nous avions gardé les mêmes filtres qu’en 2007.

Nous allons aussi développer nos services auprès des grands portails qui souhaitent bénéficier de notre savoir-faire et de notre infrastructure pour construire des services innovants pour leurs internautes.

4/ D’après toi, quel aspect du moteur est le plus critique ?

Tout 🙂
Plus sérieusement, tous les composants sont très liés entre eux : si l’un d’entre eux n’est pas assez rapide, il va empêcher d’analyser suffisamment de pages et donc potentiellement nous faire rater des « bonnes » pages, ce qui aura une influence négative sur la pertinence. Si un filtre en amont n’est pas assez bon, il va laisser rentrer dans le système des pages malicieuses qui peuvent biaiser les statistiques faites par des modules plus en aval.

On est assez proche du modèle de l’avion : une mauvaise réponse vient en général de la défaillance combinée de plusieurs éléments.

C’est pas toujours facile, quand on nous dit que les résultats d’une requête ne sont pas terribles, d’arriver à comprendre la cause réelle du problème. Il y a beaucoup de données à analyser dans la boîte noire…

Merci Sébastien !

Les commentaires sont fermés.