– Histoire des métamoteurs en ligne

1. Qu’est ce qu’un métamoteur ?

Les métamoteurs en ligne sont des outils de recherche d’information sur le web capable d’interroger simultanément plusieurs moteurs et annuaires à partir d’une requête. Après interrogation, ils fournissent aux utilisateurs une présentation structurée des résultats et organisent les réponses selon des méthodes de classement spécifiques.

Ce type d’interface de recherche s’est développée dans la décennie des années 2000 avec la multiplication des moteurs de recherche concurrents (Altavista, etc…). Les métamoteurs ont aujourd’hui évolué sous l’effet de plusieurs phénomènes : l’abandon de moteurs de recherche concurrents de Google et surtout l’illégalité de leur fonctionnement. Dans l’affaire C‑202/12 (ECLI:EU:C:2013:850), la CJUE a jugé que le métamoteur se rapproche de la fabrication d’un produit concurrent parasite. Les outils comme Metacrawler, qui était le plus important méta-moteur de recherche, ne sont maintenant plus qu’un service sur un portail spécifique.

Aussi la liste des métamoteurs proposée par Wikipedia est-elle trompeuse : les métamoteurs commerciaux sont devenus des interfaces de recherche qui utilisent plusieurs sources concurrentes ou complémentaires (Bing, Google, Yahoo, Wikipedia). De nombreux portails de recherche fonctionnent comme des métamoteurs sans forcement le dire, comme le montre cet entretien avec le fondateur de Qwant, qui dénonce le fonctionnement de DuckDuckGo, son principal concurrent sur le creneau de la protection de la vie privée : dans ses pages d’aide, DuckDuckGo explique se servir de plus de 400 sources pour produire ses résultats tout en utilisant concurremment son propre robot d’indexation (DuckDuckBot).

Ainsi, depuis l’arret de la CJUE, les métamoteurs ne permettent plus de comparer les résultats des différents moteurs dans leurs résultats de recherche, tels que le faisaient les métamoteurs à clustérisation ou cartographiques.

Pour conserver la mémoire de ces outils qui furent innovants, vous trouverez ci-dessous un descriptif de métamoteurs en ligne remarquables en les distinguant suivant leurs critères de présentation et d’exploitation des résultats :

  • présentation par clustérisation (regroupement des résultats selon des catégories)
  • présentation cartographique (réseaux, cartes)

2. Les métamoteurs à clustérisation

Trois métamoteurs se distinguaient par leur fonctionnalité :

Yippy : Vivisimo,  racheté par IBM, a le premier mis en œuvre le classement automatique des résultats dans des clusters créés sur la similarité et la proximité des mots-clés. Une requête sur son interface Yippy permettait d’obtenir un ensemble de dossiers, représentant les catégories issues du résultat de la requête initiale : son point fort résidait alors dans les possibilités d’affiner la recherche en précisant au fur et à mesure les thèmes demandés. Les préférences autorisaient le réglage de nombreux paramètres dont le nombre de cluster à créer, la personnalisation des onglets…

Surfwax : le développement de ce métamoteur a té arrêté en 2015. Il fonctionne encore mais de manière détournée : seul subsiste la recherche dans des fils RSS de journaux… L’originalité de Surfwax résidait dans son interface : lors d’une requête, la liste des résultats apparaîssait dans la fenêtre de gauche. Un click sur la loupe affichait un « instantané de la page », le « SiteSnaps » dans la fenêtre de droite : Une fonction d’analyse de contenu permet tait de voir un résumé de la page, le contexte de la requête, les points clés (phrases les plus pertinentes par rapport à la requête), les focus word (mots les plus importants de la page) et les frame links (principaux liens présents).

Allplus : né en 2007, il était basé sur l’interface classique de Polymeta, l’un des 1er moteur de recherche a avoir affiché les résulats par clustérisation. Un onglet dénomé Cluster Graph, permettait de visualiser le résultat de la clustérisation sous la forme d’un graphique constitué de liens hypertextes. En mode graphique :

  • la shématisation n’introduisait pas de hiérarchie mais une distinction entre clusters principaux et secondaires (le poids des clusters est indiqué)
  • L’interface sous Java permettait de naviguer en 3D avec effet loupe sur le cluster choisi
  • un cluster renvoyait aux sites où le terme était cité en complément du terme recherché. 
  • Un clic sur un cluster relançait la recherche dans Allplus avec le terme contenu.

Apparus à l’aube des années 2000, les métamoteurs cartographiques développaient une approche intuitive et ludique de la recherche d’information. Leur interface présentait les résultats de la recherche sous forme de cartes.

3. Les métamoteurs cartographiques

Kartoo : il fut est l’alpha et l’omega du genre : les résultats étaient représentés par des sphères qui symbolisaient les sites trouvés par le métamoteur et dont la taille variaient en fonction de leur pertinence par rapport aux mots clés de la requête.

  • Si vous survoliez les résultats, les mots clés apparaissaient avec à gauche de l’écran une description du site : cet écran donnaient la possibilité d’obtenir le plan du site et de le surveiller !
  • Les sites étaient reliés entre eux par des liens sémantiques. On pouvait affiner la recherche en cliquant sur les liens ou sur une série de mots clés. Une navigation par onglet permettait de visualiser des résultats spécifiques.
  • Détails appréciables : des icônes en bas de l’écran de recherche relançaient une recherche par pays : un clic sur le drapeau italien renvoyait aux sites italiens ( qu’ils soient en .it, .org, .com…). Il était aussi possible de personnaliser l’affichage des résultats et de l’enregistrer momentanément pour consultation ultérieure.

Mapstan : la mémorisation des résultats était un point fort de ce métamoteur : l’interface graphique permettait de visualiser les réseaux de liens se rapportant aux sites visités par l’internaute ou enregistrés dans les favoris du navigateur; Mapstan suggèrait alors de visiter des sites aux thématiques proches…

4. Quid des métamoteurs libres ?

Malgré la disparition l’année denrnière de Framabee, l’outil de recherche en ligne de Framasoft, il est toujours possible d’utiliser un des métamoteurs libres fondés sur une instance de Searx,  : ce logiciel permet de rechercher et de compiler les demandes effectuées auprès de nombreux moteurs de recherche tels que Google, Bing tout en protégeant la vie privée des internautes.

  • Searx offre la possibilité de connaitre ses statistiques de recherche;
  • il permet d’extraire les données au format RSS JSON et CSV;
  • les catégories de recherches spécialisées (fichier, image, carte, etc.) et le temps réponse de chaque moteur interrogé peuvent être affichés;
  • la confidentialité est assurée par le mélange des requêtes avec des recherches sur d’autres plates-formes sans stockage des données.

L’instance Searx est utilsée par la Quadrature du Net https://searx.laquadrature.net/

Cependant la requête ne fonctionne pas toujours : en effet certains moteurs de recherche comme Google sont protégés par un captcha, de sorte que la couverture des résultats est plus restreinte que prévue…