Comment bien interroger Google en 2018 ?

Dans notre précédent article intitulé « Google évolue : les documentalistes plus utiles que jamais », nous faisions le constat que Google affiche toujours moins de résultats et ce, quelle que soit la requête, et alors que son index ne cesse pourtant de s’accroître.

Certes, il annonce dans un premier temps des centaines de milliers voire des millions de résultats mais, en se rendant sur la dernière page de résultats, on constate que le nombre de résultats ne dépasse pratiquement jamais les 500.

Pour preuve, nous avions réalisé en 2011 une recherche sur les masques respiratoires. A l’époque, une requête sur l’expression masque respiratoire permettait de visualiser plus de 1 000 résultats dans Google. Aujourd’hui, la même requête n’en génère que 183.

Aujourd’hui, peut-on encore bien interroger Google ? Comment peut-on optimiser sa recherche sur le moteur ? Ou bien faut-il admettre que toute recherche sur le moteur sera par principe erratique ?

Peut-on encore confier sa recherche d’information à Google ?

Interroger les moteurs, c’est d’abord s’interroger sur ce que l’on recherche.

Les moteurs de recherche vont généralement s’avérer efficaces quand on recherche une réponse simple à une question simple, une information ou un document précis : une date, un chiffre, un nom, un article, un site, etc.

Attention cependant : ce n’est pas parce que l’information ou le document ne se retrouve pas sur Google qu’elle n’existe pas.

Même si l’index des moteurs ne cesse de croître, les moteurs généralistes sont toujours loin d’indexer l’intégralité du Web.

Et c’est sans compter sur toutes les informations de qualité que l’on trouve également en dehors du Web comme dans les revues papier, au travers de contacts humains, etc.

Par contre, cela se complique quand on a besoin d’une sélection d’informations et de documents sur un sujet, un comparatif, une synthèse d’informations, une vision globale d’un marché, d’un secteur ou d’une thématique en vue de faire le tour d'un sujet. Et la baisse du nombre de résultats ne fait qu’empirer le problème.

Même si, pour ce type de problématique, l’information fournie par les moteurs sera nécessairement parcellaire, on peut tout de même optimiser sa recherche en ciblant au maximum ses besoins et en tirant parti des fonctionnalités avancées des moteurs.

Cibler sa question et multiplier les requêtes courtes

De l’avis de nombreux experts, les longues requêtes booléennes sont désormais à proscrire.

Mieux vaut donc multiplier les requêtes courtes.

Depuis quelques années déjà, Google s’est lancé dans la recherche sémantique. Ainsi, lorsqu'on entre un terme dans le moteur, il élargit en principe automatiquement la recherche aux synonymes et termes proches.

Sauf que dans la réalité, cela varie beaucoup d’un mot à l’autre.

On aura donc intérêt à tester avec un premier terme et relancer ensuite différentes requêtes avec des synonymes et termes proches.

Il faudra aussi tester différentes formulations de la requête : requête booléenne traditionnelle, requête en langage naturel et sous forme d’une question.

Si on reprend notre exemple de la semaine dernière où il était question de réaliser un profil détaillé de l’entreprise Pizzorno, une société spécialisée dans la gestion des déchets, une recherche Google sur le terme Pizzorno générait 317 résultats sans limite de date. Autant dire qu’on passait à côté de très nombreux résultats pertinents.

Toute la question est de savoir ce dont nous avons réellement besoin pour réaliser ce profil d’entreprise :

  • des éléments financiers ;
  • des informations sur les dirigeants ;
  • des informations sur les contrats remportés ;
  • des informations sur d’éventuels scandales ;
  • des informations sur d’éventuels vagues de licenciements ou de recrutement ;
  • des informations sur d’éventuels mouvements sociaux ;
  • des informations sur des projets de centres de stockage ;
  • etc.

Il faudra donc orienter sa requête en fonction du type d’informations que l’on recherche.

Dans notre exemple, on croisera par exemple Pizzorno avec des termes relatifs aux éléments financiers comme rapport annuel, données financières, etc. et on relancera ensuite de multiples requêtes pour les différents aspects identifiés.

Et quand on trouve une information intéressante, comme par exemple, le nom d’un nouveau projet, on conseillera de relancer la recherche sur des termes précis liés à cette information comme le nom du projet, le nom de la ville concernée, le nom d’une personnalité mentionnée, etc pour réorienter la recherche et obtenir plus de détails.

On a également intérêt à commencer par une recherche simple à base de mots-clés ou en langage naturel et affiner ensuite avec les opérateurs avancés que nous détaillons ci-après.

Rappel des fonctionnalités avancées de Google

On rappellera ici les principaux opérateurs avancés de Google qui, par expérience, fonctionnent le mieux :

  • les opérateurs booléens AND (par défaut), OR, NOT (représenté sous la forme d’un tiret -);
  • les guillemets pour la recherche d’expression exacte;
  • intitle: pour rechercher le(s) terme(s) dans le titre des pages Web;
  • filetype: pour recherche des documents dans un format précis (pdf, .doc, .xls);
  • site: pour rechercher des résultats en provenance d’un site spécifique ou d'un nom de domaine;
  • related: pour rechercher des pages et sites similaires (voir notre billet « Comment trouver des sources et contenus similaires pour enrichir votre veille? »);
  • inurl: pour rechercher un terme contenu au sein de l’url;
  • .. pour rechercher un intervalle numérique (2000..2010 recherchera 2000, 2001, 2002, etc. jusqu’à 2010)
  • * qui permet de remplacer un mot ou un groupe de mots (veille * stratégique permettra par exemple de retrouver les résultats contenant l’expression veille concurrentielle et stratégique)

On peut également filtrer les résultats par date (moins d’une heure, moins d’une semaine, période personnalisée).

On constate cependant qu’à trop relancer de recherches et à trop utiliser d’opérateurs avancés Google nous considère très vite comme un robot et nous demande sans cesse de cliquer sur un bouton pour prouver le contraire.

Preuve en est que pour Google, la recherche d’information pratiquée par des experts et les requêtes sophistiquées ont tout de suite quelque chose de suspect...

On conseillera enfin d’afficher 100 résultats par page, ce qui permet un gain de temps certain et permet d’avoir une meilleure vision du nombre de résultats réels.

Le cas particulier de la recherche d’informations locales

Depuis octobre dernier, Google ne permet plus d’interroger directement les différentes versions locales de son moteur. Ce qui est donc un problème pour la recherche d’informations locales...

Avant, si vous souhaitiez obtenir des résultats issus principalement de sites britanniques, il suffisait d’aller sur google.co.uk. Désormais, les résultats dépendent entièrement de votre localisation réelle. Pour contourner cette limite, on peut toujours aller changer sa zone géographique dans les paramètres du moteur ou utiliser un VPN.

Chercher la source plutôt que l’information

L’autre élément indispensable à une bonne recherche, c’est de ne pas toujours chercher directement l’information finale mais la source susceptible de la détenir.

Dans notre exemple sur l’entreprise Pizzorno, on aurait donc intérêt à rechercher des sources spécialisées sur le secteur d’activité des déchets ou plus largement liées à l’environnement (presse spécialisée, blogs, etc.), des sources spécialisées sur les données financières, des sources spécialisées sur les appels d’offres, des sources locales en lien avec les projets identifiés (presse locale, site des collectivités locales), etc.

On ira ensuite interroger séparément ces sources et, si elles ne disposent pas de moteur interne digne de ce nom, on pourra toujours les interroger via Google en utilisant l’opérateur site:

Interroger les médias sociaux depuis leurs propres plateformes ou depuis des outils dédiés

On constate également que, dans une liste de résultats Google, il y a très peu de résultats en provenance des principaux médias sociaux comme Twitter, Facebook, LinkedIn, etc.

Google n’a pas véritablement intérêt à vous conduire directement chez ses concurrents...

On pensera donc à aller interroger toutes ces plateformes séparément ou à recourir à des outils de recherche dédiés.

Pas de formule magique pour interroger Google, Bing et les autres

Au cas où on en douterait encore, il n’existe donc pas de méthode ou solution miracle pour interroger Google. Tout dépend de ce que l’on cherche et il va souvent falloir « tâtonner » et tester un certain nombre de possibilités et de requêtes.

Contrairement à la croyance populaire, une bonne recherche sur Google est loin d’être un jeu d’enfant et, dès que l'on souhaite avoir une vision d’ensemble d’un sujet, cela peut prendre du temps, beaucoup de temps même...

On peut sans aucun doute optimiser sa recherche d’information sur Google mais on n’aura jamais la garantie d’avoir accès aux principaux documents les plus pertinents par rapport à son besoin informationnel et, ce même s’ils sont référencés dans l’index de Google.

On ne le rappellera jamais assez : il est toujours problématique de se limiter uniquement aux moteurs de recherche généralistes dans le cadre d’une veille ou d’une recherche d’informations.

On ne saurait ainsi se passer des agrégateurs de presse, des moteurs thématiques, des bases de données financières, académiques, juridiques, scientifiques et brevets, etc.

Dès que l’on sort d’une question simple générant une réponse simple et limitée, n’en déplaise aux moteurs, on n’a pas encore trouver mieux que l’humain pour le réaliser.

Le dialogue est en effet essentiel pour comprendre précisément les besoins de son interlocuteur et être capable de mener une recherche de qualité.

Auteur : Carole Tisserand-Barthole, Rédactrice en chef de BASES et NETSOURCES

Vous souhaitez recevoir nos astuces et nos conseils de veille ?

Inscrivez-vous à notre newsletter  

Espace membres

Partenaires dans le monde

partenaires monde

Nos bureaux

plan bureaux