La recherche experte avec
Trucs & astuces pour une recherche efficace !
Mathieu ANDRO, animateur du réseau de veille
Qui suis-je ?
Mathieu ANDRO : mathieu.andro@pm.gouv.fr �01 42 75 88 53 - Bureau 0.359
�Animateur du réseau de veille des SPM.
Le centre de doc des SPM
Accéder à un savoir universel et impérissable à tout instant ? �Vous en rêviez…
Google l'a (presque) fait, sa mission :
« organiser les informations à l'échelle mondiale �dans le but de les rendre accessibles et utiles à tous »*.
�* Source : Du garage au Googleplex, site internet de Google, consulté le 25/06/2018.
Internet vs le web : �quelle différence ?
Comment fonctionne �un moteur de recherche ?
Fonctionnement d’un moteur de recherche
Les moteurs sont composés de 4 éléments fondamentaux :
Processus de la recherche
Saisir un ou plusieurs mots-clés dans le formulaire,
Requête lancée sur le texte des pages enregistrées par le moteur dans son index,
La page de résultats affiche la liste et les extraits des copies de pages contenant le mot-clé (à la date de l’indexation),
Un clic sur le titre affiche la page telle qu’elle existe aujourd’hui sur le web.
Fonctionnement d’un moteur de recherche
… Par conséquent :
Les résultats varient en fonction…
Du contenu des pages, mais aussi…
Ref. : Comment le Web a « avalé » Internet, William Audureau, Le Monde, 12/03/19. https://www.lemonde.fr/pixels/article/2019/03/12/comment-le-web-a-avale-internet_5434770_4408996.html, consultée le 13/03/2019.
Les pages en cache : une astuce !
Il est parfois possible de récupérer la version payante (édition abonnés) d’un article dans sa globalité … grâce aux pages en cache !
Internet Archive, l’archive du webn
Quelques chiffres…
Sources :
https://www.blogdumoderateur.com/chiffres-google/, consultée le 25/06/2018.
https://www.webrankinfo.com/dossiers/google/chiffres-cles, consultée le 25/06/2018.
L’empire Google
En 2018, Google possède 93% des parts de marché dans le monde :
Source : https://www.webrankinfo.com/dossiers/etudes/parts-marche-moteurs, consultée le 25/06/2018.
Pourquoi GOOGLE ?
Pourquoi GOOGLE ?
Source : https://www.01net.com/actualites/dou-vient-le-nom-google-506372.html , consultée le 04/03/2019.
Un concept révolutionnaire
=> Pages connues et non les plus pertinentes dans les premiers résultats,
=> Pas de prise en compte des nouveaux sites pas encore populaires...
Google : l’ogre
Web sémantique et extraction de données
Google : Big brother
Google : couteau suisse
Google : moteur de recherche super puissant
1ère étape : préparer la recherche
1ère étape : préparer la recherche
Questions préalables : qu’est ce que je recherche exactement ?
�=> prendre du temps au départ pour en gagner par la suite !
Avec les bons ingrédients… voici la recette !
Attention : Google n’est pas exhaustif !
=> sources invisibles manquent aux résultats !
(non indexées : �BDD spécialisées, pages protégées par un mot de passe, etc.)
Résultats Google = web visible seulement
Visuel : nombre de résultats
Paramétrer 50 résultats par page lors d’une recherche :
Procédure :�Dans paramètres > paramètre de la recherche :
Visuel : nombre de résultats affichés
Attention : écart entre le nombre de résultats annoncés et le nombre de résultats réel !
Sur la dernière page de résultats, Google indique :
« Afin d'afficher les résultats les plus pertinents, nous avons omis quelques entrées qui sont très similaires aux xx entrées actuelles.�Si vous le souhaitez, vous pouvez relancer la recherche �pour inclure les résultats omis. »
Nombre de résultats… trompeur !
Il y a infiniment plus de résultats que ce que l’on peut voir de prime abord et ces résultats sont choisis sur des critères qui ne sont pas les nôtres !
…d’où l’intérêt de préciser sa recherche : c’est tout l’enjeu des astuces suivantes !
Quelques bases
Ex : éducation = education
Ex : François = françois
Ex : de, à, le, dans, etc.
… et les fautes d’orthographe sont corrigées !
L’autocomplétion : guide la recherche
Quelques bases
Les singulier/pluriel et masculin/féminin sont gérés
Ex : une recherche maison ramène maison, maisons
une recherche cheval ramène cheval, chevaux
une recherche instituteur ramène instituteur, institutrice.
… mais l’inverse n’est pas vrai !
une recherche maisons ne ramène que maisons.
=> Il vaut donc mieux utiliser une forme au singulier masculin dans la mesure du possible !
Quelques bases
L’ordre des mots a une importance
=> pondération + importante pour le 1er mot de la requête .
Ex : « premier ministre » « gilets jaunes »
« gilets jaunes » « premier ministre »
Le classement des résultats est différent �…et le nombre de résultats diffère également !
Les recherches associées
Ex : recherche sur le mot « noël » :
a. Requêtes populaires associées à la requête tapée par l’internaute,
b. Personnalisation si l’on est connecté à son compte Google,
c. Tient compte de l’emplacement géographique (si cette donnée est disponible),
d. Ajout de termes en plus à la requête pour affiner le niveau de détail de la requête.
*Source : https://www.leptidigital.fr/webmarketing/seo/recherches-associees-google-14770/, consulté le 27/12/2019.
La recherche avancée
Opérateurs booléens
Les opérateurs booléens permettent de créer une requête avec des mots clés et d’affiner une recherche.
Les plus utilisés :
Le AND (implicite) traduit un ET entre les termes
Ex : président macron
Le OR traduit un OU entre les termes
Ex : président OR macron
ou président|macron
Le -SAUF exclue un terme
Ex : avocat –droit
ou « réseaux sociaux » -facebook
Utilisation des guillemets
Google cherche automatiquement les variantes d’un mot depuis sa racine
Ex : embauche > embaucher
Les guillemets forcent la recherche sur le mot ou l’expression exacte => cela permet de réduire le bruit
Ex : marché => marche + marché
= > « marché » : + pertinent.
Ex : « marché nordique » => marche + marché
=> « "marché" nordique » : + pertinent.
Affiner la recherche
onglets sous la barre de recherche : images, maps, actualités, livres, vidéos, etc.
avec l’attribut Filetype
Ex : filetype:pdf «e-administration »
Affiner la recherche
intitle : limite à la recherche dans le titre �Ex : intitle:« droit à l’oubli »
Intext : limite la recherche au corps de la page
Ex : intext:fonctionnaire salaire
site : limite la source des résultats aux pages d’un nom de domaine ou d’un site�Ex: « grand paris » site:gouv.fr
site:.gouvernement.fr gouvernance
(ou site:insee.fr pour des stat. par ex)
Google est souvent plus efficace que le moteur de recherche propre au site !
Affiner la recherche
inurl : effectue une recherche sur un type de sources �Ex : administration inurl:liens (si l’on recherche une liste de liens)
=> identifie une liste de ressources concernant l’administration.
related : demande à Google d’élargir la recherche en proposant des sites similaires à un site pertinent.
Ex : related:archivistesqc.wordpress.com
Affiner la recherche
Classer les résultats de l’onglet actualités par date : outils > choisir un filtre > puis « tri par date ».
Possibilité de délimiter une période d’édition des pages proposées en résultats : onglet outils > date indifférente > période personnalisée.
Opérateurs before / after.
Ex : before:AAAA/MM/JJ � before:AAAA
Combiner les critères de recherche
Ex : identifier rapidement quelques documents publiés sur les sites gouv.fr ayant pour sujet la politique territoriale.
Equation de recherche | Nombre de résultats |
politique territoriale | 35 000 000 |
"politique territoriale" | 96 200 |
"politique territoriale" site:gouv.fr | 4 450 |
"politique territoriale" site:gouv.fr filetype:doc OR filetype:pdf | 2 120 |
intitle:"politique territoriale" site:gouv.fr filetype:doc OR filetype:pdf | 6 |
intitle:"politique territoriale" site:gouv.fr filetype:doc OR filetype:pdf after:2000 | 3 |
Documents vraiment confidentiels ?
Pour aller plus loin…
Paramètres > langues : choisir la langue des résultats obtenus.
(voir aussi dans la recherche avancée)
Désactiver la personnalisation basée sur les recherches précédentes : paramètres > historique.
Ajoutez &pws=0 à la fin de l’url de résultats d’une recherche : désactive la fonctionnalité « recherche personnalisée » => Google ne tient alors plus compte de votre historique de recherche et de navigation.
Pour aller plus loin…
Paramètres > recherche avancée > « région » : permet de rechercher des pages publiées dans une région précise.
Le lieu géographique de publication de la page devient alors un critère de recherche.
On peut ainsi limiter les résultats à un pays, la France par exemple : attention, recherche dans les sites français… et non francophones !
Astuce : outil « I search from… » trompe Google !
Pour aller plus loin…
Pas de Troncature dans Google, le signe * fait office d’opérateur de proximité : remplace un mot ou groupe de mots/lettres
Ex : « bibliothèque * numérique » �=> recherche bib scientifique num, bib virtuelle num, bib mondiale num, etc.
… ou utiliser AROUND(xx)
Ex : bibliothèque AROUND(3) numérique �=> recherche bib distant de 3 mots de num.
Pourquoi les opérateurs de recherche Google sont-ils si peu connus ?
… va à l’encontre du modèle économique de Google !
Principes des liens sponsorisés : placés en tête de liste grâce à l’achat préalable de mots-clés (enchères : permet à l’annonceur le plus offrant de figurer en tête !). Liens commerciaux qui fonctionnent au coût par clic (cost per clic) : facturation par Google à l’annonceur lorsqu’un internaute clique sur un de ses liens !
*Source : https://www.blogdumoderateur.com/chiffres-google/, consulté le 25/06/2018.
J’ai de la chance…
=> Ce bouton renvoie sur la page correspondant �au premier résultat de la recherche.��
Persévérer !
« A trop utiliser d’opérateurs, Google nous considère vite comme un robot et nous demande sans cesse de prouver le contraire. �Preuve en est que pour Google, la recherche d’information pratiquée par des experts et les requêtes sophistiquées ont tout de suite quelque chose de suspect… »*
*Cf. article FLA Consultant – Bibliographie.
Crowdsourcing implicite
On travaille sans savoir pour Google
Google : un florilège de ressources
Google à plusieurs cartes dans son jeu…
Google images
Possibilité d’identifier, pour une image donnée, d’autres photos ou dessins « d’apparence similaire » par leurs formes ou leurs couleurs.
�Cliquer sur : coller une url ou importer une image�
Voir aussi la recherche avancée d’images (outils > droits d’usages, par ex).
Google News
Google actualités est un moteur de recherche d’actualités.
N’indexe que des contenus provenant de sites de presse, site d’actualités et quelques blogs de référence.
=> Pas très performant, utiliser plutôt le moteur généraliste de Google puis sélectionner ensuite l’onglet « Actualités »*.
*Source : https://www.fla-consultants.com/fr/blog-actualites/recherche-information-efficace-google-news, Consultée le 05/03/2019.
Google Scholar
Outil de recherche d'articles scientifiques.
Indexe des articles - approuvés ou non par des comités de lecture - des thèses, des citations et des livres scientifiques.
Attention, corpus opaque & fonctionnalités de recherches simplistes, nous avons intérêt à utiliser des requêtes courtes !
Google Books
Outil de recherche, consultation de livres en ligne ou sur appareil mobile, constitution de collections personnelles, téléchargement d'ouvrages libres de droits.
Corpus qui compte plus de 40 millions de livres, notamment alimenté par les éditeurs qui souhaitent inclure leurs ouvrages dans la base de données de Google, mais aussi des partenariats avec les bibliothèques.
Attention : Google Books indexe beaucoup plus d’ouvrages en anglais.
Google Drive
Google & la veille
Les Google alertes (gmail / récupération d’un flux RSS) �… pour pérenniser la recherche !
Pour conclure…
L’interrogation de Google est un excellent point de départ pour démarrer une recherche,� à la condition toutefois de bien formuler sa requête �et de tirer parti des fonctions avancées du moteur… �tout en gardant un esprit critique !
Stratégie de Google aujourd'hui = « moteur de réponses »
A l’heure du mobile first : fonctionnalités de Google �dégradées sur l’application mobile.
N’oubliez pas que ce n’est pas parce qu’on ne trouve pas une information sur Google… qu’elle n’existe pas !
=> Voir formation sur les outils du centre de Doc des SPM
Google & la question des données personnelles
Pour Vinton Cerf, chef évangéliste chez Google : « la vie privée peut être considérée comme une anomalie ».
Google vit de la pub ciblée et collecte énormément de données personnelles.
1ère instance en Europe à sanctionner via le RGPD pour : « manque de transparence, information satisfaisante et absence de consentement valable pour la personnalisation de la publicité ».
Quelques alternatives à Google…
Google à aujourd’hui un monopole
… et tous les monopoles sont dangereux :
Le danger du monopole de Google, Jérôme Bondu - Vidéo YouTube.
Quelques alternatives à Google…
A propos de Qwant, une remarque…
« Il me semble qu’analyser Qwant sous un angle uniquement opérationnel et conclure que l’outil est à mettre à la poubelle témoigne d’un manque d’analyse stratégique patent. Une prise en compte globale des enjeux liés à l’utilisation des moteurs de recherche incite plutôt à multiplier les outils pour �éviter une situation monopolistique. �Et quitte à promouvoir un autre outil, autant qu’il soit européen. » �(J. BONDU)
*Source : https://www.archimag.com/veille-documentation/2017/02/16/google-qwant-combat-strategique, consultée le 16/02/2017.
Quelques alternatives à Google…
�
SOS recherche !
Avant Google, on posait nos questions bizarres aux bibliothécaires*…
documentation-renseignements@pm.gouv.fr
Tel : 01 86 69 55 10
*Source : https://www.actualitte.com/article/zone-51/avant-google-on-posait-nos-questions-bizarres-aux-bibliothecaires/93464, consultée le 05/03/2019.
Bibliographie – sitographie