Navigation : home Accueil du site > Recherche documentaire > Recherche bibliographique médicale avec Medline/Pubmed (1/2)

Recherche bibliographique médicale avec Medline/Pubmed (1/2)

Une approche pratique basée sur l’exemple.

Mise à jour le 19 juillet 2020, par Philippe Eveillard, Thierry Hannedouche, Temps de lecture estimé : 8 min.
 
Notez cet article :
0 vote

 
Print Friendly and PDF

Une recherche bibliographique rassemble des notices bibliographiques plus communément appelées références. Par définition, faire une recherche bibliographique consiste à interroger une banque de données par l’intermédiaire d’une interface afin d’obtenir des notices bibliographiques.

Dans cet article nous analyserons les arcanes d’une recherche utilisant la version PubMed de medline.

1. Généralités

Une recherche bibliographique comporte 4 composantes :

  • une requête formulée selon la syntaxe de l’interface ;
  • une interface qui interroge la banque de données ;
  • une banque de données qui héberge les notices,
  • des notices qui sont les éléments d’identification des documents primaires, c’est-à-dire des documents originaux (ou articles originaux).

MEDLINE est la banque de données bibliographiques de référence des cliniciens comme en témoigne son audience, environ 2 millions de requêtes par jour. Cette banque de données héberge 15 millions de notices d’articles dont le contenu est indexé (caractérisé) à l’aide des termes du thésaurus MeSH.

PubMed est une des interfaces d’interrogation de MEDLINE. En l’espace de 10 ans, son accès (gratuit depuis 1997) et ses capacités d’adaptation et de progression l’ont propulsé au premier rang des interfaces d’interrogation de MEDLINE, loin devant les autres interfaces gratuites (comme NLM Gateway ou Medscape) ou payantes (comme Ovid ou Knowledge Finder).

La sollicitation de MEDLINE via PubMed est indispensable dès qu’on souhaite rassembler :

  • les articles de la presse médicale internationale sur un sujet précis (dans le cadre de la bibliographie de la thèse) ;
  • les preuves en faveur de telle ou telle décision (dans le contexte de la médecine "evidence-based").

Figure 1 : Page d’entrée de Medline via Pubmed.

2. La recherche bibliographique dans Medline Pubmed : les fondamentaux

Dans MEDLINE/PubMed, la recherche documentaire peut se faire en langage d’indexation (thesaurus MeSH) ou en langage courant. Le seul impératif est la langue anglaise. 

Exemple : Sur le thème des bêta-bloquants, MEDLINE peut être interrogé :

  • soit avec le mot clé betablockers utilisé en tant que mot du texte (Text Word) ;
  • soit avec le terme Adrenergic Beta-Antagonists en tant que descripteur (mot appartenant à un thesaurus). 

    Dans le premier cas, betablockers est recherché dans les mots des titres, les mots des résumés et les bordereaux d’indexation. Dans le second, Adrenergic Beta-Antagonists n’est recherché que dans les bordereaux d’indexation. Betablockers en tant que mot du texte est une recherche sensible. 
Adrenergic Beta-Antagonists en tant que descripteur est une recherche précise. 

    L’interrogation de Medline en faisant appel aux descripteurs du MeSH plutôt qu’aux mots clés du langage courant améliore fortement l’adéquation de la requête, ceci a été confirmé par plusieurs publications (1,2).

Dans MEDLINE, une formulation correcte des requêtes doit prendre en compte les notions de descripteur, de qualificatif, de champ et d’explosion. 


2.1 Descripteurs

Dans Medline les articles de la presse médicale sont indexés à l’aide de descripteurs appartenant au thésaurus MeSH (abréviation de Medical Subject Headings) comprenant 24 357 descripteurs disséminés dans une structure arborescente comprenant par ailleurs 15 branches maîtresses.

Thesaurus = vocabulaire contrôlé 

Un thesaurus est un vocabulaire contrôlé dans lequel :

  • chaque terme (appelé descripteur) représente sans ambiguïté une notion et une seule ;
  • les descripteurs ont entre eux des relations hiérarchiques, synonymiques et de proximité.

Figure 2 : Fenêtre de recherche des descripteurs MESH

Les relations hiérarchiques
Exemple avec le descripteur Renal Dialysis.
Dans cet exemple, renal dialysis est issu d’un descripteur de niveau hiérarchique supérieur (son descripteur-père, Renal Replacement Therapy situé dans la branche maîtresse Analytical, diagnostic and therapeutics technics and equipment category) et donne naissance à 3 descripteurs de niveau hiérarchique inférieur (ses descripteurs-fils Hemodiafiltration, Hemodialysis Home et Peritoneal Dialysis)

Figure 3 : Exemple de relation hiérarchique avec le descripteur « Renal dialysis »

Les relations synonymiques

Exemple : Renal dialysis 9 entry terms (synonymes) : dialyses, renal ; renal dialyses etc..
L’entrée de l’un quelconque de ces entry terms est interprétée en tant que Renal Dialysis par l’interface PubMed.

Les relations de proximité
Exemple : Kidney, Artificial est la relation de proximité de Renal Dialysis

Ces 3 types de relations sont rassemblés :

  • dans la page Renal Dialysis de MeSH database de PubMed,
  • dans la page Renal Dialysis de MeSH browser du site de la NLM, où l’on retrouve :
    — les 4 arborescences dans lesquelles figure le descripteur Renal Dialysis (relations hiérarchiques) ;
    — les 9 entry terms du descripteur Renal Dialysis (relations synonymiques) ;
    — le see also (Kidney Artificial) de Renal Dialysis (relation de proximité).


Figure 4 : relation de proximité avec le descripteur « Renal dialysis »

2.2 Qualificatifs (subheadings)

Définition

Pour affiner la recherche, chaque descripteur peut être affilié d’un qualificatif. Ce qualificatif précise le sens du descripteur. L’affiliation se traduit par un slash « / » entre le descripteur et le qualificatif.

Exemples :
 hemodialysis solutions/therapeutic use
 renal dialysis/methods

Intérêt
Dans les bordereaux d’indexation, pratiquement tous les descripteurs sont "qualifiés", à l’exception :

  • des check tags (male, femelle, comparative study, in vitro, English Abstract) ;
  • des groupes d’âge (adolescent, adult, aged, child, infant...). 

    Cette qualification quasi systématique des descripteurs est la meilleure façon d’affiner l’indexation des articles, c’est-à-dire de caractériser "au plus près" les documents. Cela n’a d’intérêt que si l’utilisateur (celui qui élabore la requête) joue le même jeu et "qualifie" ses descripteurs, ce qui permet d’obtenir la meilleure adéquation possible entre la demande (la requête) et la réponse (les notices affichées).

Chaque catégorie de descripteurs a son lot de qualificatifs.

Tous les qualificatifs (il y en a 83) ne sont pas "affiliables" à chaque descripteur. Certains sont plus spécifiques des maladies, d’autres des médicaments, d’autres des investigations diagnostiques... 

Ainsi : 

 diagnosis, epidemiology, etiology, drug therapy, complications, prevention and control, surgery, radiography... sont les qualificatifs les plus couramment affiliés aux maladies ; 

 adverse effects, administration and dosage, contraindications, antagonists and inhibitors, pharmacology, toxicity, therapeutic use... sont affiliés aux médicaments et classes thérapeutiques. 

Exemples :

  • kidney failure, chronic/epidemiology
  • calcitriol/therapeutic use
  • arteriovenous shunt, surgical/instrumentation

En cas d’hésitation (ce qualificatif convient-il à ce descripteur ?), il faut :

Correspondances
Lorsqu’une équation contient plusieurs descripteurs, il est parfois possible d’établir des correspondances entre leurs qualificatifs. C’est le cas quand sont associés :

  • un médicament (qualificatif : therapeutic use) et une maladie (qualificatif : drug therapy)
    Heart Failure, Congestive/drug therapy [mh] AND Adrenergic Beta-Antagonists/therapeutic use [mh]
  • un médicament (qualificatif : adverse effects) et une affection iatrogène (qualificatif : chemically induced)
    Antiinflammatory Agents/adverse effects [mh] AND Myocardial Infarction/chemically induced [mh]
  • deux maladies dont l’une est la complication de l’autre
    Kidney Failure, Chronic/etiology [mh] AND Diabetes Mellitus/complications [mh]

L’explosion des qualificatifs
Comme les descripteurs, les qualificatifs ont entre eux des relations hiérarchiques. 
Les 19 branches maîtresses (les 19 "familles") donnent naissance à des qualificatifs de niveau hiérarchique inférieur. 

Exemple :
- La famille diagnosis donne naissance aux qualificatifs pathology, radiography, radionuclide imaging, ultrasonography. 

Le phénomène de l’explosion se produisant par défaut, toute recherche dont le qualificatif est diagnosis est étendue aux qualificatifs pathology, radiography, radionuclide imaging, ultrasonography (voir l’arborescence des qualificatifs et la section explosion de cet article)

2.3 Champs

Définition
A chaque mot peut être attribué un champ sémantique qui précise l’espace conceptuel auquel il appartient. A côté des champs "sémantiques" existent des champs de "localisation" du mot clé : dans le titre de l’article ; dans le titre et le résumé ; dans le titre, le résumé et le bordereau d’indexation.

L’attribution d’un champ à un mot-clé précise donc :

  • soit sa nature (ce mot-clé est un descripteur, un auteur ou un type de publication)
  • soit sa localisation (ce mot-clé est un mot du titre ou un mot du titre et du résumé, etc.)

Exemples :
 French est le plus souvent considéré comme un langage, mais c’est aussi un nom d’auteur.
 De même, Circulation est le plus souvent un descripteur, mais c’est aussi un journal. 

Intérêt
Dans une banque de données très structurée comme MEDLINE, l’indication du champ des composants de l’équation (mots clés et descripteurs) permet de renforcer la précision de la requête.

Exemple avec le mot clé "french" 

L’entrée de french dans la fenêtre d’interrogation de PubMed, sans indication de champ, affiche plus de 600.000 notices (avril 2005). 

C’est sans conséquences si celui qui fait la requête emploie french pour retrouver les publications en langue française car 96% des notices affichées sont effectivement en langue française. En revanche, ce n’est plus sans conséquences si celui qui fait la requête emploie french pour recencer les publications d’un auteur du nom de French (champ auteur) ou celles dans lesquelles un dénommé French est le personnage central (champ nom de personne). Dans le premier cas, il faudra trier 115 notices avant d’en trouver une dont l’auteur s’appelle French. Dans le second, il faudra en trier 100 000 avant d’en trouver 2 répondant à la requête.

Syntaxe

L’indication du champ suit le mot clé sous la forme de son abréviation, placée entre crochets [ ]. 
Le nom du champ est entré en abrégé (en majuscules ou en minuscules).

Exemples : french [la], peritoneal dialysis [mh], review [pt]

Il existe une trentaine de champs dans Pubmed mais les 10 champs les plus communément utilisés sont facilement mémorisés après quelques sessions de requête dans Medline.

2.4 L’explosion

Définition
L’explosion d’un descripteur se définit par l’extension de la requête effectuée sur ce descripteur à ses descendants dans la liste hiérarchique où il figure. 
L’explosion d’un qualificatif se définit de la même façon, les qualificatifs appartenant à des listes hiérarchiques. 
Dans PubMed/MEDLINE, l’explosion d’un descripteur (ou d’un qualificatif) se fait par défaut.

Explosion d’un descripteur
L’entrée d’un descripteur dans la fenêtre d’interrogation de PubMed entraîne, par défaut, l’extension de la requête aux descripteurs issus de lui dans l’arborescence du thésaurus. L’explosion concerne aussi bien les descripteurs que les qualificatifs sous réserve que les uns et les autres ne soient pas en bout d’arborescence.

Exemple avec : dialysis solutions/adverse effects
L’arborescence du descripteur dialysis solutions montre l’existence d’un descripteur-fils hemodialysis solutions. Celle du qualificatif adverse effects révèle l’existence de 2 qualificatifs-fils poisoning et toxicity.

L’explosion de dialysis solutions/adverse effects [mh] concerne à la fois le descripteur-fils et les 2 qualificatifs-fils.

La requête ne se limite donc pas à l’équation dialysis solutions/adverse effects, mais est étendue à 5 autres équations :
 dialysis solutions/poisoning
 dialysis solutions/toxicity,
 hemodialysis solutions/adverse effects,
 hemodialysis solutions/poisoning
 hemodialysis solutions/toxicity

Explosion d’un qualificatif
Les 83 qualificatifs appartiennent à 19 familles, plus ou moins "nombreuses" : 
-* la famille microbiology n’a qu’un seul "descendant", le qualificatif virology ;

  • la famille epidemiology en a 2, les qualificatifs mortality et ethnology ;
  • la famille therapy en a 8, les qualificatifs diet therapy, drug therapy, nursing, prevention and control, radiotherapy, rehabilitation, surgery, transplantation. 
L’explosion d’un qualificatif étend la requête effectuée sur ce qualificatif à ses descendants. 

    Exemple :
- Une recherche sur Pulmonary Embolism/epidemiology est étendue à Pulmonary Embolism/mortality et à Pulmonary Embolism/ethnology.

Syntaxe
Dans Pubmed, l’explosion se produit par défaut, c’est-à-dire dans tous les cas, sauf indication contraire. Pour éviter le plénomène de l’explosion, il faut le préciser dans le champ qui suit l’affiliation descripteur/qualificatif , sous la forme : [mh:noexp]

Exemple :
  Tonsillitis/microbiology [mh:noexp] ou Tonsillitis/microbiology [majr:noexp]. 

Dans ce cas particulier, c’est une double explosion qui est évitée : celle de Tonsillitis qui a pour "descendant" Peritonsillar Abcess et celle de micriobiology, qui donne naissance à virology.

Mais il est possible de dissocier l’explosion du descripteur et la non explosion du qualificatif (et inversement). 

Exemples :
 Tonsillitis/microbiology [mh] NOT (Tonsillitis/virology [mh] OR Peritonsillar Abscess/virology) - Seul le descripteur est explosé.
 Tonsillitis/microbiology [mh] NOT (Peritonsillar Abscess/microbiology [mh] OR Peritonsillar Abscess/virology [mh]) - Seul le qualificatif est explosé.

Intérêt
La question de l’explosion se pose rarement pour les descripteurs car ils appartiennent le plus souvent à l’un des deux niveaux hiérarchiques. 

La question de l’explosion se pose principalement pour les qualificatifs. Certains ne sont pas explosés pour ne pas étendre la requête au delà des limites imposées par le thème.

Exemple avec le qualificatif diagnosis :
La non-explosion évite l’affichage des notices relatives aux données anatomo-pathologiques ou d’imagerie quand la requête se limite au diagnostic clinique :
  Gout/diagnosis [mh] (1605 notices le 3 mai 2005) ;
  Gout/diagnosis [mh:noexp] (952 notices le 3 mai 2005). 


Exemple avec le qualificatif therapeutic use :
La non-explosion évite l’affichage des notices relatives aux contre-indications ou aux effets indésirables quand la requête se limite aux indications :
 Anticholesteremic Agents/therapeutic use [mh] (7776 notices le 3 mai 2005) ;
 Anticholesteremic Agents/therapeutic use [mh:noexp] (4230 notices le 3 mai 2005).

 
 

Références

Les liens sur Internet

PubMed

PubMed : mode d’emploi de la NLM (en anglais)

Cismef – module « terminologie »

Formation à l’utilisation de PubMed (Université Paris Sud)

Doc.edu (Site de P. Eveillard consacré à la recherche documentaire en médecine)

Mode d’emploi de l’URFIST de Strasbourg (2004)

Mode d’emploi de la Bibliothèque Universitaire de Montréal (2006)

Bibliographie

Lowe HJ, Barrett CO Understanding and using the medical subject headings (MeSH) vocabulary to perform literature searches. JAMA, 1994 ;271(14):1103-8 PubMed

Clarke M, Greaves L, James S MeSH terms must be used in Medline searches. BMJ. 1997 Apr 19 ;314(7088):1203. PubMed


Voir en ligne : Recherche bibliographique médicale avec Medline/Pubmed (2/2)