IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Comprendre les jointures dans Access

De nombreuses questions ayant été posées sur le forum à propos des jointures (jointure équivalente, jointure externe, jointure interne, jointure gauche…) et de leur bon usage, il m'a paru bon de faire un petit rappel, ou un petit apprentissage, du fonctionnement interne des requêtes. Pour avoir une claire compréhension de l'incidence du type de jointure sur une requête, nous allons faire une série d'exercices. Il s'agira de requêtes, simples. À chaque fois, des questions seront posées : « Quel est le résultat attendu ? » ; « Quel est le résultat obtenu ? » et « Que pouvons-nous en déduire ? »

Ce cours est téléchargeable ici, dans un fichier au format pdf, zippé.

Article lu   fois.

L'auteur

Profil ProSite personnel

Liens sociaux

Viadeo Twitter Facebook Share on Google+   

I. Données de base

Afin de faciliter l'apprentissage de chacun, la base servant de référence dans ces exercices est la base fournie par défaut par Microsoft® lors de l'installation d'ACCESS, à savoir Comptoir.mdb.

II. Rappels fondamentaux

II-A. Les relations

ACCESS est un logiciel qui fait partie de la famille des SGBDR, c'est-à-dire des systèmes de gestion de bases de données relationnelles. La notion de relation est donc essentielle. Bien qu'il existe plusieurs types de relations, ACCESS ne gère que les relations de un à un, et les relations de un à plusieurs.

Pour créer une relation de un à un, il faut impérativement lier des champs ayant leur propriété "indexé" à "oui-sans doublon".

Pour créer une relation de un à plusieurs, il suffit de lier les champs entre eux.

D'habitude, la relation se fait d'une clé primaire vers une clé étrangère.

La clé primaire est le champ de la table qui sert d'identifiant à un enregistrement. Il s'agit d'un champ indexé sans doublon.

La clé étrangère est le champ de la table qui servira à matérialiser la relation avec la clé primaire. Il doit être de même taille et de même type de données que la clé primaire à laquelle il est lié.

NB : Il est possible de créer une clé primaire multichamp. Cependant, il n'est pas efficace de l'utiliser dans le cadre d'une relation. Une clé primaire multichamp sert surtout de règle de gestion pour les enregistrements. Elle empêche d'avoir deux enregistrements ayant les mêmes valeurs dans les champs de la clé primaire. On peut obtenir le même résultat avec un index multichamp, sans qu'il s'agisse d'une clé primaire.

II-B. L'intégrité référentielle

Il convient, lors de la création de la relation, d'appliquer l'intégrité référentielle. L'intégrité référentielle est un mécanisme de vérification qui s'assure que chaque clé étrangère est en correspondance avec sa clé primaire. Non seulement il vérifie l'intégrité des données écrites dans la clé étrangère, mais encore, il maintient cette intégrité en cas de modification ou de suppression de la clé primaire. En conséquence, lorsque l'intégrité référentielle est appliquée sur une relation, on ne devrait pas trouver, dans la clé étrangère, de données autres que celles de la clé primaire. Dès lors, bien que toutes les données figurant dans la table contenant la clé étrangère soient en relation avec les données de la table contenant la clé primaire, l'inverse n'est pas exact. Image non disponible

II-C. Les jointures

Sous ACCESS, comme d'ailleurs dans la plupart des SGBDR, il y a plusieurs types de jointures.

Le type de jointure par défaut est la jointure équivalente, qu'on qualifie également de jointure interne.

Il existe cependant deux autres types de jointure, la jointure gauche, et la jointure droite, qu'on qualifie également de jointures externes.

Examinons ensemble quelles en sont les influences à travers une série de requêtes simples.

III. Exercices

III-A. Cas d'une requête monotable

Créer une requête basée sur la table Clients.

Afficher le champ [Société].

Image non disponible En SQL on aurait :
 
Sélectionnez
SELECT Société
FROM Clients;

Quel est le résultat attendu ?

Aucun traitement particulier n'est effectué sur cette requête. Il devrait donc s'agir de l'affichage brut de la liste des champs [société] de la table des clients. Le nombre de lignes du résultat de la requête devrait donc correspondre au nombre de lignes dans la table.

Quel est le résultat obtenu ?

Image non disponible

Nous obtenons ici quatre-vingt-onze lignes.

Que pouvons-nous en déduire ?

Qu'il y a 91 clients. Pour s'en assurer il suffit de regarder le contenu de la table Clients.

III-B. Cas d'une requête multitable

Dans la requête précédente ajoutez la table Commandes. Nous allons maintenant examiner ce qui se passe lorsqu'on met dans une requête des tables qui ne servent à rien pour obtenir le résultat attendu.

Notez au passage la description automatique de la relation existante entre la table des clients et celle des commandes. ACCESS reprend ici l'ensemble des informations définies préalablement dans la fenêtre des relations. Il s'agit d'une relation un à plusieurs, telle qu'un client peut avoir plusieurs commandes, chaque commande n'ayant qu'un seul client.

Quel est le résultat attendu ?

Image non disponible En SQL on aurait :
 
Sélectionnez
SELECT Société
FROM Clients INNER JOIN Commandes
    ON Clients.[Code Client]=Commandes.[Code Client];

Puisqu'on continue à n'afficher que le champ [société], on s'attend logiquement à obtenir la liste des sociétés ayant des commandes, soit nos 91 lignes trouvées précédemment.

Quel est le résultat obtenu ?

Image non disponible

Nous obtenons maintenant 830 lignes.

Que pouvons-nous en déduire ?

La réponse qui nous vient à l'esprit immédiatement est : les 91 clients ont effectué 830 commandes.

Cependant, cette affirmation n'est pas obligatoirement exacte. Pourquoi ? Parce que la relation entre les deux tables est qualifiée de jointure équivalente. C'est-à-dire que cette requête travaille uniquement sur l'ensemble des associations possibles entre le champ [code client] de la table des clients et le champ [code client] de la table de Commandes. Mais se pourrait-il qu'il y ait des commandes n'ayant pas de clients référencés dans la base ? N'oublions pas la présence de l'intégrité référentielle dans cette relation. Comme nous l'avons vu précédemment, elle permet de s'assurer que pour une clé étrangère il y a toujours une clé primaire qui lui correspond. On peut donc dire qu'il y a effectivement 830 commandes, car nous sommes certains qu'il n'y a que des commandes liées à des clients.

En regardant attentivement le résultat de la requête, nous notons que le nom de la société apparaît à plusieurs reprises. Cela montre le nombre de relations possibles entre le client et la commande. Le nom de la société apparaît autant de fois que cette société a passé des commandes.

Notez bien ceci :
si l'intégrité référentielle n'avait pas été activée sur cette relation, ce nombre de 830 lignes ne pourrait pas signifier autre chose que 830 associations client-commandes. Il serait en effet possible qu'il y ait, dans la table des Commandes, des commandes ayant des codes client n'existant pas dans la table des clients.

III-C. Cas d'une requête sans relation

Admettons que nous cherchions à obtenir à nouveau les quatre-vingt-onze lignes de l'exercice numéro un, il semble que ce soit la relation qui nous empêche d'aboutir. La logique immédiate voudrait qu'on supprime cette relation. Alors, supprimons-la et voyons ce qui se passe.

Quel est le résultat attendu ?

Nous voudrions récupérer les quatre-vingt-onze lignes du départ. En effet, la grille indique que nous n'affichons que le champ [société] de la table des "clients".

Image non disponible En SQL on aurait :
 
Sélectionnez
SELECT Société
FROM Clients, Commandes ;

Quel est le résultat obtenu ?

Image non disponible

Il y a cette fois 75 530 lignes.

Que pouvons-nous en déduire ?

Que, sauf cas exceptionnel, il faudra toujours veiller à ce qu'il y ait des relations entre les différentes sources d'une requête. L'absence de l'une d'entre elles suffirait à réaliser un produit cartésien, c'est-à-dire l'association de chaque enregistrement d'une table à tous les enregistrements de l'autre table.

Ici ACCESS, n'ayant aucune indication des relations qu'il doit faire entre les clients et les commandes, va associer chacun des 91 clients avec les 830 commandes. Nous obtenons ainsi 91 X 830 = 75 530 lignes.

Cela ne correspond pas aux résultats attendus. Nous allons donc restaurer notre requête dans l'état précédent en supprimant la table Commandes et en la rajoutant à la requête. Nous nous retrouvons donc ici exactement dans le même état qu'à la fin de l'exercice numéro 2.

III-D. Cas d'une requête avec regroupement

Nous n'avons toujours pas réussi à récupérer les quatre-vingt-onze lignes du départ. En observant attentivement le résultat, comme nous l'avons dit précédemment, nous observons que le nom de la société apparaît plusieurs fois. Si nous parvenions à regrouper en une seule ligne toutes les occurrences d'un même nom de société, nous obtiendrions vraisemblablement les quatre-vingt-onze lignes attendues.

Faisons donc un clic sur le bouton sigma de notre barre d'outils. Cela fait apparaître une nouvelle ligne dans la grille. Il s'agit de la ligne opération.

Nous observons que l'opération sélectionnée est l'opération de regroupement.

Quel est le résultat attendu ?

Image non disponible
 
Sélectionnez
GROUP BY Société;

N. B. Une autre solution aurait été d'utiliser la Clause DISTINCT afin de n'afficher que les résultats uniques, ce qui aurait modifié le SQL ainsi :
 
Sélectionnez
SELECT DISTINCT Société
FROM Clients INNER JOIN Commandes
    ON Clients.[Code Client]=Commandes.[Code Client];

ACCESS devrait essayer de regrouper toutes les sociétés identiques pour n'en faire qu'une seule ligne, et nous devrions ainsi récupérer nos quatre-vingt-onze lignes du départ.

Quel est le résultat obtenu ?

Image non disponible

Nous obtenons cette fois seulement 89 lignes.

Que pouvons-nous en déduire ?

Premièrement, ayant regroupé sur les noms de société, il n'est pas impossible que nous ayons récupéré en une seule ligne au moins deux sociétés différentes de même nom. Il s'agit donc de s'assurer que chaque client apparaît bien dans sa ligne. Pour cela, rien ne vaut le regroupement sur une valeur unique et facilement identifiable, l'identifiant ou clé primaire.

Rajoutons donc dans notre requête le champ [code client] de la table Clients. L'opération est encore une fois l'opération de regroupement. Il s'agit en effet de l'opération par défaut. Décochons la case afficher, car, si le regroupement est utile, l'affichage du code ne nous est pas indispensable pour cet exercice.

Quel est le résultat obtenu ?

Cette fois, ACCESS devrait essayer de regrouper les identifiants des clients ainsi que leur société, de manière à créer des lignes dont l'association code client-société soit unique. Par conséquent, si plusieurs sociétés avaient le même nom, on devrait voir apparaître autant de lignes qu'il y a des clients différents, qu'ils aient ou n'aient pas le même nom de société.

Image non disponible

Nous obtenons toujours 89 lignes.

Que pouvons-nous en déduire ?

Cette fois nous sommes absolument certains qu'il s'agit bien de 89 clients différents.

Comme nous l'avons décrit à l'exercice numéro 2, le résultat de la jointure permet d'obtenir l'ensemble des associations possibles entre la table des clients et celle des commandes. Nous avons également déterminé avec certitude qu'il ne pouvait pas y avoir de commandes sans client. Cependant il est tout à fait probable qu'il existe des clients n'ayant passé aucune commande. Conscient de cela, et au vu des points examinés précédemment, nous en arrivons à la conclusion logique que nous avons deux clients n'ayant pas passé de commandes.

Étant donné le résultat que nous avons obtenu à l'heure actuelle, comment faire pour obtenir les quatre-vingt-onze lignes que nous avions au départ ? Le problème est ici le type de jointure qui est une jointure équivalente. Les associations ne sont que les associations permettant de joindre deux champs identiques.

III-E. Les types de jointures

Il existe plusieurs types de jointures sous ACCESS :

  • la jointure équivalente ;
  • la jointure gauche ;
  • la jointure droite.

Examinons la réaction de chacune d'entre elles.

Imaginons deux tables dans la plus simple expression : quelques champs, pas de clé primaire, pas d'index. Le champ de liaison est un champ de type texte un seul caractère. Traçons une relation du champ de liaison de la table 1 vers le champ de liaison de la table 2. Nous dirons ainsi que la table de gauche est la table 1, et que la table droite est la table 2. En effet, le côté gauche est le point d'origine de la relation, et le côté droit, son point d'arrivée. (Cette notion de gauche et droite n'a aucun rapport avec la position des tables dans la requête. Où seraient la gauche et la droite si les deux tables étaient l'une sur l'autre ? Tout dépend du tracé de la relation. Le côté gauche de la jointure est le point d'origine de la relation ; le côté droit son point d'arrivée.) Nous obtenons le schéma ci-dessous :

Image non disponible

Lorsque la requête va s'exécuter, elle cherchera à travailler sur le tableau résultant de cette relation à savoir l'association de tous les champs équivalents. Cela donnera la table suivante :

Image non disponible

Nous voyons bien que certains points de ces deux tables ne sont pas pris en compte dans la table de résultats. Par exemple, comment faire pour qu'apparaissent dans la table de résultats tous les champs de la table 1, donc de la table gauche. Il faut changer le type de jointure et la transformer en une jointure gauche. La table résultant d'une requête avec une jointure gauche sera semblable à la table suivante :

Image non disponible

Dans ce type de jointure nous obtenons une jointure équivalente plus tous les enregistrements orphelins (qui n'ont pu être liés) de la table de gauche, associés à des champs NULL.

Qu'en est-il de la jointure droite ? Il s'agit de l'inverse de la jointure gauche. Si la jointure que nous avions mise en œuvre était une jointure droite, la table résultant d'une telle requête serait la suivante :

Image non disponible

Cette fois, ce sont des champs de la table gauche que nous ne voyons plus. La jointure droite correspond à une jointure équivalente à laquelle on ajoutera tous les champs orphelins de la table droite, liés à des champs NULL.

III-F. Cas d'une requête avec jointure externe

Modifions le type de jointure.

Pour cela, il suffit de faire un double-clic sur la relation. Apparaît alors la fenêtre suivante :

Image non disponible

Les trois points mentionnés sont dans l'ordre de l'exposé ci-dessus :

  • 1 = jointure équivalente ;
  • 2 = jointure gauche ;
  • 3 = jointure droite.

Choisissons le point N° 2 (la jointure gauche) de manière à avoir l'ensemble des clients, avec et sans commande. Dans la grille d'Access, le résultat sera le suivant :

Image non disponible En SQL on aurait :
 
Sélectionnez
SELECT Société
FROM Clients LEFT JOIN Commandes
    ON Clients.[Code Client]=Commandes.[Code Client]
GROUP BY Société;

Dans notre cas si nous voulons visualiser tous les clients, même ceux n'ayant pas passé de commande, il faudra prendre la jointure gauche. En effet, la relation ayant été tracée depuis la table Clients vers la table Commandes, la table Clients est la table de gauche. Puisque nous voulons tous les clients, il faudra faire une jointure gauche.

Rappel : pour modifier le type de jointure, il suffit de faire un double-clic au milieu de la relation.

Quel est le résultat obtenu ?

Image non disponible

Nous obtenons cette fois les quatre-vingt-onze lignes attendues.

Que pouvons-nous en déduire ?

Que nous avons fini par récupérer les enregistrements de la table Clients qui ne sont pas liés à la table Commandes, tout en conservant chaque occurrence des clients ayant des commandes.

III-G. Cas d'une requête de non-correspondance

Maintenant que nous avons réussi à récupérer les 91 clients du départ la question qui se pose est : « Peut-on ne récupérer que les clients n'ayant pas passé de commande ? ».

La réponse est oui. Si nous revenons sur le tableau vu dans l'exercice précédent, nous observons qu'il est facile d'identifier les enregistrements dont les jointures ne sont pas équivalentes. Dans notre cas lorsque les enregistrements joints n'ont pas de données équivalentes dans la table de côté commandes, ils sont tous mis à NULL. Si ce sont ces derniers que nous cherchons à récupérer, il suffit de déterminer un critère NULL sur un champ qui ne devrait pas l'être (par exemple la clé externe ou un identifiant, une clé primaire).

Dans notre cas nous allons descendre dans notre requête, le Code Client qui est la clé étrangère de la table Commandes.

Quel est le résultat attendu ?

Image non disponible En SQL on aurait :
 
Sélectionnez
SELECT Société
FROM Clients LEFT JOIN Commandes
    ON Clients.[Code Client]=Commandes.[Code Client]
WHERE Commandes.[Code Client] Is NULL;

Nous devrions obtenir deux lignes contenant le nom de la société.

Quel est le résultat obtenu ?

Image non disponible

Nous obtenons les deux lignes clients attendues. Ces dernières correspondent aux deux clients n'ayant pas passé de commandes.

Nous venons de créer une requête de non-correspondance.

IV. En conclusion

Cette petite série d'exercices vous aura permis certainement de toucher du doigt la subtilité des types de jointure, et l'importance des relations dans une requête.

  • Lorsqu'une requête est faite sur une seule table, il faut faire attention aux champs sur lesquels on demande un regroupement.
  • Notez que pour identifier un enregistrement, il est toujours préférable de faire apparaître la clé primaire.
  • Lorsqu'une requête est faite sur plusieurs tables, il faut, sauf cas exceptionnel, veiller à ce que toutes les tables soient liées entre elles. En cas contraire nous aurions un produit cartésien.
  • Par défaut les jointures sont équivalentes. Cela signifie que certains enregistrements peuvent "disparaître". Il faut changer le type de jointure pour qu'ils puissent réapparaître.
  • Sur ACCESS, les types de jointures sont : équivalente (par défaut), gauche ou droite. On ne peut pas, en une seule requête, récupérer les champs non joints des deux tables.

V. Remarque

Lorsqu'on change le type de jointure en jointure gauche ou droite, la symbolique dans la grille de la requête change. Il y a maintenant une petite flèche d'un des deux côtés. Si votre requête fait référence à plus d'une table, à partir du premier changement de type de jointure, toutes les tables devant être liées avec des jointures externes, les petites flèches montrant toujours la même direction.

Illustrons cela par un exemple :

imaginons un instant que vous souhaitiez obtenir le chiffre d'affaires total par client pour tous les clients. Les tables nécessaires seront :

  • Clients ;
  • Commandes ;
  • Détails Commandes.

Faire une jointure gauche entre Clients et Commandes, tout en laissant une jointure équivalente entre Commandes et Détails Commandes provoquera systématiquement une erreur dans le type de jointure. En effet, des enregistrements NULL étant vraisemblablement présents du côté de la table Commandes, la liaison vers la table des détails est impossible à schématiser. Il faut donc poursuivre la relation en faisant aussi une jointure gauche entre Commandes et Détails Commandes. Cette fois, il n'y aura plus d'erreur, et les résultats de la requête pourront s'afficher.

VI. Autotest

Avez-vous bien compris ?

Je vais vous donner ici l'occasion de vous tester. Essayer de réaliser la demande suivante :

Je souhaite avoir un tableau me permettant de suivre les mouvements attachés à mes fournisseurs. Certains Fournisseurs (au sens 'enregistrements de la table Fournisseurs') sont peut-être enregistrés dans la table Fournisseurs, mais, pour le moment du moins, je n'ai référencé aucun de leurs produits.

Il est aussi possible que, sur la quantité des produits référencés dans la base, certains ne se vendent pas du tout. Auquel cas, en poussant loin, il est possible d'imaginer un fournisseur ayant des produits référencés, et pourtant, sur ce fournisseur, je ne génère aucun chiffre d'affaires.

J'aimerais donc que vous essayiez de construire la requête suivante :

Image non disponible

Explication de chaque colonne retournée :

  • N° Fournisseur : il s'agit du Code, de l'identifiant du fournisseur que je veux visualiser. Cet identifiant ne doit apparaître qu'une seule fois dans cette requête, car vous devez faire en sorte qu'il n'y ait qu'une seule ligne par fournisseur ;
  • Société : correspond au nom de la société attachée au N° Fournisseur correspondant ;
  • NbProds : correspond au nombre de références produits que j'ai dans la table des produits, pour ce fournisseur-là. En d'autres termes, c'est le nombre de produits référencés sur le fournisseur ;
  • NbCommandés : correspond au nombre de références produits différentes qui apparaissent dans les commandes. Ce nombre peut donc être, au maximum, égal à NbProds ;
  • CA : vous l'avez certainement compris, vous avez là le CA réalisé sur les produits du fournisseur. Il correspond donc au résultat des ventes des produits du fournisseur ;
  • CAMoyen : cet élément-là reprend la notion de CA. Mais ce qui m'intéresse ici, est de connaïtre le CA moyen par commande, réalisé par fournisseur. Il conviendra donc de faire la moyenne des CA de chaque commande dans lesquelles des produits du fournnisseur apparaissent, et ce, seulement sur les produits du fournisseur.

Bon... et bien maintenant, c'est à vous.

Il m'est avis que vous ne pourrez pas réaliser cela en une seule requête.

PS : dernier 'petit truc' : Pour tester que votre requête fonctionne, ajoutez donc un fournisseur ; il devrait apparaître même s'il n'y a pas de produit. Puis recommencer l'expérience sur un nouveau produit. En effet, actuellement, tous les produits sont commandés. Il n'y a donc pas d'écart entre NbProds et NbCommandés.

Vous avez aimé ce tutoriel ? Alors partagez-le en cliquant sur les boutons suivants : Viadeo Twitter Facebook Share on Google+   

Les sources présentées sur cette page sont libres de droits et vous pouvez les utiliser à votre convenance. Par contre, la page de présentation constitue une œuvre intellectuelle protégée par les droits d'auteur. Copyright © 2013 Maxence HUBICHE. Aucune reproduction, même partielle, ne peut être faite de ce site ni de l'ensemble de son contenu : textes, documents, images, etc. sans l'autorisation expresse de l'auteur. Sinon vous encourez selon la loi jusqu'à trois ans de prison et jusqu'à 300 000 € de dommages et intérêts.