Comprendre l'URL

Article écrit par : sandy

Catégorie(s) de cet article : - La conception de site web

Mot(s)-clef(s) de cet article : - Vocabulaire

Introduction

URL est un acronyme qui signifie Uniform resource Locator (localisateur uniforme de ressource).

C'est une chaîne de texte qui indique où se trouve une page web (ressource), une image ou une vidéo sur le web (adresse web) et elle est unique. Mais ce n'est pas tout, elle permet aussi le transfert de fichiers (FTP), les e-mails (SMTP) et d'autres applications. En fait, c'est une notion très importante de l' internet.

Fonctionnement d'une URL

Le navigateur web a besoin de l'adresse IP pour trouver le site auquel l'utilisateur veut accéder.
Dans ce but, il va segmenter l'URL que vous lui avez donné pour découvrir le « nom de domaine ». Le nom de domaine ne lui permet pas de trouver un site web, mais il va lui permettre de retrouver l'adresse IP. Pour ce faire, il va s'adresser à un DNS (Domain Name System) qui est une sorte de grand annuaire de l'internet qui met en corrélation les noms de domaine et les IP. Le DNS va donc lui renvoyer cette adresse IP.

Une fois que votre navigateur internet à l'adresse IP, il va pouvoir se connecter au serveur qui héberge le site web. Pour dialoguer avec ce serveur, il va utiliser le protocole TCP (Transmission Control Protocol).

Et tout cela ne prend que quelques millisecondes, en principe.

Composants d'une URL

Les URL sont composées :
- du protocole HTTP (Hypertext Transfer Protocol) / HTTPS (Hypertext Transfer Protocol Secure) ;
- du nom de domaine ;
- des chemins d'accès (optionnel) ;
- des paramètres (optionnel).

le protocole est séparé du reste de l'URL par : « :// » (deux points et deux barres obliques). Le nom de domaine est séparé du reste de l'URL par un « / ».

On peut donc avoir une URL qui s'écrit de cette façon :

protocole://nom de domaine:port/chemin?requête#fragment

Les protocoles

Pour ouvrir une page web ou une ressource, on va utiliser « HTTPS » principalement, mais il existe d'autres protocoles comme « mailto: » ou « ftp: ». Le premier permet d'ouvrir un client de messagerie électronique, par exemple Thunderbird. Le second permet le transfert de fichiers.

Le nom de domaine

On dit aussi « nom d'hôte » en français et « host-name » en anglais. Le nom de domaine (Domain name) est un identifiant qui regroupe des ressources ayant des points communs.
Il existe une hiérarchie, des niveaux dans les domaines et on peut les voir dans votre URL.
Dans l'adresse web suivante, on trouve trois niveaux :

www.eridiane.fr

- .fr : c'est le domaine de premier niveau. On dit aussi « extension de nom de domaine (ou TLD, top-level domain) ;
- eridiane : c'est le domaine de deuxième niveau et c'est le nom du site ;
- www : c'est le domaine de troisième niveau, il signifie « World Wide Web » et il peut être optionnel.
Il existe des sites avec des sous-domaines comme :

https://web.developpez.com
« web » est un sous-domaine du site « developpez.com ». Il est séparé du nom de domaine par un point.

Voici une URL dirigeant vers le nom de domaine qui est souvent la page d'accueil du site :

https://eridiane.fr

Vous allez avoir le protocole `https`, la séparation « :// » puis le nom de domaine.

https://darktable.gitlab.io/doc/fr/darktable_basic_workflow.html
Dans cette URL, vous allez retrouver le protocole « https », la séparation « :// », le sous-domaine « darktable », le nom de domaine « gitlab.io », le chemin d'accès à la page web « /doc/fr/ » et le nom de la page web avec son extension. On sait ainsi que la page est en html.

Le port

Il sert à identifier le port spécifique d'un serveur auquel le navigateur web va se connecter. Cela permet d'attribuer de manière ciblée les données envoyées.
Disons pour simplifier que cela permet de ne pas saturer votre système si vous faites plusieurs actions sur votre ordinateur comme lire vos mails, regarder une vidéo en streaming, etc.
Le port par défaut dans une URL est le port 80 pour un protocole HTTP et 443 pour un protocole HTTPS. Bien souvent, vous ne les voyez pas, car ce sont les ports standards. Mais les développeurs peuvent avoir besoin d'utiliser d'autres ports.

Exemple :

https://eridiane.fr:443/comprendre-internet

ou encore, très utilisé pat les développeurs web :

http://localhost:80/

Le slug

Le « slug » (n'essayez pas de traduire ce mot...) est la partie qui suit généralement le nom de domaine ou les répertoires. Elle permet d'identifier une page web. Cela peut être un article, une catégorie, une page sur un mot-clef, etc.

https://eridiane.fr/comprendre-internet

Dans ce cas de figure, on a un article qui au lieu de s'appeler « comprendre-l-internet.php » va s'appeler « comprendre-internet ». J'aurais pu sans problème l'appeler autrement. Cette adresse web particulière est aussi appelé un « permalien ». Ce terme est très répandu dans la documentation du gestionnaire de contenu Wordpress. C'est une notion importante quand on fait du SEO (Search Engine Optimization) car il va permettre d'utiliser des mots-clefs dans l'URL que les moteurs de recherche et autres robots vont analyser.

Un exemple d'URL que vous pouvez retrouver sur ce site :

https://eridiane.fr/pages/articles

Vous avez le protocole, la séparation, et le chemin d'accès, mais il ne semble pas complet, et où se trouve l'extension du fichier ? En fait, « articles » est un slug.

Dans ce cas de figure, on utilise la ré-écriture d'URL et j'en parlerai dans un autre article, sachez simplement que cela permet d'avoir des URL plus sympathiques, utile pour le SEO et qui vont plus facilement servir pour la partie Back (serveur). Sur Eridiane, j'utilise Apache pour la ré-écriture de l'URL (URL Rewriting).
Il en va de même si vous faites une recherche sur la page d'archive : les paramètres sont bien envoyés au serveur, mais l'utilisateur ne les voit pas.

Les paramètres ou requêtes

Les paramètres, ou chaînes de requête, sont très courants sur les sites internet, et permettent de passer des données, des informations au serveur. Par exemple, vous pouvez demander d'afficher certaines pages via un formulaire.

Pour afficher une requête dans une URL, on va placer un « ? » puis on va utiliser des paires clé/valeur séparées par le signe « = ». Si vous avez plusieurs paires de données, alors on va utilise le signe « & » (esperluette).

Cela va donner par exemple :

https://eridiane.fr/pages/articles?nbre=7
ou encore :

https://eridiane.fr/pages/articles?nbre=7&article=web

Les ancres

Nous pouvons vouloir n'accéder qu'à une partie d'une page web. Bien souvent, il s'agit d'un paragraphe avec un titre. Pour ce faire, nous allons utiliser le symbole dièse « # » et on appelle cela une ancre ou encore un identifiant de fragment. Il est très fréquemment en corrélation avec le HTML et la notion d' « id ». Cela fera l'objet d'un article spécifique.

Par exemple :

https://darktable.fr/quest-ce-que-darktable/#ce-que-darktable-ne-fait-pas

Les Caractères non autorisés

Certains caractères, comme les espaces, ne sont pas autorisés dans les URL et doivent être encodés. Pour information, il s'agit de la norme RFC 1738: Uniform Resource Locators (URL). Voici une liste des codes d'encodage qui peuvent être utilisés dans une URL : Caractères interdits dans les URL (RFC 1738). Il existe aussi un encodeur en ligne : Outil d'Encodage d'URL - Encoder pour les Standards Web.

Selon le langage de programmation que vous utilisez, il peut exister des fonctions pour l'encodage et le décodage. Par exemple, pour encoder en PHP, on peut utiliser la fonction Rawurlencode de PHP.

L'erreur 404

Lorsqu'une URL pointe vers une ressource qui n'existe pas ou qui a été déplacée, nous allons obtenir une erreur HTTP 404 envoyé par le serveur. C'est un sujet qui peut devenir assez complexe surtout lorsqu'on fait intervenir le SEO et cela fera aussi partie d'un article sur le sujet.

Les commentaires

Il n'y a pas encore de commentaire, mais cela ne serait tarder ...

Ajouter un commentaire :

Qu'est-ce que vaut 9 + 5 ?

Nom

commentaire

Tous les champs sont obligatoires.
Un français correct est de rigueur. Exemple : pas de langage sms.

Thèmes abordés:

tutoriels, exercices de code

Logiciels

Le site Eridiane

Langages de programmation

La conception de site web

Conférences - colloques

Vous souhaitez rester informés ?

Oui ! Je souhaite recevoir la lettre d'informations!