Nous sommes tous passés par là: vous tapez le nom d'un site Web dans la barre d'adresse de votre navigateur préféré, ou vous cliquez peut-être sur le résultat d'une recherche Google. Puis soudain, une chaîne de mots et de symboles apparemment aléatoires apparaît à la fin de l'URL du site. Bien sûr, vous ne savez pas pourquoi il est là, mais vous êtes heureux de consulter en toute sécurité les listes Amazon, les résultats de recherche Google ou tout autre site Web que vous choisissez.
Cela peut ressembler à du charabia pour un œil non averti, mais chaque caractère d'une URL a un but. Décomposons l'anatomie d'une URL de site Web, du protocole à la chaîne de requête.
Les 5 composants clés d'une URL
Une URL peut être découpée en trois parties principales: le protocole, le nom de domaine et le chemin. Vous pouvez ensuite ajouter une chaîne de requête ou devenir fantaisiste avec une balise d'ancrage.
1. Protocole
Le premier composant d'une URL est le protocole. C'est la méthode utilisée pour accéder à une ressource sur Internet. Le protocole le plus courant pour la navigation sur le Web est HTTP (Hypertext Transfer Protocol). Il envoie une demande du navigateur de l'utilisateur au serveur hébergeant le site Web, et le serveur renvoie ensuite la ressource demandée en réponse.
HTTP a une version sécurisée appelée HTTPS (HTTP Secure), qui utilise le cryptage pour ajouter une couche de sécurité supplémentaire. HTTPS est utilisé lorsque des données sensibles, telles que des mots de passe ou des informations de carte de crédit, sont transmises sur Internet. Votre site Web a besoin d'un certificat SSL d'utiliser le protocole HTTPS dans ses URL.
2. Nom de domaine
Le nom de domaine est l'identifiant unique d'un site Web sur Internet. Il comprend deux parties: le domaine de premier niveau (TLD) et le domaine de second niveau. Le TLD indique la catégorie du site Web, comme .com pour les sites Web commerciaux, .edu pour les établissements d'enseignement et .org pour les organisations à but non lucratif. Le domaine de second niveau est le nom unique choisi par le propriétaire du site Web.
Par exemple, dans le nom de domaine www.makeuseof.com, "makeuseof" est le domaine de second niveau, et '".com" est le TLD. Les noms de domaine sont enregistrés auprès des registraires de domaine et peuvent être achetés pour une période déterminée, généralement un an, mais parfois plus.
3. Chemin
Le chemin d'URL spécifie l'emplacement d'une ressource sur un site Web. Il vient généralement après le nom de domaine et commence par une barre oblique (/). Le chemin est utilisé pour organiser le contenu d'un site Web et faciliter la navigation des utilisateurs.
Par exemple, dans l'URL www.example.com/blog/post1, "blog" est le répertoire qui contient les articles de blog et "post1" est l'article de blog spécifique. Le chemin peut également être utilisé pour l'optimisation des moteurs de recherche (SEO) en incluant des mots-clés pertinents.
4. Chaîne de requête
La chaîne de requête fait partie de l'URL qui commence par un point d'interrogation (?) et contient des paires clé-valeur séparées par une esperluette (&). Il est utilisé pour transmettre des données entre les pages Web et peut contenir des informations telles que les termes de recherche ou les préférences de l'utilisateur.
Par exemple, dans l'URL www.example.com/search? q=example&category=books, la chaîne de requête contient deux paires clé-valeur: "q=example" indique que le terme de recherche est "example" et "category=books" indique que la recherche porte sur des livres. Vous verrez généralement des chaînes de requête contenant une pile de paramètres de recherche lorsque vous naviguez sur des sites Web qui vous permettent de filtrer vos résultats de recherche ou sur des sites Web qui souhaitent capturer des données de suivi.
5. Balise d'ancrage
Une balise d'ancrage est un identifiant de fragment qui vient après l'URL et commence par un symbole dièse (#). Il établit un lien vers une partie spécifique d'une page Web et peut être utilisé pour créer une table des matières ou pour créer un lien vers une section particulière d'un long article.
Par exemple, dans un guide de 5 000 mots, l'auteur peut inclure un menu de navigation pour décomposer le contenu :
- Définitions
- Histoire
- Défis de l'industrie
- FAQ
Si vous survolez l'un de ces liens, l'URL peut contenir une balise d'ancrage, telle que "#definitions", qui signale au navigateur de faire défiler jusqu'à la section avec cet ID dans le code HTML.
Qu'est-ce que l'encodage d'URL?
Les URL comprennent des caractères du jeu de caractères ASCII, un sous-ensemble du jeu de caractères Unicode. Unicode est une norme internationale de codage pour les caractères dans différentes langues et alphabets. Lorsqu'un caractère en dehors du jeu de caractères ASCII est utilisé dans une URL, il doit être encodé pour s'assurer que le navigateur le comprend correctement.
Le codage d'URL est le processus de conversion des caractères en dehors du jeu de caractères ASCII en leur équivalent ASCII. Par exemple, le caractère Unicode 'é' serait codé comme '%e9'. Le codage d'URL est également utilisé pour les caractères spéciaux tels que les espaces, qui sont codés en tant que '+' ou '%20'.
Ne vous souciez pas de mémoriser toutes les combinaisons d'encodage possibles. Le Référence d'encodage d'URL W3Schools guide est une ressource pratique pour ce sujet.
Que sont les redirections d'URL?
Parfois, lorsque vous saisissez une URL dans la barre d'adresse de votre navigateur, la page Web redirige vers une autre page Web. En effet, il existe plusieurs façons de structurer les URL, et certaines d'entre elles peuvent ne pas fonctionner comme prévu. Lorsque cela se produit, le serveur répond avec un code d'état HTTP indiquant qu'il doit rediriger vers une autre URL (généralement 301 ou 302). Le nouvel emplacement peut ensuite être spécifié dans l'en-tête de réponse.
Les codes d'état et leur signification incluent :
- 200 - OK: La demande a été acceptée.
- 301 Déménagé Définitivement: La ressource demandée a été définitivement déplacée vers un nouvel emplacement et devrait être récupérée à partir de là dans les demandes futures.
- 302 - Trouvé (redirection temporaire) : Cela indique que la page est temporairement située à une URL différente et ne doit pas être mise en cache par les moteurs de recherche ou utilisée comme source d'informations faisant autorité sur son contenu. Il peut également indiquer la maintenance du serveur, où les pages sont redirigées pendant que les mises à jour sont en cours ou lorsque les pages de destination doivent proposer des URL alternatives à des fins de suivi telles que les tests A/B ou le fractionnement essais.
Les codes d'état ci-dessus sont spécifiques à la validité de l'URL elle-même, et vous ne saurez probablement même pas qu'ils existent lorsque vous consultez avec désinvolture un site Web fonctionnel.
Cependant, lorsque des problèmes avec l'URL, le site Web ou le fournisseur d'hébergement Web sous-jacent surviennent, vous verrez l'un des différents ensembles de codes :
- 403 - Interdit : Cela indique que vous n'êtes pas autorisé à afficher la page Web. Cela peut être dû à des autorisations incorrectes ou à un manque d'informations d'authentification.
- 404 - Non trouvé : Cela indique que la ressource demandée n'existe pas sur le serveur et doit être supprimée de tous les signets ou pages de résultats des moteurs de recherche (SERP).
- 500+ - Erreurs de serveur : Ceux-ci indiquent qu'une erreur s'est produite lors du traitement de votre demande et est généralement causée par un problème de configuration du serveur, tel que des erreurs de codage dans les scripts, des problèmes de base de données, etc.
Les erreurs de site Web peuvent être ennuyeuses, mais ne sont pas la fin du monde. Tout d'abord, essayez une actualisation forcée de la page Web. Ensuite, vérifiez votre barre d'adresse pour les erreurs d'origine humaine. Avez-vous ajouté une lettre? La marque épelle-t-elle l'un des mots de manière non conventionnelle? Votre chat a traversé le clavier? Si aucune des solutions ci-dessus ne fonctionne et qu'il s'agit de votre site Web, contactez votre hébergeur. Malheureusement, si le site Web appartient à quelqu'un d'autre, vous devrez attendre.
Comprendre les URL des protocoles aux chemins
Une URL est composée de nombreux composants qui servent chacun un objectif. En comprenant l'anatomie d'une URL, vous pouvez naviguer plus facilement sur les sites Web et tirer le meilleur parti des fonctionnalités disponibles. Qu'il s'agisse de rechercher des informations ou d'effectuer des achats en ligne, comprendre les URL peut vous aider à tirer le meilleur parti du Web.