Le streaming en 4K est la nouvelle norme, mais avec des informations pour plus de 8,2 millions de pixels transmises toutes les 16 millisecondes, stocker et transmettre des vidéos 4K sur Internet n'est pas une tâche facile.
Un film de deux heures occuperait plus de 1,7 téraoctets de stockage lorsqu'il n'est pas compressé. Alors, comment les géants du streaming comme YouTube et Netflix parviennent-ils à stocker et diffuser des vidéos qui prennent autant de place ?
Eh bien, ils ne le font pas parce qu'ils utilisent des codecs vidéo pour réduire la taille des films, mais qu'est-ce qu'un codec vidéo et lequel est le meilleur ?
Qu'est-ce qu'un codec vidéo ?
Avant de plonger dans les complexités des codecs vidéo, il est essentiel de comprendre comment une vidéo est créée. En termes simples, la vidéo n'est rien d'autre qu'un ensemble d'images fixes qui se remplacent rapidement.
En raison de cette vitesse de changement élevée, le cerveau humain pense que les images bougent, créant l'illusion de regarder une vidéo. Par conséquent, lorsque vous regardez une vidéo en 4K, vous regardez simplement un ensemble d'images avec une résolution de 2160x3840. Cette haute résolution d'images permet à une vidéo tournée en 4K d'offrir une expérience vidéo exceptionnelle. Cela dit, cette haute résolution d'images augmente la taille de la vidéo, ce qui rend impossible la diffusion sur des canaux à bande passante limitée, comme Internet.
Pour résoudre ce problème, nous avons des codecs vidéo. Abréviation de codeur/décodeur ou compression/décompression, un codec vidéo comprime le flux d'images en bits de données. Cette compression peut soit réduire la qualité de la vidéo, soit n'avoir aucun effet sur celle-ci en fonction des algorithmes de compression utilisés.
Comme son nom l'indique, le bit de compression dans un codec réduit la taille de chaque image. Pour faire de même, l'algorithme de compression exploite les nuances de l'œil humain, empêchant les gens de savoir que les vidéos qu'ils regardent sont compressées.
La décompression, au contraire, fonctionne de manière opposée et restitue la vidéo en utilisant les informations compressées.
Bien que les codecs fassent un excellent travail lorsqu'il s'agit de compresser des informations, effectuer la même chose peut être éprouvant pour votre processeur. Pour cette raison, il est normal de voir des fluctuations dans les performances du système lorsque vous exécutez des algorithmes de compression vidéo sur votre système.
Pour résoudre ce problème, les processeurs et les GPU sont équipés d'un matériel spécial capable d'exécuter ces algorithmes de compression. Permettre au processeur d'effectuer les tâches à accomplir pendant que le matériel dédié traite les codecs vidéo, améliorant ainsi l'efficacité.
Comment fonctionne un codec vidéo ?
Maintenant que nous avons une compréhension de base de ce que fait un codec vidéo, nous pouvons voir comment fonctionne un codec.
Sous-échantillonnage de la chrominance
Comme expliqué précédemment, les vidéos sont constituées d'images et le sous-échantillonnage de la chrominance réduit les informations de chaque image. Pour ce faire, il réduit les informations de couleur contenues dans chaque image, mais comment cette réduction des informations de couleur est-elle détectée par l'œil humain ?
Eh bien, voyez-vous, les yeux humains sont excellents pour détecter les changements de luminosité, mais on ne peut pas en dire autant des couleurs. En effet, l'œil humain a plus de bâtonnets (cellules photoréceptrices responsables de la détection des changements de luminosité) que de cônes (cellules photoréceptrices responsables de la différenciation des couleurs). La différence entre les bâtonnets et les cônes empêche les yeux de détecter les changements de couleur lors de la comparaison d'images compressées et non compressées.
Pour effectuer un sous-échantillonnage de chrominance, l'algorithme de compression vidéo convertit les informations de pixel en RVB en données de luminosité et de couleur. Après cela, l'algorithme réduit la quantité de couleur dans l'image en fonction des niveaux de compression.
Suppression des informations de trame redondantes
Les vidéos sont composées de plusieurs cadres d'images et, dans la plupart des cas, tous ces cadres contiennent les mêmes informations. Par exemple, imaginez une vidéo avec une personne parlant sur un arrière-plan fixe. Dans un tel cas, toutes les images de la vidéo ont une composition similaire. Par conséquent, toutes les images ne sont pas nécessaires pour rendre la vidéo. Tout ce dont nous avons besoin est une image de base qui contient toutes les informations et les données liées au changement lors du passage d'une image à l'autre.
Par conséquent, pour réduire la taille de la vidéo, l'algorithme de compression divise les images vidéo en images I et P (images prédites). Ici, les cadres I sont la vérité terrain et sont utilisés pour créer des cadres P. Les trames P sont ensuite rendues en utilisant les informations contenues dans les trames I et les informations de changement pour cette trame particulière. En utilisant cette méthodologie, une vidéo est décomposée en un ensemble d'images I entrelacées en images P comprimant davantage la vidéo.
Compression de mouvement
Maintenant que nous avons divisé la vidéo en images I et P, nous devons examiner la compression de mouvement. Une partie de l'algorithme de compression vidéo qui aide à créer les images P à l'aide des images I. Pour ce faire, l'algorithme de compression décompose la trame I en blocs appelés macro-blocs. Ces blocs reçoivent ensuite des vecteurs de mouvement qui définissent la direction dans laquelle ces blocs se déplacent lors de la transition d'une trame à une autre.
Ces informations de mouvement pour chaque bloc aident l'algorithme de compression vidéo à prédire l'emplacement de chaque bloc dans une image à venir.
Suppression des données d'image haute fréquence
Tout comme les changements dans les données de couleur, l'œil humain ne peut pas détecter les changements subtils dans les éléments haute fréquence d'une image, mais que sont les éléments haute fréquence? Eh bien, voyez-vous, l'image rendue sur votre écran comprend plusieurs pixels, et les valeurs de ces pixels changent en fonction de l'image affichée.
Dans certaines zones de l'image, les valeurs des pixels changent progressivement et ces zones sont dites avoir une basse fréquence. D'autre part, s'il y a un changement rapide dans les données de pixel, la zone est classée comme ayant des données à haute fréquence. Les algorithmes de compression vidéo utilisent la transformation discrète en cosinus pour réduire la composante haute fréquence.
Voici comment cela fonctionne. Tout d'abord, l'algorithme DCT s'exécute sur chaque macro-bloc puis détecte les zones où le changement d'intensité des pixels est très rapide. Il supprime ensuite ces points de données de l'image, ce qui réduit la taille de la vidéo.
Codage
Maintenant que toutes les informations redondantes de la vidéo ont été supprimées, nous pouvons stocker les bits de données restants. Pour ce faire, l'algorithme de compression vidéo utilise un schéma d'encodage tel que l'encodage Huffman, qui relie tous les bits de données dans une image au nombre de fois où ils se produisent dans la vidéo, puis les relie de manière arborescente. Ces données codées sont stockées sur un système, ce qui lui permet de restituer facilement une vidéo.
Différents codecs vidéo utilisent différentes techniques pour compresser les vidéos, mais à un niveau très basique, ils utilisent les cinq méthodes fondamentales définies ci-dessus pour réduire la taille des vidéos.
AV1 contre HEVC contre VP9: quel codec est le meilleur ?
Maintenant que nous comprenons le fonctionnement des codecs, nous pouvons déterminer lequel est le meilleur parmi AV1, HEVC et VP9.
Compressibilité et qualité
Si vous avez une vidéo 4K qui occupe beaucoup d'espace sur votre système et que vous ne pouvez pas la télécharger sur votre plate-forme de streaming préférée, vous recherchez peut-être un codec vidéo qui offre la meilleure compression rapport. Cependant, vous devez également tenir compte du fait que la qualité qu'il offre diminue à mesure que vous continuez à compresser la vidéo. Par conséquent, lors de la sélection d'un algorithme de compression, il est essentiel d'examiner la qualité qu'il offre à un débit particulier, mais qu'est-ce que le débit d'une vidéo ?
En termes simples, le débit binaire d'une vidéo est défini comme le nombre de bits dont la vidéo a besoin pour être lue pendant une seconde. Par exemple, une vidéo 4K non compressée 24 bits fonctionnant à 60 images a un débit binaire de 11,9 Gb/s. Par conséquent, si vous diffusez une vidéo 4K non compressée sur Internet, votre Wi-Fi doit fournir 11,9 gigabits de données par seconde, ce qui épuise votre quota de données mensuel en quelques minutes.
L'utilisation d'un algorithme de compression, au contraire, réduit le débit à une très petite quantité en fonction du débit de votre choix sans dégrader la qualité.
En ce qui concerne les chiffres de compressibilité/qualité, AV1 est en tête du peloton et offre 28,1 % de mieux compression par rapport à H.265 et 27,3 % d'économie par rapport à VP9 tout en offrant des performances similaires qualité.
Par conséquent, si vous recherchez la meilleure compression sans dégradation de la qualité, AV1 est le taux de compression qu'il vous faut. En raison de l'excellent rapport compression/qualité du codec AV1, il est utilisé par Google dans ses application de visioconférence Google Duo et par Netflix lors de la transmission vidéo sur une connexion de données à faible bande passante.
Compatibilité
Comme expliqué précédemment, un algorithme de compression vidéo encode une vidéo une fois qu'elle est compressée. Maintenant, pour lire cette vidéo, votre appareil doit décoder la même chose. Par conséquent, si votre appareil ne dispose pas du support matériel/logiciel pour décompresser une vidéo, il ne pourra pas l'exécuter.
Par conséquent, il est important de comprendre l'aspect compatibilité d'un algorithme de compression, car à quoi bon créer et compresser du contenu qui ne peut pas s'exécuter sur de nombreux appareils ?
Donc, si la compatibilité est quelque chose que vous recherchez, alors VP9 devrait être le codec pour vous car il est pris en charge sur plus de deux milliards de terminaux et peut s'exécuter sur tous les navigateurs, smartphones et smart LA TÉLÉ.
On ne peut pas en dire autant de AV1 car il utilise des algorithmes plus récents et plus complexes pour réduire la taille du fichier d'une vidéo et ne peut pas être lu sur des appareils plus anciens. En ce qui concerne la prise en charge des navigateurs, Safari ne peut pas lire AV1, mais des navigateurs comme Firefox et Chrome peuvent lire des vidéos AV1 sans aucun problème.
En termes de support matériel, de nouveaux SoC et GPU comme le Snapdragon 8 Gen 2, Samsung Exynos 2200, MediaTek Dimensity 1000 5G, Google Tensor G2, la série RTX 4000 de Nvidia et les GPU Intel Xe et Arc prennent en charge le décodage matériel accéléré pour le codec AV1. Par conséquent, si vous possédez des appareils alimentés par ces chipsets, vous pouvez profiter du contenu en streaming compressé à l'aide des codecs AV1 sans épuiser la puissance de vos CPU/GPU.
En ce qui concerne le codec H.265, les navigateurs les plus populaires tels que Safari, Firefox et Google Chrome peuvent exécuter des vidéos encodées à l'aide de l'algorithme de compression sans aucun problème. Cela dit, comparé à AV1 et VP9, H.265 n'est pas open source et des licences doivent être achetées pour utiliser le codec H.265. Pour cette raison, des applications telles que le lecteur vidéo Movies & TV de Microsoft, fournies avec le système d'exploitation, ne peuvent pas exécuter de vidéos encodées à l'aide de H.265 par défaut. Au lieu de cela, les utilisateurs doivent installer des modules complémentaires supplémentaires à partir du magasin Windows pour exécuter de telles vidéos.
Vitesse d'encodage
Les codecs vidéo réduisent considérablement la taille d'une vidéo, mais pour réduire la taille d'une vidéo, la vidéo non compressée doit être traitée à l'aide d'un logiciel, ce qui prend du temps. Par conséquent, si vous souhaitez réduire la taille d'une vidéo, vous devez regarder le temps nécessaire pour compresser la vidéo à l'aide d'un algorithme de compression.
En ce qui concerne l'efficacité de l'encodage, VP9 est en tête du peloton et le temps d'encodage pour la compression des vidéos est bien inférieur à H.265 et AV1. AV1, d'autre part, est le plus lent en temps d'encodage et peut prendre plus de trois fois plus de temps pour encoder une vidéo par rapport à H.265.
Quel codec choisir ?
En ce qui concerne les codecs vidéo, trouver le codec parfait est très subjectif, car chaque codec offre des fonctionnalités différentes.
Si vous recherchez la meilleure qualité vidéo, optez pour AV1. D'autre part, si vous recherchez le codec vidéo le plus compatible, VP9 serait la meilleure solution pour vous.
Enfin, le codec H.265 convient parfaitement si vous avez besoin d'une bonne qualité et d'une compression sans frais généraux d'encodage.