Les générateurs d'art IA ont une mauvaise réputation pour produire des représentations inexactes des mains. Opposons Midjourney v5 à Dall-E 2 pour voir lequel le fait le mieux.
Les générateurs d'art IA continuent d'impressionner, nous permettant de créer à peu près tout ce que nous pouvons imaginer. Cependant, la technologie semble avoir heurté un mur de briques lorsqu'il s'agit de générer des mains réalistes.
Ici, nous examinons deux des principales applications d'art génératif et les opposons en tête-à-tête ou au corps à corps pour voir laquelle peut générer de meilleures mains, Midjourney v5 ou Dall-E 2. L'une ou l'autre de ces applications est-elle maîtrisée? Découvrons-le!
Le problème de l'IA avec les mains
Depuis que l'art généré par l'IA s'est répandu sur Internet, il y a eu des critiques concernant le qualité des mains dessinées par IA. Malgré les mises à jour récentes, comme le montrent nos comparaisons côte à côte, les résultats n'ont pas été satisfaisants.
Les deux concurrents ont amélioré leurs capacités et la qualité de leurs sorties à chaque itération. La dernière mise à jour,
Version 5 de Midjourney, a enregistré des progrès impressionnants. Cependant, le problème avec les mains dessinées par l'IA reste non résolu et ne peut être ignoré.Comparaison 1: Utilisation des invites "Hand" et "Hands"
Nos comparaisons contiendront exactement les mêmes invites pour Dall-E 2 et Midjourney v5. Nous concevrons les invites pour qu'elles soient spécifiques à la main au lieu de simplement créer des personnes pour voir à quoi ressemblent les mains. Nous donnons également à chaque application une seule chance (lancer) pour chaque invite.
Main
Commençons par l'invite la plus basique et la plus pertinente: "main".
Mi-parcours v5 :
Dall-E 2 :
Nous ne partons pas du bon pied !
Midjourney a pris la voie inhabituelle d'associer une main à des situations plutôt créatives. Au lieu de se concentrer uniquement sur une main, nous voyons un sorcier, des gants, un squelette et une petite figurine. Il manque aussi un doigt à l'image des gants.
Dall-E 2 prend l'approche inverse et ne nous offre qu'une seule main sur un fond uni. Mais curieusement, il existe des postures étranges, en particulier avec les pouces, qui ne semblent ni naturelles ni confortables. Chaque main est également coupée sur l'un des côtés des images.
Qui remporte cette manche? Nous le donnerons à Dall-E 2 pour une précision globale.
Mains
Maintenant, mettons l'invite au pluriel, "mains", et voyons ce que les IA proposent.
Mi-parcours v5 :
Dall-E 2 :
La tentative de "mains" de Midjourney s'avère meilleure cette fois-ci. Mais les quatre images sont en noir et blanc, et il nous manque des doigts. En y regardant de plus près, vous pouvez également voir que certains des chiffres ont une forme étrange ou se transforment les uns en les autres.
Dall-E 2 continue de présenter des aiguilles avec un fond uni. Il n'y a pas de chiffres manquants, mais les mains sont rognées dans la troisième image et les autres versions semblent un peu maladroites dans la composition et manquent complètement de créativité.
Appelons cette comparaison un match nul. Dall-E 2 gagnerait en précision si c'était le seul facteur, mais Midjourney parvient à en créer de belles images dans ses rendus en noir et blanc, même si les quatre versions ne sont pas très réaliste.
Tu peux toujours utilisez Photoshop pour réparer votre art Midjourney, y compris les mains.
Comparaison 2: Gestes de la main
Comparons quelques gestes de la main qui sont presque universellement reconnus.
Doigts croisés
D'abord, essayons "les doigts croisés".
Mi-parcours v5 :
Dall-E 2 :
Il est sûr de dire que Midjourney a complètement bâclé cette invite. Il nous manque des doigts et aucune des versions n'a l'air naturelle du tout.
Chapeau encore une fois à Dall-E 2 pour avoir obtenu le nombre de doigts correct, mais c'est la seule bonne nouvelle. Chaque version donne l'impression que les doigts frappent leurs propres poses de yoga dans un jeu de Twister.
Il n'y a pas de gagnant dans cette comparaison.
Pouces vers le haut
Ensuite, nous allons avec "thumbs up".
Mi-parcours v5 :
Dall-E 2 :
Midjourney obtient le nombre de doigts correct tout en traitant chaque invite de manière créative. Remarquez l'introduction d'un style illustratif ?
Dall-E 2 obtient également des points pour sa précision sans essayer de faire basculer le bateau avec quelque chose de créatif ajouté à chaque résultat.
Il n'y a pas de gagnant clair ici.
Comparaison 3: Mains avec des objets
Maintenant, nous allons augmenter la complexité en invitant les mains à interagir avec les objets.
Main tenant une boule de cristal
Commençons par un objet aléatoire, en utilisant l'invite "main tenant une boule de cristal".
Mi-parcours v5 :
Dall-E 2 :
Au fur et à mesure que nous augmentons la complexité, Midjourney commence à briller. Mis à part quelques rendus qui ne semblent pas naturels, les mains et les boules de cristal sont magnifiques. Midjourney prend même le temps de créer des reflets dans le verre qui ajoutent certainement à la créativité globale.
Mais pour la première fois, nous voyons Dall-E 2 manquer un chiffre dans au moins une des mains, la quatrième main semblant tout simplement bizarre. Les boules de cristal ne sont pas aussi impressionnantes que celles de Midjourney.
Midjourney obtient sa première victoire.
Main tenant de l'eau
Essayons quelque chose d'encore plus complexe avec l'invite "main tenant de l'eau".
Mi-parcours v5 :
Dall-E 2 :
Midjourney ne parvient à rouler qu'une seule image avec le nombre correct de chiffres. Bien que magnifiquement rendu, nous commençons une fois de plus à voir les fissures dans le département de la crédibilité.
Dall-E 2 a également du mal à obtenir des mains naturelles, mais fait un bien meilleur travail. Il change également la couleur en arrière-plan pour une certaine variété.
Nous donnerons ce tour à Dall-E 2.
Comparaison 4: les mains qui travaillent
Pour cette comparaison, nous allons créer des invites qui impliquent les mains dans les activités.
Argile à modeler les mains
Voyons comment les modèles d'IA s'en sortent avec "l'argile à mouler les mains".
Mi-parcours v5 :
Dall-E 2 :
Midjourney a raté un doigt sur deux images, mais tout le reste a fière allure.
Les images de Dall-E 2 semblent déroutantes et encombrées, recourant à l'ajout des mains d'une autre personne dans la moitié des versions.
L'avantage va à Midjourney.
Mains appuyant sur la pâte
Essayons une activité similaire, "les mains qui pressent la pâte".
Mi-parcours v5 :
Dall-E 2 :
Les images de Midjourney sont superbes dans l'ensemble. Mais encore une fois, la moitié d'entre eux ont des chiffres manquants. Mais les images ne peuvent pas être blâmées pour leur style artistique.
Les versions de Dall-E 2 manquent également de doigts dans la moitié des rendus et en ajoutent même un à la dernière main de l'ensemble.
Appelons celui-ci un match nul.
Si vous souhaitez essayer ces comparaisons par vous-même, nous vous montrons comment utiliser Midjourney pour créer de l'art IA.
Que nous disent les résultats?
C'est amusant d'aller faire des comparaisons et de déterminer un gagnant global. Et si nous devions choisir, nous l'appellerions en faveur de Midjourney v5. Bien que Dall-E 2 ait créé plus souvent des mains avec le bon nombre de doigts, c'est Midjourney qui a créé des images plus attrayantes et au rendu artistique.
Mais les deux applications ont une place sur le marché pour les artistes qui réutilisent les images Dall-E 2 et Midjourney pour leur travail. Les deux sont capables de créer des mains qui peuvent être utilisées comme découpes ou dans des composites à des fins artistiques, éditoriales et commerciales. C'est juste une question de préférence personnelle.
L'IA finira par conquérir les mains
Les applications d'art génératif comme Dall-E 2 et Midjourney ont parcouru un long chemin dans leur capacité à créer de l'art réaliste et fantastique. Ils ont encore du mal à générer des mains, mais compte tenu de l'accélération de la technologie générative, nous ne pouvons que nous attendre à une amélioration dans un avenir proche.