Opposons les plus grands joueurs d'art de l'IA les uns contre les autres et voyons qui sortira en tête. DALL-E, Midjourney ou Stable Diffusion ?

L'intelligence artificielle a parcouru un long chemin dans le domaine de la génération d'images. Les applications génératives comme DALL-E, Midjourney et Stable Diffusion ont eu un effet profond sur la façon dont nous interagissons avec le contenu numérique.

Dans cet article, nous comparerons chaque application pour voir laquelle est la meilleure dans l'ensemble pour générer des images basées sur des invites de texte. Commençons!

DALL-E 2

DALL-E 2 a une interface simple et facile à comprendre et il est facile de commencer à générer des images sans avoir à s'inscrire auprès d'une plateforme tierce. Rendez-vous simplement sur le site Web et saisissez votre texte dans le Générer case pour créer une image. DALL-E 2 produira alors quatre versions de l'invite, que vous pourrez modifier ou télécharger.

Caractéristique hors concours

L'une des fonctionnalités les plus remarquables de DALL-E 2 est la possibilité de créer, de modifier et de fusionner plusieurs images. Une fois que vous avez sélectionné l'image que vous voulez et cliquez sur

instagram viewer
Modifier, vous aurez la possibilité d'utiliser le Ajouter un cadre de génération fonctionnalité pour ajouter des générations d'images supplémentaires à celle existante.

Une fois que vous avez placé le cadre, entrez une nouvelle invite et DALL-E 2 générera un nouvel ensemble d'images avec la possibilité de fusionner n'importe laquelle d'entre elles dans l'image d'origine.

Vous pouvez ensuite utiliser l'une des fonctionnalités d'édition pour créer l'image à la perfection. Par exemple, vous pouvez utiliser le Effacer pour effacer les pixels existants, puis saisissez un nouveau texte dans la zone Générer pour le remplir. Vous pouvez le faire plusieurs fois pour obtenir les résultats souhaités.

Mais rappelez-vous que chaque fois que vous cliquez sur Générer, vous utilisez des crédits. Et une fois votre allocation utilisée, vous devrez acheter plus de crédits pour continuer.

Avantages

  • Facile à utiliser
  • Beaucoup de flexibilité créative
  • Aucune plate-forme tierce nécessaire

Les inconvénients

  • Images simplistes
  • Pas un haut degré de précision
  • Ne peut créer que des images carrées

Nous couvrons le bases de DALL-E 2 si vous ne l'avez jamais utilisé auparavant.

À mi-parcours

À mi-parcours est sans doute le générateur de texte en image AI à battre. Grâce à son puissant ensemble de fonctionnalités, il est capable de produire des images hautement artistiques et crédibles que les autres concurrents de l'IA n'ont pas encore réussi à obtenir de manière cohérente. Mais contrairement à DALL-E 2, vous devez créer un compte Discord avant de commencer à l'utiliser.

Même avec les couches supplémentaires de complexité et malgré le fait que vous devez taper des commandes comme /imagine pour générer vos images, vous pardonnerez bientôt Midjourney à cause du bel art que vous pouvez créer avec quelques mots.

Comme avec DALL-E 2, quatre versions sont créées et vous pouvez en sélectionner une ou plusieurs pour télécharger ou créer des variantes. Mais il y a plus de flexibilité avec les ratios d'image; vous pouvez créer n'importe quel rapport que vous préférez en ajoutant à chaque image --ar puis suivi du rapport, dans notre exemple, 3:2.

La qualité des résultats est indubitable. La magie de Midjourney.

Caractéristique hors concours

L'une des fonctionnalités les plus intéressantes et les plus puissantes de Midjourney est la possibilité de télécharger vos propres images, puis de demander à Midjourney de créer des invites pour celles-ci que vous pouvez utiliser pour créer des images entièrement nouvelles. En tappant /describe, vous êtes invité à télécharger l'une de vos images.

Une fois téléchargé, Midjourney proposera quatre invites avec sa propre interprétation de ce qu'il voit.

Vous pouvez ensuite utiliser ces invites pour créer un ensemble d'images complètement différent.

Avec une telle flexibilité créative, Midjourney offre des possibilités presque infinies.

Avantages

  • Images de haute qualité
  • Les utilisateurs peuvent programmer des ratios personnalisés
  • Beaucoup de flexibilité pour contrôler les paramètres d'image

Les inconvénients

  • Plus compliqué à utiliser
  • Nécessite que les utilisateurs s'inscrivent sur Discord
  • Le temps de génération d'image augmente considérablement après l'épuisement des heures rapides

Tu peux créez des arrière-plans époustouflants pour vos portraits avec Midjourney pour faire ressortir vos photos.

Diffusion stable

Stable Diffusion représente le Far West des applications d'IA génératives. Avec de nombreuses applications Web et options d'installation disponibles, il n'est pas facile de comparer Stable Diffusion à DALL-E 2 et Midjourney. Cela est principalement dû à la disparité entre les versions Web et les modèles d'installation en ce qui concerne les options et la qualité de sortie. En d'autres termes, les versions de Stable Diffusion installées vont généralement vous donner de bien meilleurs résultats et une liberté de création.

Nous allons regarder le site officiel de Stable Diffusion, DreamStudio par Stability AI, et vous montrer comment commencer à utiliser l'application pour vous donner une idée de base de ses capacités.

La disposition de Stable Diffusion dans DreamStudio est plus encombrée que DALL-E 2 et Midjourney, mais elle reste facile à utiliser. Les utilisateurs d'essai obtiennent 200 crédits gratuits pour créer des invites, qui sont entrées dans le Rapide boîte. Mais en plus, il y a aussi un Invite négative boîte où vous pouvez anticiper la diffusion stable pour laisser les choses de côté.

Il existe plusieurs autres fonctionnalités essentielles dans le menu de gauche à prendre en compte qui auront un impact sur l'image globale et l'utilisation du crédit. Il y a un Style boîte d'options, Télécharger une image, et Paramètres (pour le ratio et le nombre d'images à générer). Dans le Avancé onglet, il y a Force rapide, Étapes de génération, Graine, et Modèle.

Lorsque vous survolez chacune de ces options, une brève description de chaque fonctionnalité s'affiche. Mais pour vraiment comprendre ce que chacun d'eux fait en pratique, il suffit de les essayer. Mais surveillez vos crédits car il ne s'agit pas d'un système à un crédit pour une image.

Caractéristique hors concours

Le Invite négative est probablement la caractéristique la plus remarquable de Stable Diffusion de DreamStudio. Il s'agit également d'un outil formidable dans d'autres versions de Stable Diffusion qui contribue à la qualité globale de l'image. Dans ces versions, la saisie de déclarations négatives aide les algorithmes à produire des images plus précises et de meilleure qualité.

Lorsque les invites négatives fonctionnent, elles fonctionnent bien. Mais vous passerez des crédits à essayer de perfectionner le look que vous souhaitez dans de nombreux cas.

Avantages

  • Plusieurs options pour les versions Web et installées
  • Plus de liberté de création (vous pouvez créer des images non censurées sur certaines versions)
  • Beaucoup de contrôles pour personnaliser les paramètres de l'image

Les inconvénients

  • Brûle les crédits dans les versions payantes
  • Courbe d'apprentissage abrupte
  • La qualité d'image est très aléatoire, selon la version que vous avez

Si vous avez besoin d'aide pour créer des invites, nous vous montrons comment utiliser ChatGPT pour créer des images AI.

Quelle est la meilleure application?

Alors, quelle est la meilleure application, DALL-E 2, Midjourney ou Stable Diffusion? C'est une question difficile car les utilisateurs auront des attentes différentes et il existe différentes versions de ces applications qui rendent les comparaisons directes irréalistes. Cependant, nous pouvons évaluer chacun de nos exemples par ces catégories.

Classement de la qualité d'image

Midjourney a produit les images de la meilleure qualité dans nos exemples. Ils étaient plus réalistes et plus joliment rendus que DALL-E 2 et Stable Diffusion.

Facilité d'utilisation

Hors de la boîte, DALL-E 2 était le plus facile à utiliser. Il ne nécessitait pas l'utilisation d'une application tierce et le menu était simple et rationalisé.

Caractéristiques et capacités

Midjourney devance ses concurrents car il possède plus de fonctionnalités et de capacités qui produisent des images de haute qualité de manière plus cohérente.

Vitesse

DALL-E 2 produit les images les plus rapides (environ 12 secondes), dépassant la diffusion stable d'environ une seconde et Midjourney (en mode rapide) par une marge plus grande.

Flexibilité et personnalisation

Stable Diffusion est dans une classe à part pour la flexibilité et la personnalisation. Il existe un nombre croissant de versions qui permettent aux utilisateurs non seulement de créer des images généralement censurées, mais il existe des versions qui produisent même des images de haute qualité directement modélisées à partir de Midjourney images.

Midjourney et DALL-E 2 sont à égalité au premier rang dans le nombre de catégories qu'ils ont remportées, mais le grand gagnant devrait se rendre à Midjourney, en se basant uniquement sur la qualité de l'image.

Alors que la concurrence s'intensifie, les utilisateurs de contenu IA sont mieux servis

Tout ce que nous pouvons offrir, c'est un aperçu des plus performants parmi DALL-E 2, Midjourney et Stable Diffusion, à un moment donné. Le domaine de la technologie de l'intelligence artificielle est en constante évolution, de nombreux concurrents rejoignant le marché chaque jour. Ceci est très bénéfique pour les utilisateurs d'applications d'IA génératives, car cela favorise l'innovation et réduit les coûts pour nous tous d'accéder à ces incroyables outils créatifs.