Les capacités des chatbots IA se développent rapidement. Mais savent-ils encore coder, et lequel est le meilleur à la tâche ?

Lorsque Google a lancé Bard, sa réponse au ChatGPT d'OpenAI, il lui manquait une fonctionnalité très appréciée des utilisateurs de ChatGPT: la possibilité d'écrire du code. Cependant, suite à la demande générale, Google a donné un coup de pouce à Bard, lui permettant d'écrire du code dans des dizaines de langages de programmation.

Google s'est depuis prononcé sur la capacité de Bard à écrire et à déboguer du code, mais comment se compare-t-il au phénoménal ChatGPT? Découvrons-le.

ChatGPT contre. Barde: Prise en charge de la langue

Officiellement, Google's Bard peut fonctionner avec une vingtaine de langages de programmation. Il s'agit principalement de logiciels populaires tels que Typescript, Python, C++, Go, Java, JavaScript et PHP. Il peut toujours gérer des options moins populaires comme Perl et Scala mais n'est pas nécessairement aussi efficace.

ChatGPT, en revanche, n'a pas de liste officielle des langues prises en charge. Le chatbot peut gérer la plupart de ce que Bard peut gérer et des dizaines d'autres. ChatGPT peut écrire, déboguer et expliquer du code dans les langages de programmation les plus récents et populaires et

instagram viewer
moins populaires, langages hérités comme Fortran, Pascal, BASIC et COBOL.

Cependant, le soutien ne signifie pas nécessairement la compétence. Nous avons essayé quelques tâches simples dans certains langages comme PHP, JavaScript, BASIC et C++. Bard et ChatGPT ont tous deux été en mesure de fournir les langages de programmation populaires, mais seul ChatGPT a été en mesure d'enchaîner de manière convaincante des programmes dans des langages plus anciens. Donc, en termes de support linguistique, nous donnons la victoire à ChatGPT.

ChatGPT contre. Bard: précision et qualité du code

Disons que vous demandez à ChatGPT ou à Bard de générer un morceau de code qui fait quelque chose, et il crache des dizaines de lignes de code en quelques secondes. Facile, non? Mais à quelle fréquence ce code fonctionnera-t-il? Disons que le code fonctionne; quelle est la qualité de ce code?

Pour comparer la précision et la qualité du code généré par les deux chatbots IA, nous leur avons confié quelques tâches de codage à accomplir. Nous avons demandé à Bard et ChatGPT de générer une simple application de liste de tâches en utilisant HTML, CSS et JavaScript. Après avoir copié-collé et visualisé le code généré dans un navigateur, l'application ChatGPT ressemblait à ceci :

En utilisant la version de ChatGPT, vous pouvez ajouter une nouvelle tâche, supprimer une tâche ou marquer une tâche comme terminée. Google's Bard a également été en mesure de générer une application de liste de tâches fonctionnelle. Cependant, vous pouvez uniquement ajouter une tâche, sans aucun moyen de la supprimer ou de la marquer comme terminée. L'interface de Bard semblait également moins attrayante; voici à quoi ça ressemblait:

Nous avons répété le test, cette fois en demandant aux deux chatbots de recréer des cartes de chronologie Twitter. Voici le résultat de ChatGPT :

Et voici ce que Google's Bard a produit :

Les deux résultats ont leurs avantages et leurs inconvénients. Nous aurions opté pour les résultats de Bard s'il avait les boutons J'aime, Retweet et Commentaire. Cependant, il les a étrangement laissés de côté, nous vous laisserons donc décider lequel est le meilleur. Bien sûr, la qualité du code ne se limite pas à l'esthétique de ce qu'il produit.

Lors de l'analyse du code généré par les deux chatbots, celui de Bard semblait être plus orienté objet tandis que celui de ChatGPT était plus procédural. Notre choix de langage de programmation pourrait influencer cela, mais ChatGPT semblait écrire du code plus propre si nécessaire. Il a également tendance à générer des solutions plus complètes, conduisant généralement à plus de lignes de code.

En termes de qualité du code généré, nous attribuons ce tour à ChatGPT.

ChatGPT contre. Bard: débogage et détection d'erreurs

Les erreurs et les bogues sont comme des puzzles que les programmeurs adorent détester. Ils vous rendront fou, mais les réparer est assez satisfaisant. Ainsi, lorsque vous rencontrez des bogues dans votre code, devriez-vous appeler Bard ou ChatGPT pour obtenir de l'aide? Pour décider, nous avons donné aux deux chatbots IA deux problèmes de débogage à résoudre.

Dans un premier temps, nous avons incité les deux chatbots à résoudre une erreur logique dans un code PHP. Les erreurs de logique sont notoirement plus difficiles à repérer car le code qui les contient ne semble pas faux, il ne fait tout simplement pas ce que le programmeur avait prévu.

Le code de cette capture d'écran s'exécute, mais il ne fonctionne pas. Pouvez-vous repérer l'erreur logique? Nous avons demandé de l'aide à Bard de Google et malheureusement, le chatbot n'a pas pu identifier l'erreur logique dans le code. Fait intéressant, Google's Bard a généralement trois tentatives de brouillon pour résoudre un problème, nous avons vérifié les trois brouillons et ils étaient tous faux.

Nous avons ensuite demandé de l'aide à ChatGPT, et il a immédiatement identifié l'erreur logique.

Le script PHP n'avait pas d'erreurs de syntaxe, mais la logique dans le est impair() fonction était en arrière. Pour voir si un nombre est impair, vous devez généralement vérifier s'il a un reste après avoir divisé par 2. Si c'est le cas, c'est un nombre impair.

Alors que Bard était loin d'identifier ce bogue, ChatGPT l'a détecté dès la première tentative. Nous avons essayé quatre autres erreurs logiques et Bard n'a pu détecter l'erreur que dans une seule instance alors que ChatGPT livrait systématiquement. Après être passé au code avec des erreurs de syntaxe, Google's Bard a pu suivre le rythme, en les identifiant dans presque tous les échantillons présentés.

Google's Bard est relativement doué pour le débogage, mais nous donnerons à nouveau cette victoire à ChatGPT.

ChatGPT contre. Barde: Conscience du contexte

L'un des plus grands défis liés à l'utilisation des chatbots IA pour le codage est leur connaissance relativement limitée du contexte. Vous demandez au chatbot d'écrire du code, puis d'autres... le long de la ligne, il oublie complètement que la prochaine chose qu'il construit fait partie du même projet.

Par exemple, supposons que vous construisez une application Web avec un chatbot IA. Vous lui dites d'écrire du code pour votre page HTML d'inscription et de connexion, et il le fait parfaitement. Et puis, pendant que vous continuez à construire, vous demandez au chatbot de générer un script côté serveur pour gérer la logique de connexion. Il s'agit d'une tâche simple, mais en raison d'une connaissance limitée du contexte, elle pourrait finir par générer un script de connexion avec de nouvelles variables et conventions de dénomination qui ne correspondent pas au reste du code.

Alors, quel chatbot conserve le mieux la sensibilité au contexte? Nous avons confié aux deux outils la même tâche de programmation: une application de chat que nous savons que ChatGPT peut déjà créer.

Malheureusement, Bard n'a tout simplement pas pu terminer l'application car il a perdu la trace du contexte du projet après être resté inactif pendant un certain temps. Bien qu'il soit soumis aux mêmes conditions, ChatGPT a complété l'application. Encore une fois, en termes de sensibilité au contexte, nous la donnons à ChatGPT.

ChatGPT contre. Barde: Résolution de problèmes

À ce stade, Google's Bard fait défaut à bien des égards. Mais peut-il enfin marquer une victoire? Testons ses capacités de résolution de problèmes. Parfois, vous avez juste un problème, mais vous ne savez pas comment le représenter par programmation, et encore moins comment le résoudre.

Des situations comme celle-ci sont lorsque les chatbots AI comme Bard et ChatGPT peuvent être très utiles. Mais quel chatbot a les meilleures capacités de résolution de problèmes? Nous leur avons demandé à tous les deux de "écrire un code JavaScript qui compte combien de fois un mot particulier apparaît dans un texte."

Bard a répondu avec un code de travail, bien qu'il échoue lorsque les signes de ponctuation sont proches d'un mot ou que le mot apparaît dans des cas différents.

Nous avons lancé le même problème sur ChatGPT et voici le résultat :

Le code de ChatGPT adopte une approche plus robuste et précise pour compter les occurrences de mots dans un texte. Il prend en compte les limites des mots et la sensibilité à la casse, gère correctement la ponctuation et donne des résultats plus fiables. Encore une fois, en termes de résolution de problèmes, nous le donnons à ChatGPT.

Étant donné que Google Bard a pratiquement perdu dans toutes les mesures que nous avons utilisées pour la comparaison, nous avons décidé de lui donner une chance de rachat. Nous avons demandé au chatbot "Quel est le meilleur en codage? ChatGPT ou Google Bard ?"

Bien qu'il ait convenu que ChatGPT était plus créatif, Bard a déclaré que son concurrent était plus susceptible de faire des erreurs. et que ChatGPT produisait du code moins efficace, pas bien structuré et généralement moins fiable. Nous devons être en désaccord!

ChatGPT est dans une ligue à part

Google's Bard a bénéficié de beaucoup de battage médiatique, il peut donc être surprenant de voir à quel point il manque par rapport à ChatGPT. Bien que ChatGPT ait clairement une longueur d'avance, vous pourriez penser que les ressources massives de Google l'aideraient à éroder cet avantage.

Malgré ces résultats, il serait imprudent d'écarter Bard en tant qu'aide à la programmation. Bien qu'il ne soit pas aussi puissant que ChatGPT, Bard a toujours un coup de poing significatif et évolue à un rythme rapide. Compte tenu des ressources de Google, l'émergence de Bard en tant que digne rival n'est sûrement qu'une question de temps.