Vous souhaitez fournir à ChatGPT vos données personnalisées? Voici une étape par étape sur la façon de faire exactement cela!

Fournissant la technologie GPT dans un chatbot puissant et facile à utiliser, ChatGPT est devenu l'outil d'IA le plus populaire au monde. De nombreuses personnes utilisent ChatGPT pour fournir des conversations engageantes, répondre à des questions, proposer des suggestions créatives et aider au codage et à l'écriture. Cependant, ChatGPT est limité car vous ne pouvez pas stocker vos données pour un usage personnel à long terme, et son point de coupure des données de connaissance de septembre 2021.

Comme solution de contournement, nous pouvons utiliser l'API d'OpenAI et LangChain pour fournir à ChatGPT des données personnalisées et des informations mises à jour après 2021 afin de créer une instance ChatGPT personnalisée.

Pourquoi fournir à ChatGPT des données personnalisées?

Alimenter ChatGPT avec des données personnalisées et fournir des informations mises à jour au-delà de sa date limite de connaissance offre plusieurs avantages par rapport à la simple utilisation de ChatGPT comme d'habitude. En voici quelques-uns :

  • Interactions personnalisées: En fournissant à ChatGPT des données personnalisées, les utilisateurs peuvent créer une expérience plus personnalisée. Le modèle peut être formé sur des ensembles de données spécifiques pertinents pour les utilisateurs individuels ou les organisations, ce qui donne des réponses adaptées à leurs besoins et préférences uniques.
  • Expertise spécifique au domaine: L'intégration de données personnalisée permet à ChatGPT de se spécialiser dans des domaines ou des industries particuliers. Il peut être formé sur les connaissances, la terminologie et les tendances spécifiques à l'industrie, permettant des réponses plus précises et plus perspicaces dans ces domaines spécifiques.
  • Informations actuelles et exactes: L'accès à des informations mises à jour garantit que ChatGPT reste au courant des derniers développements et connaissances. Il peut fournir des réponses précises basées sur des événements récents, des nouvelles ou des recherches, ce qui en fait une source d'informations plus fiable.

Maintenant que vous comprenez l'importance de fournir des données personnalisées à ChatGPT, voici une étape par étape sur la façon de le faire sur votre ordinateur local.

Étape 1: Installer et télécharger le logiciel et le script prédéfini

Veuillez noter que les instructions suivantes concernent une machine Windows 10 ou Windows 11.

Pour fournir des données personnalisées à ChatGPT, vous devez installer et télécharger la dernière version de Python3, Git, Microsoft C++ et le script de récupération ChatGPT à partir de GitHub. Si certains logiciels sont déjà installés sur votre PC, assurez-vous qu'ils sont mis à jour avec la dernière version pour éviter tout problème pendant le processus.

Commencez par installer :

  • Télécharger:Python3 (Gratuit)
  • Télécharger:Gite (Gratuit)
  • Télécharger:Outils de création visuelle Microsoft (Gratuit)

Notes d'installation Python3 et Microsoft C++

Lors de l'installation de Python3, assurez-vous de cocher la case Ajouter python.exe à PATH option avant de cliquer Installer maintenant. Ceci est important car cela vous permet d'accéder à Python dans n'importe quel répertoire de votre ordinateur.

Lors de l'installation de Microsoft C++, vous souhaiterez installer Outils de création de Microsoft Visual Studio d'abord. Une fois installé, vous pouvez cocher la case Développement de bureau avec C++ option et cliquez Installer avec tous les outils optionnels automatiquement cochés dans la barre latérale droite.

Maintenant que vous avez installé les dernières versions de Python3, Git et Microsoft C++, vous pouvez télécharger le script Python pour interroger facilement des données locales personnalisées.

Télécharger: Script de récupération ChatGPT (Gratuit)

Pour télécharger le script, cliquez sur Code, puis sélectionnez Télécharger ZIP. Cela devrait télécharger le script Python dans votre répertoire par défaut ou sélectionné.

Une fois téléchargé, nous pouvons maintenant configurer un environnement local.

Étape 2: Configurer l'environnement local

Pour configurer l'environnement, vous devrez ouvrir un terminal dans le dossier chatgpt-retrieval-main que vous avez téléchargé. Pour ce faire, ouvrez chatgpt-retrieval-main dossier, cliquez avec le bouton droit de la souris et sélectionnez Ouvert dans l'aérogare.

Une fois le terminal ouvert, copiez et collez cette commande :

pip installer langchain openai chromadb tiktoken non structuré

Cette commande utilise le gestionnaire de packages de Python pour créer et gérer l'environnement virtuel Python nécessaire.

Après avoir créé l'environnement virtuel, nous devons fournir une clé API OpenAI pour accéder à leurs services. Nous devrons d'abord générer une clé API à partir du Site de clés API OpenAI en cliquant sur Créer une nouvelle clé secrète, en ajoutant un nom à la clé, puis en appuyant sur la touche Créer un bouton de clé secrète.

Une chaîne de caractères vous sera fournie. Ceci est votre clé API OpenAI. Copiez-le en cliquant sur l'icône de copie à côté de la clé API. Notez que cette clé API doit rester secrète. Ne le partagez pas avec d'autres à moins que vous n'ayez vraiment l'intention qu'ils l'utilisent avec vous.

Une fois copié, retournez dans le dossier chatgpt-retrieval-main et ouvrez les constantes avec Bloc-notes. Remplacez maintenant l'espace réservé par votre clé API. N'oubliez pas de sauvegarder le fichier !

Maintenant que vous avez correctement configuré votre environnement virtuel et ajouté votre clé API OpenAI en tant que variable d'environnement. Vous pouvez maintenant fournir vos données personnalisées à ChatGPT.

Étape 3: Ajouter des données personnalisées

Pour ajouter des données personnalisées, placez toutes vos données de texte personnalisées dans le données dossier dans chatgpt-retrieval-main. Le format des données textuelles peut être sous la forme d'un PDF, TXT ou DOC.

Comme vous pouvez le voir sur la capture d'écran ci-dessus, j'ai ajouté un fichier texte contenant un emploi du temps personnalisé, un article que j'ai écrit sur Les accélérateurs Instinct d'AMD, et un document PDF.

Étape 4: Interroger ChatGPT via le terminal

Le script Python nous permet d'interroger des données à partir des données personnalisées que nous avons ajoutées au dossier de données et à Internet. En d'autres termes, vous aurez accès au backend ChatGPT habituel et à toutes les données stockées localement dans le dossier de données.

Pour utiliser le script, exécutez le python chatgpt.py script, puis ajoutez votre question ou requête comme argument.

python chatgpt.py "TA QUESTION"

Assurez-vous de mettre vos questions entre guillemets.

Pour tester si nous avons réussi à alimenter ChatGPT avec nos données, je vais poser une question personnelle concernant le Horaire personnel.txt déposer.

Ça a marché! Cela signifie que ChatGPT a pu lire le Personal Sched.txt fourni précédemment. Voyons maintenant si nous avons réussi à alimenter ChatGPT avec des informations qu'il ne connaît pas en raison de sa date limite de connaissance.

Comme vous pouvez le voir, il décrit correctement l'AMD Instinct MI250x, qui a été publié après la date limite de connaissance de ChatGPT -3.

Limitations de ChatGPT personnalisé

Bien que l'alimentation de GPT-3.5 avec des données personnalisées ouvre davantage de façons d'appliquer et d'utiliser le LLM, il existe quelques inconvénients et limitations.

Tout d'abord, vous devez fournir toutes les données vous-même. Vous pouvez toujours accéder à toutes les connaissances de GPT-3.5 jusqu'à sa date limite de connaissance; cependant, vous devez fournir toutes les données supplémentaires. Cela signifie que si vous voulez que votre modèle local connaisse un certain sujet sur Internet que GPT-3.5 ne connaît pas déjà, vous devrez aller sur Internet et récupérer les données vous-même et les enregistrer sous forme de texte dans le dossier de données de chatgpt-retrieval-main.

Un autre problème est qu'interroger ChatGPT comme celui-ci prend plus de temps à charger que de demander directement ChatGPT.

Enfin, le seul modèle actuellement disponible est le GPT-3.5 Turbo. Ainsi, même si vous avez accès à GPT-4, vous ne pourrez pas l'utiliser pour alimenter votre instance ChatGPT personnalisée.

ChatGPT personnalisé est génial mais limité

Fournir des données personnalisées à ChatGPT est un moyen puissant de tirer le meilleur parti du modèle. Grâce à cette méthode, vous pouvez alimenter le modèle avec toutes les données textuelles de votre choix et l'inviter comme ChatGPT normal, mais avec certaines limitations. Cependant, cela changera à l'avenir car il deviendra plus facile d'intégrer nos données avec le LLM, ainsi que l'accès au dernier modèle GPT-4.