Python, en tant que langage, est précieux au-delà de toute mesure, en particulier lorsque vous souhaitez travailler avec des données structurées. Étant donné que les gens stockent beaucoup de données dans des fichiers Excel, il est impératif de consolider plusieurs fichiers pour gagner du temps et des efforts.

Python vous permet de faire exactement cela; quel que soit le nombre de fichiers Excel que vous souhaitez combiner, vous pouvez le faire avec une relative facilité. Compte tenu de sa gamme de bibliothèques et de ressources tierces, vous pouvez importer et utiliser les outils à multiples facettes de Python pour faire vos enchères.

Dans ce guide, vous devrez installer et utiliser les bibliothèques Pandas pour importer des données dans Python avant de les consolider.

Installer les bibliothèques Pandas en Python

Pandas est une bibliothèque tierce que vous pouvez installer en Python. Certains IDE ont déjà des Pandas installés.

Si vous utilisez un Version EDI qui ne vient pas avec les Pandas préinstallés, rassurez-vous, vous pouvez l'installer directement en Python.

instagram viewer

Voici comment installer Pandas :

pip installer des pandas

Si vous utilisez Jupyter Notebook, vous pouvez installer Pandas directement avec le Commande PIP. Généralement, lorsque vous avez installé Jupyter avec Anaconda, il y a de fortes chances que Pandas soit déjà disponible pour une utilisation directe.

Si vous ne pouvez pas appeler Pandas, vous pouvez utiliser la commande ci-dessus pour les installer directement.

Combiner des fichiers Excel avec Python

Tout d'abord, vous devez créer un dossier à votre emplacement préféré avec tous les fichiers Excel. Une fois le dossier prêt, vous pouvez commencer à écrire le code pour importer les bibliothèques.

Vous utiliserez deux variables dans ce code :

  1. Panda : La bibliothèque Pandas fournit les trames de données pour stocker les fichiers Excel.
  2. SE : La bibliothèque est utile pour lire les données du dossier de votre machine

Pour importer ces bibliothèques, utilisez ces commandes :

Importer des pandas en tant que pd
Importer le système d'exploitation
  • Importer: Syntaxe Python utilisée pour importer les bibliothèques en Python
  • Panda : Nom de la bibliothèque
  • pd : Alias ​​donné à la bibliothèque
  • SE : Une bibliothèque pour accéder au dossier système

Une fois que vous avez importé les bibliothèques, créez deux variables pour stocker le chemin du fichier d'entrée et de sortie. Le chemin du fichier d'entrée est nécessaire pour accéder au dossier des fichiers. Le chemin du fichier de sortie est nécessaire car le fichier combiné y sera exporté.

Si vous utilisez Python, assurez-vous de remplacer la barre oblique inverse par une barre oblique (\ pour /)

input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Fichiers Excel/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"

Joindre le / à la fin également pour compléter les chemins.

Les fichiers du dossier sont disponibles dans une liste. Créez une liste pour stocker toutes les références de fichiers du dossier d'entrée à l'aide de la répertoire_liste fonction de la SE bibliothèque.

Si vous n'êtes pas sûr des fonctions disponibles dans une bibliothèque, vous pouvez utiliser le directeur fonction avec le nom de la bibliothèque. Par exemple, pour vérifier la version exacte de la fonction listdir, vous pouvez utiliser la commande comme suit :

répertoire (OS)

La sortie comprendra toutes les fonctions associées disponibles dans la bibliothèque du système d'exploitation. La fonction listdir est l'une des nombreuses fonctions disponibles dans cette bibliothèque.

Créez une nouvelle variable pour stocker les fichiers d'entrée du dossier.

excel_file_list = os.listdir (input_file_path)

Imprimez cette variable pour voir les noms des fichiers stockés dans le dossier. Tous les fichiers stockés dans le dossier sont affichés une fois que vous utilisez la fonction d'impression.

imprimer (liste_fichiers_excel)

Ensuite, vous devez ajouter un nouveau bloc de données pour stocker chaque fichier Excel. Imaginez une trame de données comme un conteneur pour stocker des données. Voici la commande pour créer une trame de données.

df = pd. Trame de données()
  • df : Variable pour stocker la valeur du DataFrame
  • pd : Alias ​​pour le Bibliothèque des pandas
  • Trame de données: Syntaxe par défaut pour l'ajout d'un bloc de données

Le dossier d'entrée a trois .xlsx fichiers dans cet exemple. Les noms de fichiers sont :

Fichier1_excel.xlsx
Fichier2_excel.xlsx
Fichier3_excel.xlsx

Pour ouvrir chaque fichier de ce dossier, vous devez exécuter une boucle. La boucle s'exécutera pour chacun des fichiers de la liste créée ci-dessus.

Voici comment procéder :

pour excel_files dans excel_file_list :

Ensuite, il est nécessaire de vérifier les extensions des fichiers car le code n'ouvrira que les fichiers XLSX. Pour vérifier ces fichiers, vous pouvez utiliser un Si déclaration.

Utilisez le se termine par fonction à cet effet, comme suit :

pour excel_files dans excel_file_list :

si excel_files.endswith(".xlsx") :

  • fichiers_excel : Liste avec toutes les valeurs du fichier
  • se termine par: Fonction pour vérifier l'extension des fichiers
  • ("".xlsx") : Cette valeur de chaîne peut changer en fonction de ce que vous souhaitez rechercher

Maintenant que vous avez identifié les fichiers Excel, vous pouvez créer un nouveau bloc de données pour lire et stocker les fichiers individuellement.

pour excel_files dans excel_file_list :

si excel_files.endswith(".xlsx") :

df1 = pd.read_excel (chemin_fichier_entrée+fichiers_excel)

  • df1 : Nouvelle trame de données
  • pd : Bibliothèque des pandas
  • lire_excel : Fonction pour lire les fichiers Excel dans la bibliothèque Pandas
  • chemin_fichier_entrée : Chemin du dossier où sont stockés les fichiers
  • fichiers_excel : Toute variable utilisée dans la boucle for

Pour commencer à ajouter les fichiers, vous devez utiliser le ajouter une fonction.

pour excel_files dans excel_file_list :

si excel_files.endswith(".xlsx") :

df1 = pd.read_excel (chemin_fichier_entrée+fichiers_excel)
df = df.append (df1)

Enfin, maintenant que le bloc de données consolidé est prêt, vous pouvez l'exporter vers l'emplacement de sortie. Dans ce cas, vous exportez le bloc de données vers un fichier XLSX.

df.to_excel (chemin_fichier_sortie+"Fichier_consolidé.xlsx")
  • df: Dataframe à exporter
  • exceller: Commande utilisée pour exporter les données
  • chemin_fichier_sortie : Chemin défini pour stocker la sortie
  • Fichier_consolidé.xlsx : Nom du fichier consolidé

Maintenant, regardons le code final :

#Pandas est utilisé comme dataframe pour gérer les fichiers Excel
importer des pandas en tant que pd
importer le système d'exploitation

# changez la barre oblique de "\" à "/", si vous utilisez des appareils Windows

input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Fichiers Excel/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"

#créer une liste pour stocker toutes les références de fichiers du dossier d'entrée à l'aide de la fonction listdir de la bibliothèque os.
#Pour voir le contenu d'une bibliothèque (comme la fonction listdir, vous pouvez utiliser la fonction dir sur le nom de la bibliothèque).
#Utilisez dir (library_name) pour lister le contenu

excel_file_list = os.listdir (input_file_path)

#imprimer tous les fichiers stockés dans le dossier, après avoir défini la liste
liste_fichiers_excel

#Une fois chaque fichier ouvert, utilisez la fonction d'ajout pour commencer à consolider les données stockées dans plusieurs fichiers

#créer une nouvelle trame de données vierge pour gérer les importations de fichiers Excel
df = pd. Trame de données()

# Exécutez une boucle for pour parcourir chaque fichier de la liste
pour excel_files dans excel_file_list :
#vérifier uniquement les fichiers avec le suffixe .xlsx
si excel_files.endswith(".xlsx") :
#créer un nouveau dataframe pour lire/ouvrir chaque fichier Excel de la liste des fichiers créés ci-dessus
df1 = pd.read_excel (chemin_fichier_entrée+fichiers_excel)
#append chaque fichier dans la trame de données vide d'origine
df = df.append (df1)

#transférer la sortie finale vers un fichier Excel (xlsx) sur le chemin de sortie
df.to_excel (chemin_fichier_sortie+"Fichier_consolidé.xlsx")

Utilisation de Python pour combiner plusieurs classeurs Excel

Python's Pandas est un excellent outil pour les débutants comme pour les utilisateurs avancés. La bibliothèque est largement utilisée par les développeurs qui souhaitent maîtriser Python.

Même si vous êtes débutant, vous pouvez bénéficier énormément de l'apprentissage des nuances de Pandas et de la manière dont la bibliothèque est utilisée dans Python.

6 opérations pandas pour les débutants

Maîtrisez les pandas avec ces opérations pour débutants.

Lire la suite

PartagerTweeterE-mail
Rubriques connexes
  • Programmation
  • Python
  • Microsoft Excel
  • Tableur
A propos de l'auteur
Gaurav Sial (59 articles publiés)

Gaurav Siyal a deux ans d'expérience en écriture, écrivant pour une série d'entreprises de marketing numérique et de documents sur le cycle de vie des logiciels.

Plus de Gaurav Siyal

Abonnez-vous à notre newsletter

Rejoignez notre newsletter pour des conseils techniques, des critiques, des ebooks gratuits et des offres exclusives !

Cliquez ici pour vous abonner