Pandas est une bibliothèque Python open source principalement utilisée pour la manipulation et l'analyse de données. Il repose sur la bibliothèque NumPy et fournit des structures de données et des outils d'analyse de données hautes performances et faciles à utiliser pour le langage de programmation Python.

Dans cet article, vous apprendrez à effectuer 6 opérations de base à l'aide de Pandas.

Utiliser des exemples de pandas

Vous pouvez exécuter les exemples de cet article à l'aide de blocs-notes de calcul tels que Cahier Jupyter, Google Colab, etc. Vous pouvez également exécuter les exemples en saisissant le code directement dans l'interpréteur Python en mode interactif.

Si vous souhaitez consulter le code source complet utilisé dans cet article, vous pouvez accéder au fichier Python Notebook à partir de ce Dépôt GitHub.

1. Comment importer des pandas au format pd et imprimer le numéro de version

Vous devez utiliser le importer mot-clé pour importer n'importe quelle bibliothèque en Python. Les pandas sont généralement importés sous le

instagram viewer
pd alias. Avec cette approche, vous pouvez vous référer au package Pandas comme pd à la place de pandas.

importer des pandas au format pd
imprimer (pd.__version__)

Sortir:

1.2.4

2. Comment créer une série dans Pandas

Pandas Series est un tableau unidimensionnel qui contient des données de tout type. C'est comme une colonne dans un tableau. Vous pouvez créer une série en utilisant des tableaux numpy, des fonctions numpy, des listes, des dictionnaires, des valeurs scalaires, etc.

Les valeurs de la série sont étiquetées avec leur numéro d'index. Par défaut, la première valeur a l'index 0, la deuxième valeur a l'index 1, et ainsi de suite. Pour nommer vos propres étiquettes, vous devez utiliser le indice argument.

Comment créer une série vide

s = pd. Série (dtype='float64')
s

Sortir:

Série([], type: float64)

Dans l'exemple ci-dessus, une série vide avec le flotter type de données est créé.

Comment créer une série à l'aide d'un tableau NumPy

importer des pandas au format pd
importer numpy en tant que np
d = np.tableau([1, 2, 3, 4, 5])
s = pd. Série (d)
s

Sortir:

0 1
1 2
2 3
3 4
4 5
type: int32

En rapport: Opérations NumPy pour les débutants

Comment créer une série à l'aide d'une liste

d = [1, 2, 3, 4, 5]
s = pd. Série (d)
s

Sortir:

0 1
1 2
2 3
3 4
4 5
type: int64

Comment créer une série avec index

Pour créer une série avec un index, vous devez utiliser le indice argument. Le nombre d'index doit être égal au nombre d'éléments de la série.

d = [1, 2, 3, 4, 5]
s = pd. Série (d, index=["un", "deux", "trois", "quatre", "cinq"])
s

Sortir:

un 1
deux 2
trois 3
quatre 4
cinq 5
type: int64

Comment créer une série à l'aide d'un dictionnaire

Les clés du dictionnaire deviennent les étiquettes de la série.

d = {"un": 1,
"deux": 2,
"trois": 3,
"quatre": 4,
"cinq": 5}
s = pd. Série (d)
s

Sortir:

un 1
deux 2
trois 3
quatre 4
cinq 5
type: int64

Comment créer une série à l'aide d'une valeur scalaire

Si vous souhaitez créer une série à l'aide d'une valeur scalaire, vous devez fournir le indice argument.

s = pd. Série (1, indice = ["a", "b", "c", "d"])
s

Sortir:

un 1
b 1
c 1
d1
type: int64

3. Comment créer un cadre de données dans Pandas

Un DataFrame est une structure de données bidimensionnelle où les données sont alignées sous forme de lignes et de colonnes. Un DataFrame peut être créé à l'aide de dictionnaires, de listes, d'une liste de dictionnaires, de tableaux numpy, etc. Dans le monde réel, les DataFrames sont créés à l'aide d'un stockage existant comme des fichiers CSV, des fichiers Excel, des bases de données SQL, etc.

L'objet DataFrame prend en charge un certain nombre d'attributs et de méthodes. Si vous voulez en savoir plus à leur sujet, vous pouvez consulter la documentation officielle de cadre de données pandas.

Comment créer un DataFrame vide

df = pd. Trame de données()
imprimer (df)

Sortir:

Cadre de données vide
Colonnes: []
Indice: []

Comment créer un DataFrame à l'aide d'une liste

listObj = ["MUO", "technologie", "simplifié"]
df = pd. DataFrame (listObj)
imprimer (df)

Sortir:

 0
0 MUO
1 technologie
2 simplifié

Comment créer un DataFrame à l'aide du dictionnaire de ndarray/listes

batmanData = {'Nom du film': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
« Année de sortie »: [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
imprimer (df)

Sortir:

 Nom du film Année de sortie
0 Batman commence 2005
1 Le chevalier noir 2008
2 Le chevalier noir se lève 2012

Comment créer un DataFrame à l'aide d'une liste de listes

données = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (données, colonnes = ['Name', 'Roll No.'])
imprimer (df)

Sortir:

 Nom Roll No.
0 Alex 601
1 Bob 602
2 Cataline 603

Comment créer un DataFrame à l'aide d'une liste de dictionnaires

data = [{'Nom': 'Alex', 'N° de rouleau': 601},
{'Nom': 'Bob', 'N° de rouleau': 602},
{'Nom': 'Cataline', 'N° de rouleau': 603}]
df = pd. DataFrame (données)
imprimer (df)

Sortir:

 Nom Roll No.
0 Alex 601
1 Bob 602
2 Cataline 603

En rapport: Comment convertir une liste en dictionnaire en Python

Comment créer un DataFrame à l'aide de la fonction zip()

Utilisez le Zip *: français() fonction pour fusionner des listes en Python.

Nom = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = liste (zip (Nom, RollNo))
df = pd. DataFrame (listOfTuples, colonnes = ['Name', 'Roll No.'])
imprimer (df)

Sortir:

 Nom Roll No.
0 Alex 601
1 Bob 602
2 Cataline 603

4. Comment lire les données CSV dans Pandas

Un fichier « valeurs séparées par des virgules » (CSV) est un fichier texte délimité qui utilise une virgule pour séparer les valeurs. Vous pouvez lire un fichier CSV en utilisant le read_csv() méthode chez les pandas. Si vous souhaitez imprimer l'intégralité du DataFrame, utilisez le to_string() méthode.

Dans cet exemple et les suivants, cette fichier CSV sera utilisé pour effectuer les opérations.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimer (df.to_string())

Sortir:

5. Comment analyser les DataFrames à l'aide des méthodes head(), tail() et info()

Comment afficher les données à l'aide de la méthode head()

Les diriger() est l'un des meilleurs moyens d'obtenir un aperçu rapide du DataFrame. Cette méthode renvoie l'en-tête et le nombre de lignes spécifié, en commençant par le haut.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimer (df.head (10))

Sortir:

Si vous ne spécifiez pas le nombre de lignes, les 5 premières lignes seront renvoyées.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimer (df.head())

Sortir:

Comment afficher les données à l'aide de la méthode tail()

Les queue() La méthode renvoie l'en-tête et le nombre de lignes spécifié, en commençant par le bas.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimer (df.tail (10))

Sortir:

Si vous ne spécifiez pas le nombre de lignes, les 5 dernières lignes seront renvoyées.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimer (df.tail())

Sortir:

Comment obtenir des informations sur les données

Les Info() Les méthodes renvoient un bref résumé d'un DataFrame, y compris le type d'index et les types de colonne, les valeurs non NULL et l'utilisation de la mémoire.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimer (df.info())

Sortir:

6. Comment lire les données JSON dans Pandas

JSON (JavaScopiste Objet Notation) est un format d'échange de données léger. Vous pouvez lire un fichier JSON en utilisant le read_json() méthode chez les pandas. Si vous souhaitez imprimer l'intégralité du DataFrame, utilisez le to_string() méthode.

Dans l'exemple ci-dessous, ce fichier JSON est utilisé pour effectuer les opérations.

En rapport: Qu'est-ce que JSON? Aperçu d'un profane

df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
imprimer (df.to_string())

Sortir:

Rafraîchissez vos connaissances Python avec des fonctions et méthodes intégrées

Les fonctions aident à raccourcir votre code et à améliorer son efficacité. Fonctions et méthodes comme réduire(), diviser(), énumérer(), eval(), tour(), etc. peut rendre votre code robuste et facile à comprendre. Il est toujours bon de connaître les fonctions et méthodes intégrées car elles peuvent simplifier considérablement vos tâches de programmation.

PartagerTweeterE-mail
20 fonctions Python à connaître

La bibliothèque standard Python contient de nombreuses fonctions pour vous aider dans vos tâches de programmation. Découvrez les plus utiles et créez un code plus robuste.

Lire la suite

Rubriques connexes
  • La programmation
  • Python
  • Développement web
  • La programmation
  • L'analyse des données
A propos de l'auteur
Yuvraj Chandra (69 articles publiés)

Yuvraj est un étudiant de premier cycle en informatique à l'Université de Delhi, en Inde. Il est passionné par le développement Web Full Stack. Quand il n'écrit pas, il explore la profondeur de différentes technologies.

Plus de Yuvraj Chandra

Abonnez-vous à notre newsletter

Rejoignez notre newsletter pour des conseils techniques, des critiques, des ebooks gratuits et des offres exclusives !

Cliquez ici pour vous abonner