Outils pour utilisateurs

Outils du site


python:pandas

Pandas

Installation

pip install pandas

Bases

import pandas as pd

Lecture de données

Lire un .CSV :

df = pd.read_csv('nom_du_fichier.csv')

Lire un .XLS (installer xlrd) :

pip install xlrd
df = pd.read_excel('nom_du_fichier.xls')

Lire un .XLSX (installer openpyxl) :

pip install openpyxl
df = pd.read_excel('nom_du_fichier.xlsx')

Connexion à une base de données

Cheat Sheet

Exemple Description
df.shape Dimensions de la DataFrame (rows, cols)
df.dtypes Types de données dans les colonnes
df.head(n) Les n premières lignes (par défaut 5)
df.tail(n) Les n dernières lignes (par défaut 5)
df.describe() Stats globales sur les colonnes numériques (min, max, %, …)
df['age'].min() Plus petite valeur de la colonne 'age'
df['age'].max() Plus grande valeur de la colonne 'age'
df['age'].mean() Valeur moyenne de la colonne 'age'
python/pandas.txt · Dernière modification: 2022/03/18 07:10 (modification externe)