pip install pandas
import pandas as pd
Lire un .CSV :
df = pd.read_csv('nom_du_fichier.csv')
Lire un .XLS (installer xlrd) :
pip install xlrd
df = pd.read_excel('nom_du_fichier.xls')
Lire un .XLSX (installer openpyxl) :
pip install openpyxl
df = pd.read_excel('nom_du_fichier.xlsx')
Exemple | Description |
---|---|
df.shape | Dimensions de la DataFrame (rows, cols) |
df.dtypes | Types de données dans les colonnes |
df.head(n) | Les n premières lignes (par défaut 5) |
df.tail(n) | Les n dernières lignes (par défaut 5) |
df.describe() | Stats globales sur les colonnes numériques (min, max, %, …) |
df['age'].min() | Plus petite valeur de la colonne 'age' |
df['age'].max() | Plus grande valeur de la colonne 'age' |
df['age'].mean() | Valeur moyenne de la colonne 'age' |