====== Pandas ====== * Documentation * [[https://pandas.pydata.org/docs/|Documentation officielle]] * Vidéos * [[https://www.youtube.com/watch?v=zZkNOdBWgFQ&t=935s|Machine Learnia - PANDAS PYTHON Français - Introduction + Analyse du Titanic (17/30)]] * [[https://www.youtube.com/watch?v=M-4EpNdlSuY&t=10s|codebasics - Python Pandas Tutorial 14: Read Write Data From Database (read_sql, to_sql)]] ===== Installation ===== pip install pandas ===== Bases ===== import pandas as pd ===== Lecture de données ===== Lire un .CSV : df = pd.read_csv('nom_du_fichier.csv') Lire un .XLS (installer **xlrd**) : pip install xlrd df = pd.read_excel('nom_du_fichier.xls') Lire un .XLSX (installer **openpyxl**) : pip install openpyxl df = pd.read_excel('nom_du_fichier.xlsx') ===== Connexion à une base de données ===== ===== Cheat Sheet ===== ^ Exemple ^ Description ^ | ''df.shape'' | Dimensions de la DataFrame (rows, cols) | | ''df.dtypes'' | Types de données dans les colonnes | | ''df.head(n)'' | Les **n** premières lignes (par défaut 5) | | ''df.tail(n)'' | Les **n** dernières lignes (par défaut 5) | | ''df.describe()'' | Stats globales sur les colonnes numériques (min, max, %, ...) | | ''df['age'].min()'' | Plus petite valeur de la colonne 'age' | | ''df['age'].max()'' | Plus grande valeur de la colonne 'age' | | ''df['age'].mean()'' | Valeur moyenne de la colonne 'age' |