====== Pandas ======
* Documentation
* [[https://pandas.pydata.org/docs/|Documentation officielle]]
* Vidéos
* [[https://www.youtube.com/watch?v=zZkNOdBWgFQ&t=935s|Machine Learnia
- PANDAS PYTHON Français - Introduction + Analyse du Titanic (17/30)]]
* [[https://www.youtube.com/watch?v=M-4EpNdlSuY&t=10s|codebasics - Python Pandas Tutorial 14: Read Write Data From Database (read_sql, to_sql)]]
===== Installation =====
pip install pandas
===== Bases =====
import pandas as pd
===== Lecture de données =====
Lire un .CSV :
df = pd.read_csv('nom_du_fichier.csv')
Lire un .XLS (installer **xlrd**) :
pip install xlrd
df = pd.read_excel('nom_du_fichier.xls')
Lire un .XLSX (installer **openpyxl**) :
pip install openpyxl
df = pd.read_excel('nom_du_fichier.xlsx')
===== Connexion à une base de données =====
===== Cheat Sheet =====
^ Exemple ^ Description ^
| ''df.shape'' | Dimensions de la DataFrame (rows, cols) |
| ''df.dtypes'' | Types de données dans les colonnes |
| ''df.head(n)'' | Les **n** premières lignes (par défaut 5) |
| ''df.tail(n)'' | Les **n** dernières lignes (par défaut 5) |
| ''df.describe()'' | Stats globales sur les colonnes numériques (min, max, %, ...) |
| ''df['age'].min()'' | Plus petite valeur de la colonne 'age' |
| ''df['age'].max()'' | Plus grande valeur de la colonne 'age' |
| ''df['age'].mean()'' | Valeur moyenne de la colonne 'age' |