Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
python:pandas [2022/03/13 06:28] marclebrun |
python:pandas [2022/03/18 07:10] (Version actuelle) |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
====== Pandas ====== | ====== Pandas ====== | ||
+ | |||
+ | * Documentation | ||
+ | * [[https://pandas.pydata.org/docs/|Documentation officielle]] | ||
* Vidéos | * Vidéos | ||
- | * [[https://www.youtube.com/watch?v=zZkNOdBWgFQ&t=935s]] | + | * [[https://www.youtube.com/watch?v=zZkNOdBWgFQ&t=935s|Machine Learnia |
+ | - PANDAS PYTHON Français - Introduction + Analyse du Titanic (17/30)]] | ||
+ | * [[https://www.youtube.com/watch?v=M-4EpNdlSuY&t=10s|codebasics - Python Pandas Tutorial 14: Read Write Data From Database (read_sql, to_sql)]] | ||
===== Installation ===== | ===== Installation ===== | ||
Ligne 21: | Ligne 27: | ||
<code python> | <code python> | ||
- | data = pd.read_csv('nom_du_fichier.csv') | + | df = pd.read_csv('nom_du_fichier.csv') |
</code> | </code> | ||
Ligne 31: | Ligne 37: | ||
<code python> | <code python> | ||
- | data = pd.read_excel('nom_du_fichier.xls') | + | df = pd.read_excel('nom_du_fichier.xls') |
</code> | </code> | ||
Ligne 41: | Ligne 47: | ||
<code python> | <code python> | ||
- | data = pd.read_excel('nom_du_fichier.xlsx') | + | df = pd.read_excel('nom_du_fichier.xlsx') |
</code> | </code> | ||
+ | ===== Connexion à une base de données ===== | ||
+ | |||
+ | |||
+ | ===== Cheat Sheet ===== | ||
+ | |||
+ | ^ Exemple ^ Description ^ | ||
+ | | ''df.shape'' | Dimensions de la DataFrame (rows, cols) | | ||
+ | | ''df.dtypes'' | Types de données dans les colonnes | | ||
+ | | ''df.head(n)'' | Les **n** premières lignes (par défaut 5) | | ||
+ | | ''df.tail(n)'' | Les **n** dernières lignes (par défaut 5) | | ||
+ | | ''df.describe()'' | Stats globales sur les colonnes numériques (min, max, %, ...) | | ||
+ | | ''df['age'].min()'' | Plus petite valeur de la colonne 'age' | | ||
+ | | ''df['age'].max()'' | Plus grande valeur de la colonne 'age' | | ||
+ | | ''df['age'].mean()'' | Valeur moyenne de la colonne 'age' | | ||