Outils pour utilisateurs

Outils du site


python:pandas

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
python:pandas [2022/03/12 10:20]
marclebrun [Bases]
python:pandas [2022/03/18 07:10] (Version actuelle)
Ligne 1: Ligne 1:
 ====== Pandas ====== ====== Pandas ======
 +
 +  * Documentation
 +    * [[https://​pandas.pydata.org/​docs/​|Documentation officielle]]
 +
 +  * Vidéos
 +    * [[https://​www.youtube.com/​watch?​v=zZkNOdBWgFQ&​t=935s|Machine Learnia
 + - PANDAS PYTHON Français - Introduction + Analyse du Titanic (17/30)]]
 +    * [[https://​www.youtube.com/​watch?​v=M-4EpNdlSuY&​t=10s|codebasics - Python Pandas Tutorial 14: Read Write Data From Database (read_sql, to_sql)]]
 +
  
 ===== Installation ===== ===== Installation =====
Ligne 13: Ligne 22:
 </​code>​ </​code>​
  
-Lire un CSV :+===== Lecture de données ===== 
 + 
 +Lire un .CSV :
  
 <code python> <code python>
-data = pd.read_csv('​nom_du_fichier.csv'​)+df = pd.read_csv('​nom_du_fichier.csv'​)
 </​code>​ </​code>​
 +
 +Lire un .XLS (installer **xlrd**) :
 +
 +<code bash>
 +pip install xlrd
 +</​code>​
 +
 +<code python>
 +df = pd.read_excel('​nom_du_fichier.xls'​)
 +</​code>​
 +
 +Lire un .XLSX (installer **openpyxl**) :
 +
 +<code bash>
 +pip install openpyxl
 +</​code>​
 +
 +<code python>
 +df = pd.read_excel('​nom_du_fichier.xlsx'​)
 +</​code>​
 +
 +===== Connexion à une base de données =====
 +
 +
 +===== Cheat Sheet =====
 +
 +^ Exemple ​             ^ Description ​                                    ^
 +| ''​df.shape'' ​        | Dimensions de la DataFrame (rows, cols)         |
 +| ''​df.dtypes'' ​       | Types de données dans les colonnes ​             |
 +| ''​df.head(n)'' ​      | Les **n** premières lignes (par défaut 5)       |
 +| ''​df.tail(n)'' ​      | Les **n** dernières lignes (par défaut 5)       |
 +| ''​df.describe()'' ​   | Stats globales sur les colonnes numériques (min, max, %, ...) |
 +| ''​df['​age'​].min()'' ​ | Plus petite valeur de la colonne '​age' ​    |
 +| ''​df['​age'​].max()'' ​ | Plus grande valeur de la colonne '​age' ​    |
 +| ''​df['​age'​].mean()''​ | Valeur moyenne de la colonne '​age' ​        |
  
python/pandas.1647080402.txt.gz · Dernière modification: 2022/03/12 10:20 par marclebrun