Dans ce cours nous chercherons à modéliser une variable Y (variable à expliquer, réponse) en fonction d’une ou plusieurs variables explicatives X1, . . . , Xp (covariables). Lorsque Y sera quantitative (montant d’épargne investit, durée de rémission d’une maladie...), nous parlerons de régression ou encore d’analyse de variance (ou covariance) selon la nature des variables explicatives, qui peuvent être rassemblées sous l’appellation modèle linéaire. Lorsque Y est une variable aléatoire qualitative (défaut de remboursement, achat d’un produit...), nous parlerons généralement de classification, supervisée lorsque l’on dispose d’observation de Y , et non supervisée dans le cas contraire. Nous verrons dans ce cours deux méthodes de classification supervisée : la régression logistique, qui est une extension du modèle linéaire à la famille des modèles linéaires généralisés.