Logistic Regression
Réalisé par : Mayar khammassi
Molka Touil
Rania Magtouf
Oumayma ben Mbarek
Année Académique 2025-2026
1
Plan
1
2
3
4
Introduction
Fondements mathématiques
Entraînement du modèle
Évaluation du modèle
2
5
6
7
Applications
Avantages et Inconvénients
Conclusion
8
Projet pratique
Plan
3
1
Introduction
Introduction
Le Concept de Classification:
Dans de nombreux problèmes en apprentissage automatique, l’objectif n’est pas de prédire une valeur numérique précise, mais plutôt de déterminer à quelle catégorie appartient une observation. Ce type de problème est appelé classification. Par exemple, on peut vouloir prédire si un étudiant va réussir ou échouer, ou encore si un email est un spam ou non.
5
Différence clé:
La principale différence entre la régression linéaire et la régression logistique réside dans le type de résultat attendu. La régression linéaire est utilisée pour prédire des valeurs continues pouvant aller de −∞ à +∞. En revanche, la régression logistique est conçue pour des problèmes de classification, où la sortie doit être limitée à des catégories spécifiques.
L'objectif :
L’objectif de la régression logistique est donc d’estimer une probabilité de succès, c’est-à-dire une valeur comprise entre 0 et 1. Cette probabilité permet ensuite de prendre une décision en classant l’observation dans une catégorie donnée, en fonction d’un seuil.
Introduction
6
2
Fondements mathématiques
Modèle linéaire de base:
On commence par une combinaison linéaire des variables explicatives :
Fondements mathématiques
8
Composant | Nom | Rôle |
z | Variable dépendante (ou Sortie) | Résultat calculé par le modèle avant la décision finale |
w₀ | Biais (ou Ordonnée à l'origine) | Valeur de base lorsque toutes les variables sont nulles |
x₁, x₂, … | Caractéristiques (features) | Données d’entrée (ex : âge, prix, température) |
w₁, w₂, … | Poids (ou Coefficients) | Importance de chaque caractéristique dans le modèle |
Pour transformer cette valeur en probabilité entre 0 et 1, on utilise la fonction sigmoïde :
Fondements mathématiques
9
La Fonction Sigmoïde :
La fonction sigmoïde est au cœur de la régression logistique.
Elle permet de transformer une valeur linéaire (qui peut être n’importe quel nombre) en une probabilité comprise entre 0 et 1.
Fondements mathématiques
10
Fondements mathématiques
11
Interprétation de σ(z) selon la valeur de z
Cette fonction permet de modéliser une probabilité
P(Y=1∣X)=σ(z)
On utilise un seuil (threshold)généralement 0.5 :
Si σ(z)≥0.5 → Classe 1
Si σ(z)<0.5 → Classe 0
Fondements mathématiques
12
Question 1 :
On donne un modèle logistique avec une seule variable x,Calculer la probabilité et donner la classe prédite.
Données :
Étapes de calcul :
Excercice
Résultat (probabilité) : 0.73
Prédiction (classe) : 1 (car 0,73 ≥ 0,5)
13
Question 2 :
On donne un modèle logistique avec deux variables x1 et x2. Calculer la probabilité et donner la classe prédite.
Données :
Étapes de calcul :
Résultat (probabilité) : 0.97
Prédiction (classe) : 1 (car 0,97 ≥ 0,5)
Excercice
14
3
Entraînement du modèle
Pourquoi entraîner un modèle ?
Un modèle de Machine Learning doit apprendre à partir des données. Sans apprentissage, il produit des prédictions aléatoires d’où L’entraînement consiste à trouver les meilleurs paramètres (poids) afin de faire des prédictions précises.
Processus global:
16
Estimateur vraisemblance
Définition:
Le Maximum Likelihood Estimation (MLE) est une méthode utilisée pour trouver les meilleurs paramètres d’un modèle statistique.Elle
consiste à choisir les paramètres qui rendent les données
observées les plus probables.En pratique, on maximise la log-vraisemblance, ce qui revient à minimiser la Log Loss.
17
Fonction de vraisemblance:
Log-vraisemblance:
Estimateur vraisemblance
18
Estimateur vraisemblance
Objectif du Maximum de Vraisemblance:
19
Nous avons défini la vraisemblance pour trouver les meilleurs paramètres en maximisant la probabilité des données. Cependant, cette approche présente des limites en pratique :
Pour simplifier : On applique le logarithme :
Maximiser la vraisemblance ⇔ Minimiser la Log Loss
De la vraisemblance à la Log Loss:
20
Fonction de perte : Log Loss
Définition:
La Log Loss (Binary Cross-Entropy) est une fonction utilisée en régression logistique pour mesurer l’erreur entre les prédictions du modèle et les vraies valeurs. Elle compare la probabilité prédite avec la valeur réelle (0 ou 1).Elle pénalise fortement les erreurs faites avec grande confiance.
d’où:
Si la prédiction est correcte → perte faible
Si la prédiction est incorrecte → perte élevée
21
Fonction de perte : Log Loss
Fonction de perte : Log Loss:
22
Fonction de perte : Log Loss
Explication du formule:
23
Fonction de perte : Log Loss
Rôle de la fonction de perte (Log Loss):
24
Maintenant, nous savons ce que nous voulons minimiser. Une question se pose alors :
Comment trouver les meilleurs paramètres (poids) qui minimisent cette erreur ?
Pour résoudre ce problème, on utilise un algorithme d’optimisation :la descente de gradient (Gradient Descent).
donc
25
Optimisation (Descente de Gradient)
définition:
26
Optimisation (Descente de Gradient)
Formule de mise à jour:
27
Optimisation (Descente de Gradient)
Explication du formule:
28
Étape | Action | Pourquoi |
1 | Initialiser θ aléatoirement | Point de départ |
2 | Calculer la perte J(θ) | Mesurer l'erreur actuelle |
3 | Calculer le gradient ∇J(θ) | Trouver la direction de montée |
4 | Mettre à jour θ := θ − α·∇J | Faire un pas vers le bas |
5 | Répéter jusqu'à convergence | Atteindre le minimum |
Optimisation (Descente de Gradient)
Fonctionnement:
29
30
31
32
33
4
Évaluation du modèle
Évaluation du modèle
35
Évaluation du modèle
36
Évaluation du modèle
37
Évaluation du modèle
38
Évaluation du modèle
39
Évaluation du modèle
40
Évaluation du modèle
41
Évaluation du modèle
42
Évaluation du modèle
43
5
Applications
Applications
La régression logistique est utilisée dans plusieurs domaines.
45
6
Avantages et Inconvénients
Avantages et Inconvénients
47
7
Conclusion
Conclusion
En conclusion, la régression logistique est un modèle très important en apprentissage supervisé.
Elle est surtout utilisée pour les problèmes de classification binaire.
Mais pour des cas plus complexes, on utilise des modèles plus avancés comme les réseaux de neurones ou les SVM.
49
8
Projet pratique
Projet pratique
Installations et imports
51
Projet pratique
Chargement des données
Charger breast_cancer : data = load_breast_cancer() charge le dataset de classification binaire (bénin ↔ malin)
52
Projet pratique
Division entraînement / test
sépare 80% pour l'entraînement et 20% pour le test
53
Projet pratique
Normalisation (indispensable pour la logistique)
centre et réduit les données
54
Projet pratique
Modèle de régression logistique
apprend la régression logistique sur les données normalisées
55
Projet pratique
Prédictions
56
Projet pratique
Matrice de confusion
affiche les bonnes et mauvaises classifications
57
Projet pratique
Rapport de classification
58
Projet pratique
Courbe ROC et AUC
évalue la performance du modèle
59
Projet pratique
Exemple de prédiction sur une nouvelle observation
60