1 of 13

Analyser vos données à des fins de prédictions

Editable Location

Harouna Diallo

2 of 13

Harouna Diallo, Ingenieur SRE / Machine Learning

CTO / Co-founder Nimba Solution, Nimba Hub, Nimba SMS.

Consultant SRE en Guinee, Senegal, Cameroun et France.

3 of 13

Analyser ?

Des donnees ?

Universite de Labe

4 of 13

  • Collecte des données
  • Exploration
  • Preparation
  • Modelisation
  • Deploiement du Model

5 of 13

Pourquoi vouloir analyser des données ?

  • Mieux decider
  • Optimiser les ressources
  • Innover et Opportunite
  • Comprendre les habitudes
  • Mesurer l’impact
  • Prevoir et Anticiper

6 of 13

Comprehension des Donnees ?

Qualitative

Quantitative

Qualitative

Continue

Discrète

Ordinale

Nominale

  • température
  • poids,
  • prix d’une maison
  • nombre de jours d’un mois
  • nombre employés
  • couleur,
  • pays,
  • genre (homme, femme)
  • appréciation (bien, très bien, mauvais…)
  • niveau sociale( faible revenu, revenu moyen, revenu élevé)
  • Moyenne, médiane, écart type…
  • Mode, proportion par modalité

7 of 13

Analyser et Comprendre ?

  • Exploration des donnees (E.D.A)
  • Preparation des donnees

8 of 13

Exploration des donnees ?

  • Examiner la distribution
  • Effectue des analyses univariees
  • Effectuer des correlations bivaries
  • Detecter les valeurs aberrantes

9 of 13

Preparation des donnees ?

  • Nettoyer
    • Valeur manquante
    • Donnees dupliques
    • Valeur aberrantes
  • Selection de variable
  • Transformer les variables
    • Normalisation et Standardisation
  • Extraction des caracteristiques
  • Division des données
    • Entrainement
    • Test

10 of 13

Analyse exploratoire ?

  • Analyse Univariate
    • En rapport avec une variable

  • Analyse Multivariee
    • En rapport avec deux ou plusieurs variables

11 of 13

Pretraitement ?

  • Données manquantes
  • Données catégorielles
  • Format inadéquat
  • Valeurs extrêmes
  • Ordre de grandeur différent
  • Enregistrement en double
  • Imputation
  • Suppression
  • Convertir en numérique
  • Conversion de type
  • Filtrer les valeurs
  • Normalisation

Solutions

12 of 13

  • Type de variables
    • Quantitative
    • Qualitative
  • Analysis exploratoire
  • Variables dupliquées
  • Corrélation
    • Deux features entre eux
    • Avec la variable cible
  • Valeur aberrante ou extrême
  • Remplacement par la moyenne / Médiane
  • Remplacement localisée
  • Remplacement par catégorie
  • Normalisation et Standardisation
  • L’encodage des variables catégorielles (Ordinal, Nominal)
  • Features Engineering
  • Divulgation de la variable cible

13 of 13

Question ?