Data Science

Data mining, Analyse de survie et durée de vie

Objectifs

  • Retenir vos clients est certainement un de vos préoccupations majeures
  • Vous souhaitez pour cela mettre en place des modèles anti-churn performants
  • L’analyse de durée de vie (encore appelée analyse de survie) est une méthode alternative aux méthodes plus classiques telles que la régression logistique
  • Cette formation de deux journées vous familiarisera avec cette technique et vous permettra de construire des modèles d’attrition opérationnels, efficaces et robustes
  • Vous découvrirez également les autres problématiques pour lesquelles l’analyse de survie peut apporter une réponse pertinente

Programme

Principes de l’analyse de survie
  • Définition de l’analyse de survie et contexte d’utilisation
  • Champs d’applications possibles : bio-statistiques, marketing (attrition, prévision, durée de vie produit …), secteur bancaire (risque de crédit et recouvrement), actuariat, industrie
  • Les avantages et inconvénients de l’analyse de survie : comparaison avec la Régression Logistique
Les données de survie
  • Définition de l’événement d’intérêt
  • Importance du choix de l’unité de temps
  • Censures et troncatures : définitions et principales méthodes
  • Fonctions de hasard et courbes de survie : définition, lois statistiques (loi de Weibull, loi de Pareto, loi log-logistique), exemples
  • Application : Construction d’une table de survie
Les méthodes d’analyse
  • L’analyse de la variance : rappel, mode d’utilisation, limites
  • Une méthode non paramétrique usuelle, l’estimation de Kaplan Meier : définition, utilisation pratique, limites
  • Les modèles paramétriques et semi paramétriques : modèle de Poisson, modèle de Cox, modèle « accéléré », modèle logistique conditionnelle
Cas pratique sous R
Les séries temporelles (Prev Lesson)
(Formation suivante) Langage R
Retour à Data Science

Pas de commentaires

Donner un commentaire