Data Science

Data mining, Analyse de survie et durée de vie

Objectifs

  • Retenir vos clients est certainement un de vos préoccupations majeures
  • Vous souhaitez pour cela mettre en place des modèles anti-churn performants
  • L’analyse de durée de vie (encore appelée analyse de survie) est une méthode alternative aux méthodes plus classiques telles que la régression logistique
  • Cette formation de deux journées vous familiarisera avec cette technique et vous permettra de construire des modèles d’attrition opérationnels, efficaces et robustes
  • Vous découvrirez également les autres problématiques pour lesquelles l’analyse de survie peut apporter une réponse pertinente

Programme

Principes de l’analyse de survie
  • Définition de l’analyse de survie et contexte d’utilisation
  • Champs d’applications possibles : bio-statistiques, marketing (attrition, prévision, durée de vie produit …), secteur bancaire (risque de crédit et recouvrement), actuariat, industrie
  • Les avantages et inconvénients de l’analyse de survie : comparaison avec la Régression Logistique
Les données de survie
  • Définition de l’événement d’intérêt
  • Importance du choix de l’unité de temps
  • Censures et troncatures : définitions et principales méthodes
  • Fonctions de hasard et courbes de survie : définition, lois statistiques (loi de Weibull, loi de Pareto, loi log-logistique), exemples
  • Application : Construction d’une table de survie
Les méthodes d’analyse
  • L’analyse de la variance : rappel, mode d’utilisation, limites
  • Une méthode non paramétrique usuelle, l’estimation de Kaplan Meier : définition, utilisation pratique, limites
  • Les modèles paramétriques et semi paramétriques : modèle de Poisson, modèle de Cox, modèle « accéléré », modèle logistique conditionnelle
Cas pratique sous R
Please login to get access to the quiz
Les séries temporelles (Prev Lesson)
(Next Lesson) Langage R
Back to Data Science
Public

Chefs de projets statistiques, chargés d’étude, analystes, développeur, …| Chefs de projets statistiques, chargés d’étude, analystes, développeur, …

Pré-requis

Une connaissance des méthodes usuelles de Datamining est requise. En particulier, il est préférable de connaître la régression logistique puisqu’elle sera régulièrement comparée aux méthodes d’analyse de survie. Avoir suivi la formation R niveau 1 ou avoir une utilisation basique de R.| Une connaissance des méthodes usuelles de Datamining est requise. En particulier, il est préférable de connaître la régression logistique puisqu’elle sera régulièrement comparée aux méthodes d’analyse de survie. Avoir suivi la formation R niveau 1 ou avoir une utilisation basique de R.