Projet Indana
Ce projet a pour but d'analyser les problèmes d'apprentissage posés par les données INDANA (INdividual Data ANalysis of Antihypertensive intervention) pour la prédiction du risque cardiovasculaire.
Documents relatifs au projet Indana
Explications et présentations
- présentation du projet ;
- documentation des fichiers d'exemples par Isabelle Colombet ;
- les courbes ROC par Isabelle Colombet (fichier PowerPoint) ;
- présentation d'Indana par François Gueyffier (fichier PowerPoint) ;
- l'algorithme em appliqué aux données INDANA par Antoine Cornuéjols (fichier PowerPoint) ;
- Alexandre Pitti : rapport, exposé.
Discussions
Comptes rendus
- réunion du 10 mars 2003 ;
- réunion du 9 janvier 2003 ;
- réunion du 5 septembre 2002 ;
- réunion du 27 juin 2002 ;
- réunion du 29 avril 2002 ;
- réunion du 11 février 2002 ;
- réunion du 29 octobre 2001.
Articles liés au projet
- A score for predicting risk of death from cardiovascular disease in adults with raised blood pressure, based on individual patient data from randomised controlled trials, Stuart Pocock, Valerie McCormack, François Gueyffier, Florent Boutitie, Robert Fagard, Jean-Pierre Boissel, 2001 ;
- Advantages and Disadvantages of Using Artificial Neural Network versus Logistic Regression for Predicting Medical Outcomes, Jack V. Tu, 1996 ;
- User's Guides to the Medical Literature ;
- Bibliographie
Expérimentations communes sur les données SHEP
Rappels
- le protocole
Présentation par les exemples
Les résultats par classe
Les résultats par scores connus
- classe EVENT selon Framingham
- classe NO EVENT selon Framingham
- toute classe selon Framingham
- classe EVENT selon Pocock
- classe NO EVENT selon Pocock
- toute classe selon Pocock
Exemples spéciaux
- exemple EVENT (le plus souvent) bien classé : 2024302
- exemple NO EVENT (le plus souvent) bien classé : 6109106
- exemple EVENT (le plus souvent) mal classé : 8091508
- exemple NO EVENT (le plus souvent) mal classé : 14002314
Présentation par les méthodes
Les résultats par méthode
Proximités des méthodes
Balanced-bagging | C4.5 | Foret-Floue-stricte | Foret-Floue-T-norme | Framingham | GloBoost | Pocock | Regression | |
---|---|---|---|---|---|---|---|---|
Balanced-bagging | 100.00 % | 54.19 % | 58.26 % | 57.68 % | 57.94 % | 68.81 % | 58.10 % | 59.00 % |
C4.5 | 54.19 % | 100.00 % | 61.12 % | 55.96 % | 60.76 % | 69.19 % | 62.91 % | 64.80 % |
Foret-Floue-stricte | 58.26 % | 61.12 % | 100.00 % | 85.07 % | 68.52 % | 64.34 % | 64.13 % | 71.21 % |
Foret-Floue-T-norme | 57.68 % | 55.96 % | 85.07 % | 100.00 % | 67.40 % | 61.10 % | 62.47 % | 69.73 % |
Framingham | 57.94 % | 60.76 % | 68.52 % | 67.40 % | 100.00 % | 62.66 % | 75.96 % | 77.31 % |
GloBoost | 68.81 % | 69.19 % | 64.34 % | 61.10 % | 62.66 % | 100.00 % | 61.70 % | 66.93 % |
Pocock | 58.10 % | 62.91 % | 64.13 % | 62.47 % | 75.96 % | 61.70 % | 100.00 % | 69.69 % |
Regression | 59.00 % | 64.80 % | 71.21 % | 69.73 % | 77.31 % | 66.93 % | 69.69 % | 100.00 % |
Moyennes | 59.14 % | 61.28 % | 67.52 % | 65.63 % | 67.22 % | 64.96 % | 64.99 % | 68.38 % |
Combinaisons de méthodes
Contributions du GRAppA pour le projet Indana
- Projet Indana, GRAppA, travail de juin 2003
Comparaison de classements d'exemples à l'aide d'outils statistiques.
- Projet Indana, GRAppA, travail d'octobre 2002
Tentative de nettoyage des données, puis apprentissage et construction de scores de risque hors zone grise.
- Projet Indana, GRAppA, travail d'août 2002
Propositions de classements des exemples et essai d'apprentissage hors zone grise.
- Projet Indana, GRAppA, travail de juin 2002
Tentative de classement des exemples par observation des apprentissages de C4.5.