Ce qu'est la zone grise

François Gueyffier, 12 septembre 2002, 11h00 :

En reprenant les CR de réunion, je m'aperçois que la zone grise
n'a jamais vraiment été définie.
Pour ce que j'en perçois, il s'agit des erreurs de classification.
Le poids de ces erreurs n'est pas le même selon qu'il s'agit
d'individus "à haut risque" non décédés, ou d'individus
"à bas risque" décédés. Les premiers peuvent assez (trop ?)
facilement expliqués par la surveillance limitée dans le temps
(et l'introduction de cette variable paraît ici essentielle).
Les seconds sont sans doute les plus intéressants, et arriver
à mettre en évidence l'existence d'une variable latente qui les
explique en partie me paraît tout à fait important.
1. Me fais-je comprendre ?
2. Mon raisonnement vous paraît-il juste et si oui, utile à
prendre en compte dans les étapes prochaines ?

Marie-Christine Jaulent, 16 septembre 2002, 16h00 :

Tu t'es parfaitement fait comprendre.

Pour ce que je perçois moi de la zone grise, je pense comme toi
qu'il s'agit des erreurs de classification et je suis d'accord
avec ton raisonnement.

Je vois également un type d'erreur que la zone grise englobe,
c'est le bruit. Pour moi, il s'agit des variables "en trop" qui
vont venir polluer les variables (ou la combinaison de variables)
importantes pour une classification correcte d'un patient.
Le problème étant que cet "overfitting" n'est pas forcément
le même pour tous les patients (il y a des patients pour lesquels
un surpoids n'a aucune conséquence dans leur vie mais qui peut
les faire changer de classe sur le papier).
Ce bruit peut provoquer les erreurs de classification que tu décrits.
Par contre, je ne sais pas s'il peut - et doit - être pris en compte.