Liens

Site F. Husson





Livre Analyse de données

Plan

Introduction

Analyse en Composantes Principales

Analyse des correspondances

Analyse des correspondances multiples

Classification

Analyse Factorielle Multiple

Pour conclure

Forum

Quiz 3 sur la classification

Pour toutes les questions, cocher la ou les affirmations vraies.

Q1) L'algorithme de partitionnement des K-means
permet de déterminer le nombre de classes
est un algorithme itératif
nécessite de définir un nombre de classes

Q2) L'algorithme de partitionnement des K-means
conduit toujours à la même solution sur un même jeu de données
peut être lancé avec plusieurs initialisations pour trouver la meilleure solution
fournit toujours la solution qui minimise la distance inertie inter sur inertie totale

Q3) Utilisation conjointe de la classification ascendante hiérarchique et de l'algorithme des K-means.
Les classes obtenues en coupant l'arbre hiérarchique peuvent servir d'initialisation dans l'algorithme des K-means
L'algorithme des K-means détermine un nombre de classes pour couper l'arbre de la CAH
On peut utiliser la CAH pour déterminer un nombre de classes pour les K-means
L'algorithme des K-means peut consolider les classes de l'arbre hiérarchique

Q4) Données en grandes dimensions.
Lorsque le nombre d'individus est très grand, on peut commencer par construire un arbre hiérarchique avant de faire des K-means
Lorsque le nombre d'individus est très grand, on peut commencer par regrouper les individus par K-means avant de faire la CAH
Lorsque le nombre de variables est grand, on peut construire une analyse factorielle et retenir les premières dimensions factorielles pour construire la classification

Q5) Analyse factorielle et classification. Faire une classification sur les premières dimensions factorielles plutôt que sur les données brutes
revient à supprimer l'information de certaines variables
permet d'éliminer le bruit contenu dans les dernières dimensions
permet d'avoir une classification plus stable
permet d'avoir une vision grossière de l'information par la partition et une vision plus fine par l'analyse factorielle

Score =
Réponses correctes :