Liens

Site F. Husson





Livre Analyse de données

Plan

Introduction

Analyse en Composantes Principales

Analyse des correspondances

Analyse des correspondances multiples

Classification

Analyse Factorielle Multiple

Pour conclure

Forum

Exercice.

Une évaluation sensorielle a été organisée pour caractériser 16 cocktails de fruits. Les 16 cocktails sont des mélanges de jus d'orange, jus de banane, jus de mangue et jus de citron en diverses quantités. Les noms des cocktails permettent de connaître leur composition : la lettre o pour jus d'orange, b pour banane, c pour citron et m pour mangue. La lettre n'est pas mise si le pourcentage est faible, la lettre est en minuscule si le pourcentage est moyen et la lettre est en majuscule si le pourcentage est fort. Par exemple Moc a le plus fort pourcentage de jus de mangue (50%), un pourcentage moyen de jus d'orange (45%), un pourcentage moyen de jus de citron (5%), un pourcentage faible de jus de banane (0%). Le signe * à la fin du nom du cocktail indique qu'un colorant rouge inodore et sans saveur a été ajouté.

Un jury de 12 juges a évalué chacun des 16 cocktails lors de 2 séances de dégustation en mettant des notes entre 0 et 10; une note de 0 signifie que l'odeur ou la saveur évaluée est extrêmement faible et une note de 10 signifie qu'elle est très importante. La moyenne par cocktail et par variable sensorielle a été calculée et c'est cette donnée qui est disponible.

Par ailleurs, une description physico-chimique des cocktails a été effectuée et la composition des cocktails est connue.

Le fichier suivant regroupe les données de caractérisation sensorielle, les données physico-chimiques ainsi que les données de composition. Pour ceux qui travaillent sous Mac ou linux, penser à utiliser l'argument fileEncoding="latin1" lors de l'importation.

A partir des variables sensorielles uniquement, faire une description sensorielle des cocktails, ce qui revient à construire ce que l'on appelle aussi un espace produit, en décrivant les cocktails de façon multidimensionnelle.

Q1) Quel est le pourcentage d'inertie expliqué par le premier axe ?
40.28 %
47.92%
57.30 %
72.16 %

Q2) Quelle variable supplémentaire est la plus liée à la première dimension ?
%ORANGE
%BANANE
%MANGUE
%CITRON
pH
AciditeTotale
ExtraitSec
AcideCitrique
Acide-L-Malique
Saccharose
Fructose
Glucose
MatProteique
VitC

Q3) La variable colorant ne devrait absolument pas influer sur les résultats puisque les variables sensorielles sont uniquement des variables d'odeur, de saveur ou de goût. Quelle affirmation vous semble la plus juste ?
Le colorant joue de façon significative sur l'ensemble des variables sensorielles
Le colorant a un effet significatif sur la deuxième dimension de l'espace produit et donc un effet significatif sur les variables corrélées fortement à la deuxième dimension
Le colorant est lié à la deuxième dimension mais ceci n'est pas significatif car les valeurs-tests des modalités sont inférieures à 2 en valeur absolue.

Q4) Quelle variable de composition est la mieux représentée sur le plan principal ?
%Banane
%Citron
%Mangue
%Orange

On veut maintenant construire une classification des cocktails.

Pour cela, choisir le nombre de dimensions à conserver dans l'ACP permettant de récupérer 95% de l'information contenue dans les variables sensorielles avant de faire la classification.

Q5) Combien de dimensions de l'ACP conservez-vous ?
2
3
4
5
7
10
12

Q6) Choisir un nombre de classes optimal pour la classification.
2
3
4
5
7
10

Q7) Quelle variable permet de décrire au mieux l'ensemble de la partition ?
Acide
Amer
%ORANGE
pH
Glucose
VitC

Q8) Quelle variable permet de caractériser au mieux la classe avec les cocktails contenant beaucoup de banane ?
Acide
Amer
%ORANGE
pH
Glucose
VitC

Q9) Quel cocktail est le parangon de la classe avec les cocktails contenant beaucoup de banane ?
MCb*
Mb
obmc*
Bo
OCb*
Obc

Q10) Quelle dimension permet de caractériser les cocktails de la classe des cocktails contenant beaucoup de banane ?
1
2
3
4
5

Q11) Vous pouvez analyser plus en détail ce jeu de données et interpréter les dimensions de l'analyse factorielle ainsi que les résultats de la classification.

Score =
Réponses correctes :