projets:plim:20152016:gr11
Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
| projets:plim:20152016:gr11 [2015/11/21 09:58] – [Projet et explication de lancement] boutin | projets:plim:20152016:gr11 [2015/11/22 18:10] (Version actuelle) – [Fonctionnement de l'algorithme HAC] merai | ||
|---|---|---|---|
| Ligne 20: | Ligne 20: | ||
| ===== Processus ===== | ===== Processus ===== | ||
| === Scénario enregistrement de données === | === Scénario enregistrement de données === | ||
| - | | + | |
| - | | + | |
| - | | + | {{: |
| - | | + | |
| - | | + | {{: |
| - | | + | {{: |
| + | | ||
| + | | ||
| + | | ||
| === Scénario visualisation des trajets === | === Scénario visualisation des trajets === | ||
| - | | + | |
| - | | + | |
| - | | + | {{: |
| - | | + | |
| + | {{: | ||
| + | {{: | ||
| + | | ||
| + | ===== Fonctionnement de l' | ||
| + | L’algorithme de classification ascendante hiérarchique (CAH) est une méthode de classification automatique de données qui a pour but de repartir ces données dans un certain nombre de classes(clusters).\\ | ||
| + | La classification ascendante hiérarchique est faite en **4** grandes étapes : | ||
| + | - Préparation des données | ||
| + | - Choix de l’indice de **dissimilarité** entre les individus : c’est la distance entre individus dans une classe. | ||
| + | - Choix de l’indice **d’agrégation** : c’est la distance entre les individus appartenant à des classes différentes. Pour calculer cet indice, on utilise deux stratégies : stratégie du saut minimum ou //__single linkage__// (On regroupe les 2 éléments présentant la plus petite distance entre éléments des deux classes.) et stratégie du saut maximum ou du diamètre ou // | ||
| + | - Choix de la partition finale : On définit un ensemble de classes de l' | ||
| + | Initialement, | ||
| + | A chaque itération, on calcule les distances entre les éléments d’une classe, et on les compare à l’indice de dissimilarité. Par la suite, on regroupe les classes deux à deux. Puis on fusionne celles qui sont les plus proches, selon l’indice d’agrégation, | ||
| + | Contrairement au K-MEANS, le nombre de classes obtenus grâce au CAH n’est pas connu à l’avance. Il dépend de nombre d’éléments, | ||
| ===== Problèmes rencontrés ===== | ===== Problèmes rencontrés ===== | ||
| - | Lorsque nous lançons l' | + | * Lorsque nous lançons l' |
| + | * Au départ pour nos calculs de cluster nous utilisions une fonction de calcul de distance entre deux points qui était proposé dans l' | ||
| ===== Projet et explication de lancement ===== | ===== Projet et explication de lancement ===== | ||
projets/plim/20152016/gr11.1448099907.txt.gz · Dernière modification : 2015/11/21 09:58 de boutin