La classification ascendante hiérarchique (CAH) (L3 analyse de données)
La classification ascendante hiérarchique (CAH) est une méthode de clustering qui construit une hiérarchie de groupes emboîtés, sans fixer le nombre de clusters à l'avance. En L3 du parcours data…
Classification Ascendante Hierarchique Cah
La classification ascendante hiérarchique (CAH) est une méthode de clustering qui construit une hiérarchie de groupes emboîtés, sans fixer le nombre de clusters à l'avance. En L3 du parcours data pour économistes, dans le cours d'analyse de données, les QCM CampusQCM la testent en…
La classification ascendante hiérarchique (CAH) est une méthode de clustering qui construit une hiérarchie de groupes emboîtés, sans fixer le nombre de clusters à l'avance. En L3 du parcours data pour économistes, dans le cours d'analyse de données, les QCM CampusQCM la testent en complément des k-means. Le principe est ascendant (agglomératif) : on part de chaque observation considérée comme un cluster isolé, puis on fusionne à chaque étape les deux clusters les plus proches, jusqu'à n'avoir plus qu'un seul groupe contenant tout. Deux choix gouvernent la méthode. D'abord la distance entre observations (euclidienne le plus souvent). Ensuite le critère d'agrégation (linkage) qui définit la distance entre deux clusters : saut minimum (lien simple, plus proche voisin), saut maximum (lien complet), distance moyenne, ou critère de Ward, le plus utilisé, qui fusionne les clusters en minimisant l'augmentation de l'inertie intra-classe. Le résultat se visualise dans un dendrogramme : un arbre dont les branches indiquent l'ordre et la distance des fusions. Pour obtenir une partition, on coupe le dendrogramme à une certaine hauteur : plus on coupe haut, moins on a de clusters. On choisit la coupure là où les fusions se font à des distances nettement plus grandes (saut d'inertie). Contrairement aux k-means, la CAH ne nécessite pas de fixer $k$ d'emblée et fournit une vue d'ensemble de la structure, mais elle est plus coûteuse en calcul sur de grands jeux de données. Les deux méthodes sont souvent combinées.
Objectifs d'apprentissage
- Comprendre le principe agglomératif
- Connaître les critères d'agrégation
- Comprendre le critère de Ward
- Lire un dendrogramme
- Choisir une partition par coupure
Concepts clés à maîtriser
Principe agglomératif
EssentielCritère d'agrégation
EssentielCritère de Ward
EssentielDendrogramme
EssentielAuteurs et références
- Ward, J. (1963) — Hierarchical Grouping to Optimize an Objective Function, Journal of the American Statistical Association
- Lebart, L.; Morineau, A.; Piron, M. (2006) — Statistique exploratoire multidimensionnelle, Dunod
- Hastie, T.; Tibshirani, R.; Friedman, J. (2009) — The Elements of Statistical Learning, Springer
Pièges fréquents à éviter
Questions types d'examen
- Quel est le principe de la CAH ?
- Quels sont les critères d'agrégation ?
- Qu'est-ce que le critère de Ward ?
- Comment lit-on un dendrogramme ?
- Comment obtient-on une partition à partir de l'arbre ?
À retenir
La CAH fusionne pas à pas les clusters les plus proches (agglomératif), selon un critère d'agrégation (Ward minimise la hausse d'inertie intra). Le dendrogramme visualise les fusions ; on le coupe à un saut net de distance pour obtenir une partition. Elle ne fixe pas k d'avance (contrairement aux k-means). L'examinateur attend Ward et le dendrogramme.
Notions liées à approfondir
Teste tes connaissances
Les questions de cette notion sont en cours d'import. En attendant, explore les notions connexes ci-dessous.
Questions fréquentes
Qu'est-ce que Classification Ascendante Hierarchique Cah en Analyse Donnees ?
La classification ascendante hiérarchique (CAH) est une méthode de clustering qui construit une hiérarchie de groupes emboîtés, sans fixer le nombre de clusters à l'avance. En L3 du parcours data pour économistes, dans le cours d'analyse de données, les QCM…
Combien de questions sont disponibles ?
CampusQCM propose 0 questions corrigées sur Classification Ascendante Hierarchique Cah avec explications pédagogiques détaillées.
Comment réviser Classification Ascendante Hierarchique Cah efficacement ?
Commencez par le mode Révision, lisez les corrections, refaites les erreurs après quelques jours, puis passez en mode Examen.
Ce QCM est-il adapté au programme de L2 ?
Oui, nos questions correspondent au programme officiel de L2 du cursus Data econometrie avancee.
Les QCM fonctionnent-ils sur mobile ?
Oui, CampusQCM est entièrement optimisé pour smartphones et tablettes. Révisez Classification Ascendante Hierarchique Cah où que vous soyez, vos scores se synchronisent entre vos appareils.
Les QCM sont-ils gratuits ?
Oui, tous nos QCM sont entièrement gratuits. Créer un compte vous permet de sauvegarder vos scores et suivre votre progression, mais ce n'est pas obligatoire.