Большинство методов кластеризации (иерархической группировки) являются агломеративными (объединительными) - они начинают с создания элементарных кластеров, каждый из которых состоит ровно из одного исходного наблюдения (одной точки), а на каждом последующем шаге происходит объединение двух наиболее близких кластеров в один. Момент остановки этого процесса может задаваться экспертом (например, указанием требуемого числа кластеров или,максимального расстояния, при котором допустимо объединение). Графическое изображение процесса объединения кластеров может быть получено с помощью дендрограммы - дерева объединения кластеров. Другие методы кластерного анализа являются дивидивными (разделительными) - с их помощью пытаются разбивать объекты на кластеры непосредственно. [c.282]
В этой главе описана основная идея кластерного анализа. Этапы кластерного анализа рассматриваются и иллюстрируются в контексте иерархической группировки с помощью статистического программного пакета. Далее представлено применение неиерархикой кластеризации, которое следует за обсуждением разбиения переменных на кластеры. Начнем с двух примеров. [c.747]