Кластерный анализ - один из методов многомерного анализа, предназначенный для группировки (кластеризации) совокупности, элементы которой характеризуются многими признаками. Значения каждого из признаков служат координатами каждой единицы изучаемой совокупности в многомерном пространстве признаков. Каждое наблюдение, характеризующееся значениями нескольких показателей, можно представить как точку в пространстве этих показателей, значения которых рассматриваются как координаты в многомерном пространстве. Расстояние между точками р и q с k координатами определяется как [c.105]
В рамках кластерного анализа на основе численно выраженных параметров объектов вычисляются расстояния между ними, которые могут выражаться как в евклидовой метрике, так и в других, более сложных метриках. Кластерный анализ — это наиболее часто используемый метод сегментации рынка. Внутренние определения процедур кластерного анализа отражают цели сегментации рынка. Требуется определить группы респондентов так, чтобы минимизировать различия между членами каждой группы, в то же время максимизировать различия между членами одной группы и теми, кто к ней не принадлежит. [c.80]
На этом принципе построено довольно много методов обобщения понятий, которые можно было бы назвать методами разделения в пространстве признаков. В простейшем случае ситуация, показанная на рис. 4.1, обобщается на пространство произвольной размерности и строятся методы выделения наиболее крупных скоплений объектов, для которых расстояния между признаками значительно меньше расстояний между отдельными скоплениями. На этой идее основано большинство методов, развиваемых в рамках кластерного анализа. [c.168]
В табл. также показана кластерная принадлежность объектов и расстояние между каждым объектом и его классификационным центром. Следует отметить, что кластерные принадлежности, приведенные в табл. 20.2 (иерархическая кластеризация) и табл. 20.4 (неиерархическая кластеризация), идентичны (кластер 1 табл. 20.2 является кластером 3 в табл. 20.4, а кластер 3 табл. 20.2 — кластером 1 в табл. 20.4), Расстояния между конечными кластерными центрами указывают, что пары кластеров хорошо Для каждой переменной, лежащей в основе [c.766]
Иногда кластерный анализ используют для кластеризации переменных, чтобы определить однородные (гомогенные) группы. В этом случае элементами, используемыми для анализа, будут переменные, и меры расстояния вычисляют для всех пар переменных. Например, коэффициент корреляции либо по абсолютной величине, либо с присущим ему знаком можно использовать как меру сходства (в противоположность расстоянию) между переменными. [c.767]
Следующей разновидностью методов кластерного ангализа являются иерархические схемы кластеризации. Вначале каждый объект рассматривается как отдельный кластер. Затем, пошагово осуществляют объединение исходных кластеров на основе установленных способов измерения расстояния между кластерами до тех пор, пока не будет получена искомая совокупность кластеров. При этом возможно применение интерактивного режима. [c.270]
Многомерное шкалирование похоже на кластерный анализ, поскольку тоже включает ряд методик, направленных на одну проблему, в данном случае на составление карт восприятия клиентами предложений на рынке. Рисунок 4 показывает типичную карту, изготовленную с помощью этого метода на основе информации по тематическим паркам отдыха. На этом рисунке пространство — не географическое расстояние между парками, а психологическое пространство. Карта показывает, насколько близко клиент видит центры отдыха в своем сознании, и параметры, которые он применяет. Помимо визуализации рынка карты, произведенные с помощью многомерного шкалирования, могут помочь позициони- [c.109]
Для группирования респондентов на основе ихна вопросы, касающиеся выбора больницы, использовали метод кластеризации, минимизирующий дисперсию, который выполнили с помощью программы Qui k luster (программный пакет SPSS). Минимизировали квадраты евклидовых расстояний между всеми в основе кластеризации. Поскольку разные респонденты воспринимали шкалы важности по-разному, перед кластеризацией персональные рейтинги нормировали. Результаты показали, что респондентов наилучшим образом можно классифицировать на четыре кластера. Достоверность результатов кластерного анализа проверили методом перекрестной проверки двух половинок общей выборки. [c.767]
КЛАСТЕРНЫЙ АНАЛИЗ ( luster analysis) -совокупность матем методов, предназначенных для формирования групп объектов (кластеров) по информации о расстояниях или связях (мерах близости) между ними Используется для анализа структуры совокупностей экон показателей по заданной матрице коэф корреляции между ними Можно выделить два осн типа методов К а в зависимости от того, одновременно или последовательно отыскиваются кластеры Среди первых широкое распространение получили т н вариационные методы, основанные на оптимизации того или иного показателя качества кластерной структуры, и агломеративные методы, основанные на последовательном объединении пар наиболее близких кластеров Среди вторых можно отметить методы, основанные на явном определении понятия кластера, как правило, в терминах максимально допустимого "радиуса" или "порога существенности" связей Ал- [c.94]