Промежуточным результатом анализа являются среднее внутри-кластерное расстояние, по которому можно сравнивать различные варианты кластеризации, и кластеры с указанием включенных в них объектов. При этом можно получить проекции на плоскость каждой пары показателей центров кластеров и объектов каждого кластера, соединенных линиями с центрами. [c.96]
Основным критерием кластеризации является то, что различия между кластерами должны быть более существенны, чем между наблюдениями, отнесенными к одному кластеру, т. е. в многомерном пространстве должно соблюдаться неравенство [c.131]
Процесс кластеризации, как и процедуры регрессионного анализа, достаточно трудоемок, его целесообразно выполнять на компьютере. [c.131]
Очень интересные результаты в маркетинговом исследовании может дать один из методов многомерной статистики - кластерный анализ. В результате применения достаточно сложных действий (выполняемых на компьютере с использованием пакета прикладных программ) образуются группы качественно однородных единиц - кластеров, сформированные не по одному, а по совокупности факторов. В частности, этот метод применяется в региональном анализе и в процессе сегментации рынка. Приведем пример кластеризации регионов России за 1995 г. по признаку валового регионального продукта на душу населения, выполненный Н.В. Хорошиловой в своей кандидатской диссертации (таблица 5.8 дана с некоторыми изменениями). [c.208]
Кластеризация регионов России [c.208]
Классическим примером кластеризации потребителей является политика компании Харлей-Дэвидсон , производящей тяжелые мотоциклы. Покупатели мотоциклов Харлей-Дэвидсон выбирают не мотоцикл или средство передвижения - они выбирают особый, достаточно асоциальный стиль жизни. [c.70]
Возвращаясь к примеру Мариинского театра, мы можем убедиться, что вторая опция для театра закрыта - продаться национальное достояние России никому не может. Однако достаточно четко прослеживаются действия по третьему варианту - кластеризации потребителей. Создание обществ и клубов друзей Мариинского театра тому прямое свидетельство. Данные общества и клубы собирают не экзальтированных балетоманов, а вполне уравновешенных обеспеченных людей, стремящихся укрепить свой социальный имидж. Таким образом, основной выгодой оказывается не непосредственное потребление высокого искусства и возможность испытать катарсис, а возможность пообщаться вокруг значительного культурного события. [c.70]
В отличие от дискриминантного анализа, в кластерном анализе отсутствует однозначный количественный критерий оценки качества классификации типа ошибки. Кластерным называют анализ объектов, проводимый с целью выделения структур, классов, множеств подобных объектов. Существует большое разнообразие методов кластеризации. [c.204]
Кластерный анализ - один из методов многомерного анализа, предназначенный для группировки (кластеризации) совокупности, элементы которой характеризуются многими признаками. Значения каждого из признаков служат координатами каждой единицы изучаемой совокупности в многомерном пространстве признаков. Каждое наблюдение, характеризующееся значениями нескольких показателей, можно представить как точку в пространстве этих показателей, значения которых рассматриваются как координаты в многомерном пространстве. Расстояние между точками р и q с k координатами определяется как [c.105]
Кластеризация данных с выявлением заранее неизвестных классов-прототипов [c.39]
Политические технологии анализ и обобщение социологических опросов, предсказание динамики рейтингов, выявление значимых факторов, объективная кластеризация электората, визуализация социальной динамики населения. [c.41]
Уменьшение разнообразия данных за счет выделения конечного набора прототипов, и отнесения данных к одному из таких типов. (Кластеризация данных, квантование непрерывной входной информации.) [c.70]
[c.79]
Иными словами, сеть осуществляет кластеризацию данных находит такие усредненные прототипы, которые минимизируют ошибку огрубления данных. Недостаток такого варианта кластеризации очевиден - "навязывание" количества кластеров, равного числу нейронов. В идеале сеть сама должна находить число кластеров, соответствующее реальной кластеризации векторов в обучающей выборке. Адаптивный подбор числа нейронов осуществляют несколько более сложные алгоритмы, такие, например, как растущий нейронный газ. [c.81]
Кластеризация или квантование требуют настройки гораздо большего количества весов - из-за неэффективного способа кодирования. Зато такое избыточное кодирование упрощает алгоритм обучения. Действительно, квадратичная функция ошибки в этом случае диагональна и в принципе достижение минимума возможно за О( ) шагов (например в пакетном режиме), что в данном случае потребует — PW операций. Число весов, как и прежде, равно W dm, но степень сжатия информации в данном случае определяется по-другому К — t/6/1og т. [c.82]
Итак, мы установили, что преобразование информации рекуррентными нейронными сетями минимизирующими энергию может приводить к появлению в их пространстве состояний аттракторов, далеких по форме от образов внешнего для сети окружения. Таким образом, в отличие от рассмотренной в прошлой главе кластеризации, осуществляемой сетями без обратных связей, появляется возможность использовать рекуррентные сети для активной кластеризации, при которой сеть "творчески" относится к входным векторам, осуществляя нетривиальные обобщения поступающих на ее вход сигналов. [c.105]
Теоретическим основанием такой активной кластеризации является отмеченное выше наблюдение, что все устойчивые состояния сети Хопфилда могут быть проинтерпретированы единым образом, как локально наилучшие версии одного сообщения, переданного через канал с шумом. Если предъявить сети эти сообщения, использованные для формирования ее связей, в качестве начальных состояний, она расклассифицирует их, отнеся к той или иной версии прототипа. (Такая классификация при асинхронной динамике будет в общем случае нечеткой -одно и то же начальное состояние в разных попытках может эволюционировать к разным аттракторам). [c.105]
Таблица 1. Кластеризация результатов голосований в ООН |
Рисунок 9. Понижение разнообразия входов методом квантования (кластеризации) |
Сеть Хопфилда имеет очевидную связь с кластеризацией данных и их факторным анализом. [c.202]
При проведении сегментации рынка используются методы группировок, стратификации, кластеризации, случайной и неслучайной выборок. [c.31]
Номенклатура выпуска нефтехимических или химических заводов с перетехнологией, обеспечивающей комплексную переработку сырья, стала состоять из тысяч позиций, как в части разнообразия, так и в отношении количества производимой продукции, причем многие из обращающихся в производственном цикле веществ - горючи и чрезвычайно токсичны [1]. Экономическая выгодность кластеризации промышленных предприятий привела к созданию индустриальных комплексов, включающих узлы энергораспределения, тепло- и газоснабжения, транспортных магистралей и, как правило, размещающихся в жилых районах. Понятно, что в случае аварии ее жертвой может стать как персонал промышленного предприятия, так и население близлежащих окрестностей [2]7]Однако, и при штатной работе промышленного объекта существует ряд опасностей, требующих постоянного контроля со стороны руководителей высшего звена, Это - ежедневный риск технологического и трудового процессов, пожарной опасности отрицательного воздействия на окружающую среду [3]. [c.329]
Стратегии кластеризации. Если исходные данные представляют собой значения показателей и переменных для некоего объекта, то необходимо выбрать стратегию объединения и метод вычисления расстояния dv между объектами в многомерном пространстве показателей — метрику2. [c.95]
Пример. Проведем классификацию 10 предприятий, рассмотренных в предыдущем примере, и дадим, таким образом, вероятностную оценку результатам кластерного анализа. Вновь обратимся к системе STADIA 5.O. Введем показатели предприятий в первый и второй столбцы электронной таблицы, в третий столбец — номера классов, полученные при кластеризации. Используем блок Статистика и процедуру Дискриминантный анализ и получим следующие результаты. [c.98]
Кластерный анализ — один из методов многомерного анализа, предназначенный для группировки (кластеризации) совокупности, элементы которой характеризуются многими признаками. Значения каждого из признаков служат координатами каждой единицы изучаемой совокупности в многомерном пространстве признаков. Каждое наблюдение, характеризу- [c.130]
Другим примером междисциплинарного применения синергетики может служить модель миграции. В ней проводится различие между микроуровнем индивидуальных решений и макроуровнем динамических коллективных процессов в обществе. Вероятностные макропроцессы описываются на уровне социоконфигура-ций, каждая из которых характеризуется своим вектором поведения. Миграция в обществе также хорошо иллюстрируется компьютерными моделями фрактальной кластеризации с изменяющимися центрами перемешивания, бродяжничеством и хаосом, обусловленными нелинейными взаимодействиями социальных групп. Такая модель наглядно показывает различия между системами, связанными и не связанными с человеком. На микроскопическом уровне миграция людей зависит от индивидуальных и коллектив- [c.385]
Какие стратегические траектории может проходить подобная фирма Первая ее забота — не вылететь с рынка. Наручные часы за 10 тыс. долл. показывают не время, а социальный статус владельца, его стремление выставить напоказ свое богатство, но все же подобные часы должны не только точно идти, но и быть на порядок дешевле автомобиля, на котором ездит их владелец. В противном случае фирма, производящая подобные изделия, превращается из уникального, но регулярного производителя в лавку антиквара, годами ожидающего покупателя. Второй вариант действий — продать бизнес разбогатевшей фирме — защитнику низких издержек . Именно так в конечном счете и произошло с автомобильным производством Rolls-Roy e, разделившим марку и собственно производственные мощности между двумя конкурирующими немецкими фирмами — BMW и Volkswagen. Наконец, третьим возможным решением для фирмы — защитника качества является так называемая кластеризация потребителей. В обычном маркетинге речь идет о сегментации потребителей, т. е. поиске устойчивых групп людей, имеющих определенные потребительские предпочтения. [c.287]
Возьмем, например, задачу аппроксимации функции по набору точек. Это типичный пример некорректной задачи, т.е. задачи не имеющей единственного решения. Чтобы добиться единственности, такие задачи надо регуляризировать - дополнить требованием минимизации некоторого регуляризирующего функционала. Минимизация такого функционала и является целью обучения нейросети. Задачи оптимизации также сводятся к минимизации целевых функций при заданном наборе ограничений. С другой стороны, классификация - это ни что иное, как аппроксимация функции с дискретными значениями (идентификаторами классов), хотя ее можно рассматривать и как частный случай заполнения пропусков в базах данных, в данном случае - в колонке идентификаторов класса. Задача восстановления утраченных данных, в свою очередь - это ассоциативная память, восстанавливающая прообраз по его части. Такими прообразами в задаче кластеризации выступают центры кластеров. Наконец, если информацию удается восстановить по какой-нибудь ее части, значит мы добились сжатия этой информации, и т.д. [c.39]
С обратными связями Рекуррентные аппроксиматоры (предсказание временных рядов, обучение в режиме online) Сеть Хопфилда (ассоциативная память, кластеризация данных, оптимизация) [c.48]
Соревновательные слои нейронов широко используются для квантования данных (ve tor quantization), отличающегося от кластеризации лишь большим числом прототипов. Это весьма распространенный на практике метод сжатия данных. При достаточно большом числе прототипов, плотность распределения весов соревновательного слоя хорошо аппроксимирует реальную плотность распределения многомерных входных векторов. Входное пространство разбивается на ячейки, содержащие вектора, относящиеся к одному и тому же прототипу. Причем эти ячейки (называемые ячейками Дирихле или ячейками Вороного) содержат примерно одинаковое количество обучающих примеров. Тем самым одновременно минимизируется ошибка огрубления и максимизируется выходная информация - за счет равномерной загрузки нейронов [c.82]
В качестве иллюстрации приведем результаты кластеризации данных по голосованиям в ООН в 1969-1970гг. В данном примере анализировались голосования по 14 резолюциям для 19 стран. Сеть, производившая кластеризацию стран по степени схожести их голосований, состоит из N = 14 нейронов, состояния которых представляют картину голосования одного из участников по отобранным 14 резолюциям (да и нет соотносились с бинарными состояниями нейронов). Этой сети предъявлялись результаты голосований 19 стран - членов ООН, которые сформировали матрицу связей сети по правилу Хебба. Результаты категоризации входных векторов (а тем самым - и соответствующих стран), этой нейронной приведены в таблице [c.106]
Недостатком этого приема является уменьшение числа примеров, которые можно было бы взять в качестве обучающего множества. Малость базы данных— это серьезная проблема. Более того, оценка качества работы сети зависит от выбора образцов, составляющих подтверждающее множество. Даже при случайной выборке разные разбиения базы данных на обучающее и подтверждающее множества дают разные оценки. При исследовании этой проблемы Де Гроот [84] использовал для отбора примеров и построения обучающего и подтверждающего множеств алгоритмы кластеризации. [c.34]
Подход, основанный на исследовании архетипов, соответствующих кластерам похожих наблюдений, обладает тем достоинством, что он является многомерным, и в этом состоит его отличие от анализа весов и влияний. Горман и Сейновски [127] предложили способ кластеризации наблюдений с помощью весовой матрицы, зависящей от весов соединений, идущих от входных элементов к исследуемому г -му скрытому элементу. Для f -ro наблюдения метрический вектор, или вектор весов-состояния, Q имеет вид QJ [i] = [w pj ], где р— выход j-ro входного элемента. Затем для каждой пары векторов весов-состояния вычисляется евклидово расстояние между ними, и все они записываются в матрицу расстояний. На последнем этапе к этой матрице применяется метод иерархической кластеризации. Наблюдения с близкими векторами весов-состояния образуют кластер. Усредняя все наблюдения, принадлежащие одному кластеру, получаем центроид этого кластера. Все центроиды могут быть упорядочены по уровню выходного сигнала или по уровню активации нужного скрытого элемента. Вся процедура проделывается независимо для каждого скрытого элемента. В нашем случае конфигурация сети имеет два скрытых элемента, так что описанный шаг повторяется дважды. Особенно важны значения тех центроидов, которые наиболее сильно активируют данный элемент. Поскольку вес связи, идущей от второго скрытого элемента (РЕ2) к выходному (PEOUT), очень мал (0.09), с учетом того факта, что элемент РЕ1 не всегда насыщается (уровень активации меняется в интервале [0.01,0.77]), мы при дальнейшем анализе элемент РЕ2 из рассмотрения исключим. [c.109]
Чтобы лучше представить себе механизмы, стоящие за сигналами на покупку или продажу, мы изобразили на графике (см. рис. 10.5) восемь входных образцов, породивших правильные сигналы, соответственно, на покупку и продажу. Мы не исследовали каждое значимое отклонение от 0.5-линии по отдельности (это можно сделать, например, при помощи техники кластеризации весов состояния методом Гормана и Сейновского [127], который обсуждался в гл. 4), и поэтому из результатов, относящихся к этим восьми примерам, нельзя делать обобщения. Однако, образцы внутри каждой группы обладают определенными общими чертами, и это говорит о том, что они соответствуют одним и тем же областям в пространстве входов. щ [c.225]
Смотреть страницы где упоминается термин Кластеризация
: [c.96] [c.287] [c.81] [c.105] [c.139] [c.140] [c.96] [c.178] [c.178] [c.242] [c.242] [c.273]Маркетинг (2002) -- [ c.382 ]