Масштабирование входных переменных

Для того чтобы создать хорошую СОК, необходимо уделить внимание следующим наиболее важным аспектам выбору размерности и формы карты, масштабированию входных переменных, выбору функции соседства и скорости обучения, а также инициализации модельных векторов. Помимо этого в настоящей главе мы рассмотрим процедуры автоматического цветового кодирования СОК. Отдельные части карт, соответствующие, например, различным странам, можно автоматически окрасить таким образом, чтобы сходным данным соответствовали похожие цвета.  [c.265]


Масштабирование входных переменных  [c.266]

Значения целевого ряда (это тот ряд, который нужно найти, например, доход по акциям на день вперед) зависят от N факторов, среди которых могут быть комбинации переменных, прошлые значения целевой переменной, закодированные качественные показатели. Эти факторы определяются обычными методами статистики (метод наименьших квадратов, кросс-корреляция и т.д.). Входные и выходные переменные преобразуются (масштабированием, стандартизацией) так, чтобы они принимали значения от 0 до 1 (или от -1 до 1). В результате мы получаем первоначальную модель, которую можно пытаться оптимизировать с помощью нейронной сети.  [c.60]

Собрав для будущего факта 18 скорректированных квадратным корнем разностей для входов, мы используем процедуру нормализации. Целью нормализации является удаление информации, заложенной в амплитуде, при сохранении формы волны. При обращении с 18 переменными входа как с вектором, нормализация состоит в масштабировании вектора в единицы длины. Расчеты включают возведение каждого элемента вектора в квадрат, сложение квадратов, вычисление квадратного корня и затем деление каждого элемента на полученное число. Так получаются переменные входа для нейронной сети — фактически, программа нейронной сети в дальнейшем еще раз будет масштабировать эти входы, приводя их значения к уровням, допустимым для входных нейронов.  [c.258]


Метод самоорганизующихся карт оказался очень удобен для анализа и оценки жилья. Мы выявили, что масштабирование параметров жилья является весьма существенной частью предварительной обработки входных данных. Результат обучения зависит от того, насколько правильно были определены соотношения между переменными, иными словами, от масштабирования.  [c.190]

В четырнадцатой главе Самуэль Каски и Тейво Кохонен дают важные советы по обработке самоорганизующихся карт и их автоматическому цветовому кодированию. Здесь вы найдете квалифицированный совет по выбору размера и формы карты, масштабированию входных переменных, выбору функции соседства и темпа обучения, а также наилучшего начального приближения для модельного вектора.  [c.36]

В некоторых случаях вам может показаться неожиданным, что различные показатели имеют разные веса. Несмотря на это, масштаб показателей может быть выравнен. Равное масштабирование, при котором дисперсия каждого показателя равна единице, подходит в качестве первого шага при предварительном анализе кластеризации, но может быть эффективно даже в работе с готовой картой. Однако в некоторых случаях, особенно когда вас интересуют только некоторые конкретные показатели, может оказаться полезным поэкспериментировать с различными масштабами. Как неоднократно отмечается в других частях данной книги, различие в масштабе показателей тесно связано с выбором наиболее важных входных переменных.  [c.266]

Наконец, для некоторых функций преобразования, реализованных в выходном узле, возникают проблемы с масштабированием. Сигмоид определен на отрезке [0,1], поэтому выходную переменную нужно масштабировать так, чтобы она принимала значения в этом интервале. Известно несколько способов масштабирования сдвиг на константу, пропорциональное изменение значений с новым минимумом и максимумом, центрирование путем вычитания среднего значения, приведение стандартного отклонения к единице, стандартизация (два последних действия вместе). Имеет смысл сделать так, чтобы значения всех входных и выходных величин в сети всегда лежали, например, в интервале [0,1] (или [-1,1]), — тогда можно будет  [c.60]