ПОИСК
Это наилучшее средство для поиска информации на сайте
СОДЕРЖАНИЕ КУРСА Тема 1. Введение
из "Интеллектуальные методы анализа экономической информации "
Основы анализа данных. Методология построения моделей сложных систем. Модель черного ящика . Основные этапы построения моделей. Методика анализа данных. [c.4]Основой для анализа данных служит моделирование. Построение моделей является универсальным способом изучения окружающего мира. Построение моделей позволяет обнаруживать зависимости, извлекать новые знания, прогнозировать, управлять и решать множество других задач. [c.4]
Модели и моделирование тесно связаны с таким базовым понятием, как система. [c.4]
Выделяется несколько типов систем простые, малые, большие, сложные. Отличие между ними заключается в количестве элементов и типе связи между ними, а также ресурсной и информационной обеспеченности (рис. 1.1). [c.4]
Наиболее общей информационной моделью системы является модель черного ящика . Система представляется в виде прямоугольника с множеством входных и выходных переменных, внутреннее устройство которого скрыто от исследователя, а чаще всего неизвестно (рис. 1.2). [c.4]
Определив входные и выходные воздействия и имея в наличии набор данных, связывающий их, уже можно говорить о модели системы, даже если не известен закон, связывающий между собой входы и выходы системы. Существуют специальные методы, позволяющие изучать такие системы без знания математических, экономических и других зависимостей между переменными системы и даже извлекать знания. Такие методы относятся к категории интеллектуальных методов анализа данных. [c.5]
Тогда можно говорить о создании модели прогнозирования продаж, модели выявления ассоциаций и т.д. [c.5]
Данный этап еще называется анализом проблемной ситуации. [c.5]
Следующий шаг - систематизация и консолидация всех доступных ресурсов (материальных, финансовых, информационных), необходимых для построения модели. В случае отсутствия требуемых ресурсов на данном этапе может быть принято решение либо о сужении требований к результатам, либо вообще отказ от построения модели. Здесь встает вопрос о точности будущей модели интересующему процессу или системе. Поскольку процесс построения модели носит итерационный характер (рис. 1.3), в процессе которого она корректируется и уточняется, то нет смысла на первых шагах требовать высокую точность модели. Гораздо правильнее говорить об адекватности модели. Первоначальная модель может быть грубой, но адекватной. [c.5]
Адекватность означает, что при построении модели исследователь учел наиболее важные, существенные факторы, влияющие на конечный результат. Можно утверждать, что с ростом количества факторов увеличивается сложность модели. [c.5]
После систематизации данных переходят к поиску модели, которая объясняла бы имеющиеся данные, позволила бы добиться эмпирически обоснованных ответов на интересующие вопросы. Существует огромное множество готовых моделей систем, в том числе экономических. Большинство из них формальны, т.е. представляются в виде совокупности математических формул, законов, распределений и т.п. Однако на практике часто они не применимы, и имеют мало общего с действительностью. Нередко исследователь сталкивается с ситуацией, когда трудно сделать какие-либо четкие предположения относительно поставленной задачи. Модель не известна, и единственным источником сведений для ее построения является таблица экспериментальных данных типа вход-выход , т.е. черный ящик . В результате аналитик вынужден использовать различные эвристические предположения о выборе информативных признаков, о классе и параметрах выбранной модели. Эти предположения аналитика основываются на его опыте, интуиции, проникновении в смысл анализируемого процесса. [c.6]
На следующем этапе - систематизации данных - необходимо получить ответы на вопросы. [c.7]
Дело в том, что при малом количестве данных любое прогнозирование бессмысленно и никакая модель не уловит закономерности в продажах. Так, для временного ряда истории продаж на 1,5 года прогноз следует осуществлять максимум на 1 месяц для данных за 2-3 года - максимум на 2 месяца. [c.7]
Проблема заключается в том, что иногда прогноз продаж для каждого наименования товара строить бессмысленно. Как правило, это касается продукции с высокой степенью обновления модельного ряда (телефоны, плееры, компьютерная техника и др.). Как вариант, возможно построение прогноза по группам товаров со схожими потребительскими свойствами. [c.7]
Таким образом, во-первых, универсальных моделей не бывает, а во-вторых, сложность модели не гарантирует ее точность. Мастерство исследователя заключается в том, чтобы найти компромисс между простотой, прозрачностью с одной стороны и приемлемым качеством результатов с другой. При этом не следует гнаться за абсолютной точностью и начинать использование модели при получении первых приемлемых результатов. [c.7]
У изложенного механизма построения моделей есть как сильные, так и слабые стороны. Использование методов построения моделей позволяет получать новые знания, которые невозможно извлечь другим способом. Кроме того, полученные результаты являются формализованным описанием некоего процесса, а, следовательно, поддаются автоматической обработке. Недостатком же является то, что такие методы более требовательны к качеству данных, знаниям эксперта и формализации самого изучаемого процесса. К тому же почти всегда имеются случаи, не укладывающиеся ни в какие модели. [c.7]
Вернуться к основной статье