Значительное развитие получили методы извлечения знаний при применении современных информационных технологий, в частности гипертекстовой технологии. [c.259]
Усилия исследователей в области инженерии знаний направлены на создание формальных методов извлечения знаний. К их числу можно отнести метод автоматической обработки текстов на основе статистической обработки семантических единиц. Метод и программные средства автоматизированного извлечения знаний из текстов базируются на формальных процедурах обнаружения в текстах семантических единиц различной выраженности. [c.260]
Методы извлечения знаний и области их применения в экономике [c.14]
Основной принцип систематизации методов извлечения знаний связан с типом источника знаний (рис. 5.2). Инженеры по знаниям в зависимости от конкретной задачи и ситуации могут выбрать подходящий метод [13]. [c.115]
Рис. 5.2. Классификация методов извлечения знаний |
Какие методы извлечения знаний вам известны [c.129]
Инженеры по знаниям и эксперты в процессе приобретения знаний могут выполнять различные функции в зависимости от применяемых методов извлечения, получения и формирования знаний, а также наличия и степени развитости средств автоматизации. [c.256]
Большинство методов извлечения и получения знаний основано на прямом диалоге с экспертом. [c.259]
Сжатие текста служит методологической основой для использования текстологических процедур извлечения знаний. Текстологические методы являются самыми трудоемкими и применяются, как правило, на начальном этапе создания СИИ. [c.259]
Семантические единицы получаются путем статистической обработки текстов, в основе которой лежат универсальные механизмы определения частотных характеристик терминов. Задача извлечения знаний решается в два этапа сначала формируется терминологическая сеть (поле знаний), а затем определяется ассоциативная близость терминов на основе статистически определенной меры ассоциации. Достоинство рассмотренного метода состоит в автоматическом выявлении значимых слов и связей с учетом статистической информации о гипертексте в целом. [c.260]
Методы формирования знаний. Трудности извлечения знаний из текстовых источников и получения их от экспертов стимулировали развитие методов формирования знаний, известных, как методы "машинного обучения". [c.261]
В главе, посвященной извлечению знаний, мы уже познакомились с нейросетевыми методами извлечения правил из данных. Настало время узнать, как можно извлечь с их помощью нечеткие правила. [c.210]
В главе, посвященной извлечению знаний из обученных нейронных сетей, мы познакомились с методами интерпретации отображения сетью входной информации в выходную с помощью правил типа неравенств, правил m-of-n и других. В теория нечетких множеств соответствующие нечеткие правила уже изначально имеют наглядный смысл. Например, [c.213]
Расширенное использование сети Интернет требует новаторских методов выявления имеющихся знаний, а также усовершенствованных способов обобщения и визуального представления больших объемов информации. Именно этому уделено основное внимание в настоящей книге. Это книга об автоматизированных методах извлечения, обобщения и визуального представления больших объемов инфор- [c.17]
В этой книге мы, в первую очередь, будем использовать подход, основанный на СОК, для поиска образов в больших наборах данных. Главной причиной использования СОК для исследовательского анализа данных и извлечения знаний является то, что данный метод [c.20]
Извлечение знаний из различных источников производится в целях получения наиболее полного представления о предметной области. Для этого используются специальные методы анализ текстов, диалог, интервью, лекции и др. [c.105]
Система технического зрения может обеспечивать автономную систему управления транспортного средства информацией для определения ориентации, положения и скорости транспортного средства, кроме того, не только для транспортного средства непосредственно, но также для препятствий вокруг — статических или динамических. С развитием технологий и методов технического зрения такие системы становятся более доступными в терминах стоимости, размеров и веса. В настоящее время система технического зрения может быть выполнена как портативная система для автономного транспортного средства типа подвижного робота, автомобиля, самолета или вертолета. Портативные системы, как правило, имеют ограниченную вычислительную мощность и требуют дополнительной надежности. Таким образом, для системы технического зрения требуется надежный и простой алгоритм. Для упрощения задачи необходимо некоторое априорное знание. Это может быть гипотеза относительно текущего вида камеры. В этой работе мы только рассматриваем алгоритм извлечения особенностей и их прослеживания как первый шаг к созданию системы навигации самолета. Фактически, разработанная система может быть применена для выполнения некоторых воздушных операций типа автоматического полета вдоль автомобильных или железных дорог или береговой линии. [c.103]
В течение всего периода шло непрерывное совершенствование методов добычи и технологий. Ударное бурение постепенно сменялось ударно-вращательным и роторным, а желонки — глубинными насосами для извлечения нефти из скважин. Совершенствовались все механизмы нефтедобычи буровые установки, вышки, долота, промывочные растворы. В поисках этого полезного ископаемого стали широко применять геологические и геофизические методы, что привело к развитию научных знаний о нефти. [c.9]
Существует два способа получения информации документальный и экспертный. В первом случае данные содержатся во всевозможных информационных источниках (книги, документы, базы данных, информационные системы и т.п.). Экспертный способ предполагает извлечение и структурирование знаний из памяти человека - эксперта, или специалиста в предметной области. Часто их называют методами, направленными на использование интуиции и опыта специалистов. [c.9]
Третья сложность состоит в том, что хотя законы извлечения прибыли хорошо всем известны, их знание ещё не позволяет спекулянту решать задачу извлечения потенциально возможной для финансового рынка прибыли. Это связано, прежде всего, с тем, что указанная задача по своей сути является чисто математической и для её решения должны быть предложены соответствующие математические методы, адекватные экономической природе решаемой задачи. [c.36]
Выражаясь точнее, обнаружение знаний можно было бы определить как нетривиальное извлечение из данных первоначально неизвестных и потенциально полезных знаний. Обнаружение знаний — это междисциплинарный подход, использующий машинное обучение, статистику, технологию баз данных, экспертные системы и методы визуального представления данных. Все они могут внести свой вклад в процесс получения новых знаний. [c.20]
Особо важной представляется проблема извлечения и структурирования знаний для гипертекстовых систем. Анализ основных процедур, позволяющих решить эту проблему, показал, что наименее исследованной и освоенной является группа текстологических методов, базирующихся на изучении специальных текстов из монографий, справочников, учебников и других носителей профессиональных знаний. Изложена детальная методика, предназначенная для сбора и концептуализации знаний, приобретаемых без взаимодействия с экспертами. [c.128]
Главными требованиями, предъявляемыми к методам извлечения знаний, являются эффективность и масштабируемость. Работа с очень большими базами данных требует эффективности алгоритмов, а неточность и, зачастую, неполнота данных порождают дополнительные проблемы для извлечения знаний. Нейронные сети имеют здесь неоспоримое преимущество, поскольку именно они являются наиболее эффективным средством работы с зашумленными данными. Действительно, заполнение пропусков в базах данных - одна из прототипических задач, решаемых нейросетями. Однако, главной претензией к нейронным сетям всегда было отсутствие объяснения. Демонстрация того, что нейронные сети [c.168]
Извлечение правил из нейронных сетей подразумевает их предварительное обучение. Поскольку эта процедура требует много времени для больших баз данных, то естественна та критика, которой подвергается использование нейротехнологии для извлечения знаний. Другим поводом для такой критики является трудность инкорпорации в нейронные сети некоторых имеющихся априорных знаний. Тем не менее, главным является артикуляция правил на основе анализа структуры нейронной сети. Если эта задача решается, то низкая ошибка классификации и робастность нейронных сетей дают им преимущества перед другими методами извлечения знаний. [c.169]
Изложены теоретические основы гипертекстовой информационной технологии, предложен ее автоматизированный вариант, рассмотрена процедура построения семантических моделей коллективом проектировщиков. На основе применения текстологических методов извлечения знаний разработаны и исследованы формализованные макропредставления различных экономических систем. [c.2]
Рассматривая методы приобретения знаний, будем использовать следующие термины извлечение, получение, формирование, приобретение знаний и обучение БЗ. Определим сущность указанных терминов. Под извлечением знаний будем понимать процесс приобретения материализованных знаний из текстологических источников информации с помощью некоторой совокупности методов и процедур, позволяющих переходить от знаний в текстовой форме к их аналогам для ввода в базу знаний СИИ. Получение знаний - это процесс приобретения вербализуемых и невербализуемых знаний эксперта, основанный на использовании непосредственно им самим или инженером по знаниям приемов, процедур, методов и инструментальных средств. [c.258]
Указанные новые подходы к автоматизации извлечения знаний пока находятся на стадии исследований и не нашли применения в практике создания СИИ. Однако результаты исследований позволяют надеяться на создание >ффективных методов и СИИ, позволяющих снизить трудозатраты при извлечении знаний на начальном этапе синтеза баз знаний СИИ. [c.260]
Хотя молекулярная генетика представляет собой достаточно специфическую область применения методов обработки информации она часто рассматривается как показательный пример приложений такой информационной технологии, как Извлечение Знаний из Данных (Data Mining). Применение для этих целей нейросетевых методов мы рассмотрим более подробно в отдельной главе. [c.104]
До сих пор нейросети рассматривались нами лишь как инструмент предсказания, но не понимания. Действительно, классический нейросетевой подход - метод черного ящика -предполагает создание имитационной модели, без явной формулировки правил принятия решений нейросетью. Вернее, эти правила содержатся в весах обученной нейросети но понять их, переформулировав на язык "если. .. -то. .." не представлялось возможным. Бэтой главе мы продемонстрируем методику, позволяющую строить подобные правила, объясняющие нейросетевые решения. Нейросети, таким образом, можно использовать не только для предсказаний, но и для извлечения знаний из баз данных. [c.167]
Наиболее ответственным моментом в интеллектуальных системах будущего является развитие системы обнаружения знаний и прогнозирования действия системы. Для этого предполагается развитие автоматического извлечения знаний из текстов, руководств, инструкций, схем, а не только из знаний экспертов по данной предметной области. Кроме того, осуществляется моделирование условий действия искусственной системы, аналогичных условиям, в которых приходится жить человеку, т.е. имеется в виду автоматическое обеспечение работы с He-факторами (неопределенность, неполнота, неточность). Намечается максимальное использование многоагент-ных (распределенных) систем. Большое значение уделяется объему эвристических знаний в базе знаний (до десятков тысяч правил). Обращается внимание на внедрение методов логики рассуждений, обычно используемых человеком дедукции, индукции, немонотонного рассуждения, близости ситуации в пространстве и времени, а также рассуждений по аналогии. [c.143]
В работе Кохонена основное внимание уделено методологии упомянутых нейронных сетей. В настоящей же книге мы обсудим исследовательский анализ данных и процесс извлечения знаний, а также дадим обзор традиционных методов кластеризации и визуального представления данных. Затем мы опишем самоорганизующиеся карты и их преимущества при использовании в финансах, экономике и маркетинге. Книга иллюстрирует использование СОК в целях [c.19]
НИР и мобилизация новых запасов, НИР и снижение затрат имеют идентичные №ли, в реализации которых большую роль играют геологические службы. Для сличения коэффициента успешности бурения при поисках и разведке, оптимизации ш фаботки запасов, увеличения коэффициента извлечения нефти требуются углубле-1ис н интеграция знаний и методов в области геологии, геофизики, нефтепро-ысповогодела. [c.149]
Документ как носитель информации находится в центре внимания документоведения, рассматриваемого в структуре научно-информационной деятельности. Научная информация не может не иметь документированной формы и этот факт стал исходной точкой формирования в 60-70 гг. XX в. на стыке научно-информационной деятельности и науковедения научного направления — документалистики. Документалистика как структурный элемент, входящий в научно-информационную деятельность, рассматривала методы формализованного извлечения информации из текста документа. Соответственно, в поле зрения исследователей попали тексты, их семиотическая и семантическая структуры, особенности восприятия и возможности их переработки с помощью компьютера. А в качестве стратегической цели документалистика, обогащая науковедение методом анализа ДИП — документально-информационных потоков, представляла поток документированных источников информации как модель отражаемого в них научного знания. Таким образом, в такой трактовке центр внимания был смещен в сторону изучения вопросов, имеющих значительную научную и практическую ценность. Именно на симпозиуме по документалистике выработано наиболее широкое определение термина документ , имеющее сегодня общепринятый характер. Именно из научно-информационной деятельности перекочевала в докумен-товедение проблема изучения потребностей в документной информации. [c.164]