Тезаурус, информационно-поисковый 385 [c.385]
Т 22 Тезаурус, информационно-поисковый-385 [c.482]
При описании хозяйственных процессов с помощью информационной системы, представленной документами, часто возникает неадекватность словесного выражения смысловому содержанию. Эта неадекватность может быть уменьшена путем создания тезауруса, содержащего слова (дескрипторы) они должны отыскиваться для выражения и описания понятий. [c.191]
Единый информационный массив тезауруса распадается на три части слова, показатели, документы каждая последующая часть является обобщением предыдущей. Каждая словарная статья теза-урса содержит три характеристики синтаксическую, семантическую и прагматическую. Первая раскрывает числовые характеристики, вторая — содержательную часть характеристики, третья — практическое значение слов, показателей и документов. [c.191]
Семантический аспект передает смысловое содержание информации и соотносит ее с ранее имевшейся информацией. Смысловые связи между словами или другими элементами языка отражает тезаурус - словарь. Тезаурус состоит из двух частей списка слов и устойчивых словосочетаний, сгруппированных по смыслу, и некоторого ключа, например алфавитного, позволяющего расположить слова в определенном порядке. При получении информации тезаурус может изменяться, и степень этого изменения характеризует воспринятое количество информации. [c.18]
Если индивидуальный тезаурус потребителя 5П отражает его знания о данном предмете, то количество смысловой информации /с, содержащееся в некотором сообщении, можно оценить степенью изменения этого тезауруса, произошедшего под воздействием данного сообщения. Очевидно, что количество информации /с нелинейно зависит от состояния индивидуального тезауруса пользователя, и хотя смысловое содержание сообщения S постоянно, пользователи, имеющие отличающиеся тезаурусы, будут получать неодинаковое количество информации. [c.25]
В самом деле, если индивидуальный тезаурус получателя информации близок к нулю, Sn 0, то в этом случае и количество воспринятой информации равно нулю /с = 0. [c.25]
Количество семантической информации /с в сообщении также будет равно нулю, если пользователь информации абсолютно все знает о предмете, т.е. его тезаурус iSn, и сообщение не дает ему ничего нового. [c.25]
Интуитивно мы чувствуем, что между этими полярными значениями тезауруса пользователя существует некоторое оптимальное значение, 5П опт, при котором количество информации /с, извлекаемое из сообщения, становится для получателя максимальным. Эта функция зависимости количества информации /с от состояния индивидуального тезауруса пользователя 5П приведена на рис. 1.3. [c.25]
На личностном уровне информационная культура тесно связана с культурой работника и оценивается качеством тезауруса, который представляет собой совокупность, гуманитарных, управленческих и специальных знаний индивида, размещенных в его памяти и включающихся в процессе восприятия и переработки информации. [c.135]
Чтобы содержание сообщения было понятным, оно должно иметь общие точки соприкосновения с тезаурусом получателя информации. [c.135]
При бедном тезаурусе сотрудников информационный поток наталкивается на барьер непонимания, неосведомленности — в таком случае говорят о появлении семантического шума. [c.135]
СРЕДСТВА ОБЕСПЕЧЕНИЯ АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ И ИХ ТЕХНОЛОГИЙ — программные, технические, лингвистические, правовые, организационные средства (программы для электронных вычислительных машин средства вычислительной техники и связи словари, тезаурусы и классификаторы инструкции и методики положения, уставы, должностные инструкции схемы и их описания, другая эксплуатационная и сопроводительная документация), используемые или создаваемые при проектировании информационных систем и обеспечивающие их эксплуатацию. [c.304]
Эти и другие предпосылки (см., например, [33]) были основанием того, что единственным достаточно стабильным интегрирующим элементом современной ЙС может являться не информационная и тем более не функциональная модель предприятия, а только понятийная модель предметной области, да и то при условии ее постоянного пересмотра и обновления. Пассивные понятийные модели такого прикладного рода строились и представлялись в виде терминологических словарей и тезаурусов понятий. Такие словари строились как часть обеспечения ИС и содержали описания элементов информационных, функциональных, организационных и других моделей для ИС. Однако практически все использование таких моделей для проектирования и развития ИС приходилось и приходится делать вручную. [c.140]
Разработка дескрипторного языка фактически сводится к разработке информационно-поискового тезауруса. [c.508]
Информационно-поисковый тезаурус [c.508]
По первому способу создаются алфавитные словари, по второму способу - тезаурусы. Алфавитные словари служат для раскрытия зна- [c.508]
Тезаурусы используют в своей работе специалисты, в той или иной степени связанные с подготовкой и обработкой текстовой информации переводчики, редакторы, научные работники, референты и др. [c.509]
Информационно-поисковые тезаурусы используются при индексировании документов и запросов. [c.509]
Таким образом, информационно-поисковые тезаурусы используются для [c.509]
Тезаурус имеет вид словаря, в котором в определенном порядке расположены термины и зафиксированы связи между ними. [c.509]
Как правило, тезаурус состоит из введения, алфавитного указателя (словарная часть) и систематического указателя. [c.509]
Введение содержит общие характеристики тезауруса — область применения, правила использования, число дескрипторов, ключевых слов и другую справочную информацию. [c.509]
Тезаурусы разрабатываются для отдельных отраслей. Например, существует Тезаурус по документации , Дескрипторный словарь по информатике и т. п. Тезаурус может быть разработан и для обслуживания конкретной информационно-поисковой системы. [c.510]
Построение тезауруса состоит из нескольких взаимосвязанных этапов. [c.510]
В процессе построения тезауруса и выделения множества дескрипторов происходит устранение синонимии, омонимии, полисемии ключевых слов, а также выявление парадигматических связей между дескрипторами. [c.511]
Разработка тезауруса без использования компьютерных технологий — достаточно длительный и трудоемкий процесс. [c.511]
Большинство автоматизированных методов создания тезауруса основано на автоматическом подсчете частоты слов, содержащихся в документах, считающихся типичными для данной предметной области. Результаты такой обработки обычно представляются в виде матрицы документ—термин . Элемент матрицы на пересечении строки и столбца трактуется как вес слова в документе. На основе полученной матрицы вычисляются коэффициенты подобия между словами, определяемые в зависимости от частоты, с которой слова совместно встречаются в анализируемых документах, и формируется структура тезауруса. [c.511]
Автоматические информационно-поисковые тезаурусы являются составным элементом систем автоматического индексирования документов и запросов. В словарной статье автоматического тезауруса, как правило, зафиксированы отношения условной эквивалентности (синонимии), отношение подчинения и ассоциативные отношения. [c.511]
В настоящее время происходит расширение сфер применения автоматических тезаурусов. При этом тезаурусы выступают состав- [c.511]
Среди наиболее перспективных направлений развития автоматических тезаурусов можно указать следующие [c.512]
Получение справки по используемому слову. Указав слово в качестве ключа для запроса, пользователь в ответ получает соответствующий фрагмент словаря, содержащий лингвистическую информацию о данном слове. Например, автоматический тезаурус получает от пользователя некоторое существительное и в ответ выдает совокупность устойчиво сочетающихся с ним глаголов или все наиболее часто сопровождающие его определения. При этом автоматически выполняется процедура нормализации входного слова (т. е. приведение существительного к именительному падежу). [c.512]
Контекстные замены по требованию пользователей. В данном случае тезаурус не только подбирает вместо одного словосочетания другое, которое пользователь счел более соответствующим контексту по смысловым или стилистическим соображениям, но и автоматически переоформляет параметры слов (например, род прилагательного) в соответствии с контекстом. Это означает, что синтаксические операции, производимые тезаурусом, существенно усложняются. [c.512]
Автоматическая оценка стиля. Если слова и словосочетания в тезаурусе снабдить стилистическими пометками, то он может использоваться для стилистической оценки текста с выделением слов и словосочетаний, выпадающих из общего стиля документа. [c.512]
Второй тип словарей представляют информационно-поисковые тезаурусы, которые содержат информацию об отношениях условной эквивалентности, отношениях подчинения и ассоциативных отношениях между словами. [c.516]
Пищулин Н.П., Ковалевский В.Ф., Анисимов В.М. Кадры-персонал Словарь-тезаурус. — М. МО Российской Федерации, Российская академия управления, 1994. [c.452]
Информационное единство является одним из условий совместимости и эффективного взаимодействия всех функциональных подсистем системы управления качеством. Оно включает систему техническо-экономических показателей, нормативно-технических документов, классификаторов, тезаурусов, шифраторов, кодов, информационных языков носителей информации, а также методов их организации, обработки, хранения, передачи и контроля. [c.144]
С понятием информации связана количественная мера информации. На синтаксическом уровне принято употреблять термин данные , для которых используется понятие объема данных (число экземпляров документов, количество доку-ментострок, записей файлов, символов, байтов и т. п.). Данные — это сырье для получения информации согласно определенным целям обработки. Термин информация означает устранение неопределенности путем преобразования данных. Противоположный по смыслу термин — энтропия , являющаяся мерой этой неопределенности. Информативность сообщений тем выше, чем более определенным становится для получателя информации состояние системы. Семантическая мера информации — содержательность основана на наличии тезауруса системы. Тезаурус содержит взаимоувязанные понятия, термины, определения, согласованные структуры данных логического уровня представления (базы данных, формы документов, технико-экономические показатели. Тезаурус выражает знания о системе. Новая информация воспринимается через тезаурус, который может пополняться новыми элементами. При этом информативность сообщений зависит во многом от получателя, способного расширить свой тезаурус. [c.24]
Тезаурусный метод подтверждает тезис о том, что информация обладает свойством относительности и имеет, таким образом, относительную, субъективную ценность. Для того чтобы объективно оценивать научную информацию, появилось понятие общечеловеческого тезауруса, степень измене- [c.26]
Блок 7 — мемориальная информация или показ авторов рекламы вживую , а также и места создания рекламы (ателье, студии, страны, региона). Этим достигается эффект запечатления рекламы. Здесь максимально применяется тезаурус (словарь) символических знаков и магических символов1. [c.299]
Развитие малого бизнеса на основе реорганизации крупных предприятий. М. ИСАРП, 1999. (Сер. Бизнес-Тезаурус Учебно-метод. пособия для российского бизнеса). [c.529]
ТЕЗАУРУС — словарь-справочник, в котором перечисляются все лексические единицы информационно-поискового языка (дескриптрры) с, их связями, а также синонимические дескрипторы и ключевые слова и словосочетания естественного языка. [c.259]
При индексировании с тезаурусным контролем лексики для выражения содержания документа и запроса используют только дескрипторы, входящие в информационно-поисковый тезаурус, что позволяет исключить синонимию и учесть парадигматические связи, и, в конечном счете, повышает эффективность поиска. [c.509]
Смотреть страницы где упоминается термин Тезаурус
: [c.385] [c.258] [c.166] [c.182] [c.509]Смотреть главы в:
Проектирование машинной обработки экономической информации (1987) -- [ c.118 ]
Организация планирование и управление промышленным предприятием (1982) -- [ c.21 ]
Популярный экономико-математический словарь (1973) -- [ c.140 ]
Делопроизводство и машинопись (1999) -- [ c.108 ]
Теория экономических информационных систем Изд.4 (2000) -- [ c.207 ]