Поисковый образ документа

Классификатор названий (видов) документов может стать основой для составления в организации различных перечней документов Перечня регистрируемых документов, подлежащих контролю исполнения , Перечня документов с типовыми сроками исполнения . На основании классификатора может составляться и дополняться Табель форм документов организации и ее структурных подразделений. В автоматизированных ИПС классификатор видов документов используется при вводе информации о документе в базу данных и при поиске документа (сопоставление поискового образа документа и запроса).  [c.182]


Автоматизированный документальный поиск может быть организован на основе различных технологий поиска по поисковому образу документа, поиска по полному тексту документа, поиска документов по гипертекстовым ссылкам.  [c.501]

В документальных информационно-поисковых системах, их также называют библиографическими, поиск документа происходит по краткому формализованному описанию его содержания — так называемому поисковому образу документа (ПОД).  [c.502]

При прямой организации каждому документу соответствует перечень слов, составляющих текст или поисковый образ документа. Например, логическая структура поискового файла при прямой организации для примера, приведенного в п. 20.4, будет выглядеть следующим образом (рис. 20.1).  [c.518]

При этом отыскание нужных документов производится путем поочередного сравнения поисковых образов документов со словами, составляющими информационный запрос, т. е. реализуется принцип последовательного доступа к данным. Достоинства прямой схемы состоят в простоте организации и использования, например, для включения нового документа в массив достаточна добавить новую запись в файл.  [c.518]


В случае частичного инвертирования в индекс включают информативные ключевые слова, т. е. формируется поисковый образ документа.  [c.519]

Чаще — индексирование в информационно-поисковых системах, операция составления поискового образа документа, т.е. выбор из текста этого документа ключевых слов, отражающих его содержание или тему. Применяется для машинного поиска нужного текста среди многих других.  [c.124]

Поисковый образ документа 124, 267  [c.481]

В правильно организованном массиве информации каждый документ (единица хранения) или карточка имеют в его структуре постоянное место — адрес. Единицей хранения может быть дело (подшивка документов), документ по содержанию, лист или учетная страница, алфавитно-цифровой знак или двоичная единица (бит). Набор слов (дескрипторов) или составленная из них фраза определяет адрес документа в массиве и называется поисковым образом документа. Словари таких дескрипторов, в которых дается развернутое тол-  [c.97]

Среди типовых недостатков в регистрации документов в организациях, можно отметить следующие многократность регистрации, отсутствие перечня документов, не подлежащих регистрации, отсутствие регистрации внутренних документов, отсутствие в индексах документов номеров дел по номенклатуре дел, что снижает поисковый образ документа и др.  [c.94]

Естественно встает вопрос, как информационно-поисковая система должна со всем этим работать. В традиционных системах есть понятие поискового образа документа (ПОД) - это нечто, что заменяет собой документ и используется при поиске вместо реального документа. Поисковый образ является результатом применения некоторой модели информационного массива документов к реальному массиву. Наиболее популярной моделью является векторная модель, в которой каждому документу приписывается список терминов, наиболее адекватно отражающих его смысл. Если быть более точным, то документу приписывается вектор, размерность которого равна числу терминов, которыми можно воспользоваться при поиске. При булевой векторной модели элемент вектора равен 1 или 0, в зависимости  [c.243]


Все хранимые в ИПС документы индексируются каким-либо образом. Каждому документу (статье, протоколу, видеокассете) присваивается индивидуальный код, составляющий поисковый образ документа. Поиск в хранилищах идет не по самим документам, а по их поисковым образам, которые  [c.18]

Блок формирования поисковых запросов Блок формирования поисковых образов документов  [c.19]

Классифицирование (распределение документов по классам) сопровождается индексированием — проставлением условных обозначений, соответствующих подразделениям принятой классификации. Идентичные шифры присваиваются ограниченному количеству документов, обладающих идентичными сторонами принадлежащих к одной отрасли знания, предметной области, имеющих единую типовую форму, функциональное предназначение и т.д. Таким образом, достигается обособление небольшого количества документов, зашифрованных одним обозначением, логическая последовательность обозначений способствует структурированию массива. Индексирование должно проводиться на основе непосредственного анализа документа с учетом характера информационно-поискового массива, элементом которого становится поисковый образ документа (ПОД), характера информационных потребностей пользователей данной информационно-поисковой системы (ИПС) в соответствии с общими принципами индексирования и особенностями их применения в конкретной организации.  [c.132]

Под поиском понимается совокупность логических и технических операций, имеющих конечной целью нахождение документов, сведений о них, фактов, данных и т.п. в информационно-поисковом массиве. Информационно-поисковый массив представляет собой упорядоченную совокупность поисковых образов документов вместе с адресами их хранения. Примерами информационно-поискового массива могут служить каталоги библиотек, компьютерные базы данных.  [c.138]

Прикладные исследования в области документоведения касаются вопросов классифицирования документов, их индексирования, реферирования, создания поискового образа документа, организации оптимального документооборота, отбора наиболее ценных документов, хранения, поиска их.  [c.162]

Под избыточным индексированием понимается дополнение поискового образа документов или поискового предписания дополнительными дескрипторами, которые связаны по смыслу с основными дескрипторами. При этом более предпочтительным считается избыточное индексирование не документов, а информационных запросов.  [c.207]

Принцип общезначимости чрезвычайно важен и при индексировании документов, вводимых в любую информационную систему, в том числе и экономическую. В этом случае он формулируется следующим образом поисковый образ документа отражает лишь те сведения,  [c.62]

Большинство действующих автоматизированных ЭИС реализуют прямой критерий выдачи (во многих случаях условие (3.1) несколько ослаблено допускается отсутствие в поисковом образе документа одного или нескольких дескрипторов поискового предписания), т.е. обрабатываются видовые, а не родовые запросы. Это связано с историей развития поисковых систем и объясняется тем, что объем выдачи на видовой запрос в среднем значительно превышает объем выдачи на родовой запрос.  [c.66]

Документальные ЭИС не могут достичь высокой эффективности, если при индексировании документов не руководствоваться принципом общезначимости. Обратным критерием при грубых нарушениях принципа общезначимости бессмысленно пользоваться он не сможет конкурировать с так называемыми ослабленными прямыми критериями выдачи, когда допускается отсутствие в поисковом образе документа одного или нескольких дескрипторов.  [c.67]

Распространенные в настоящее время тезаурусы используются в работе с информационно-поисковым массивом для повышения полноты и точности информационного поиска. В гипертексте в отличие от традиционных информационных систем нет разделения поискового аппарата на тезаурус и массив поисковых образов документов. В гипертексте весь поисковый аппарат реализуется как тезаурус гипертекста.  [c.73]

Тезаурус гипертекста как поисковый аппарат имеет ряд преимуществ по сравнению с традиционным массивом дескрипторных поисковых образов документов, в котором полнота информационного  [c.75]

Второй подход состоит в том, что поиск происходит по всему тексту документа или по его поисковому образу. При этом в качестве запроса чаще всего выступают отдельные ключевые слова или их логические комбинации. Этому подходу, соответствующему традиционному пониманию информационного поиска, и посвящена данная глава.  [c.501]

На всех ступенях информационной службы создаются справочно-информационные фонды (СИФ), представляющие собой наиболее полное собрание документов и их поисковых образов по тематике соответствующего информационного органа. Эти фонды состоят из опубликованных и неопубликованных материалов и технических документов.  [c.192]

Сформированные таким образом в памяти ЭВМ таблицы позволяют обеспечить автоматическую подготовку поисковых образов запросов (на уровне лексики рубрик) к любой из взаимосвязанных систем, а также автоматическое формирование массивов документов по запросу.  [c.53]

По разделам годового плана подготавливаются информационно-поисковые массивы. Всем элементам поискового массива присваиваются отличительные координатные индексы, поставленные в однозначное соответствие массиву. В описание поискового образа элемента массива входят шифр данного массива и идентификатор. С помощью такой поисковой системы организуются доступ к информации и диалог плановика с банком данных. Наряду с работой, связанной с организацией и упорядочением массивов, отрабатывается комплект документов плановой информации. В результате создается банк форм годового плана. По каждой форме составляются алгоритмы — схемы счета, которые сводятся в банк алгоритмов. В результате завершаются два этапа технологии планирования — документальная подготовка и алгоритмизация.  [c.27]

Индексация — процесс анализа спайдером поисковой системы содержимого web-страниц, отслеживания обнаруженных на них гиперссылок и внесения информации о найденных таким образом документах в базу данных (индекс) поискового сервера.  [c.264]

В ДИПС поиск документов происходит посредством просмотра поискового образа документа. Такая организация поиска документов имеет свои преимущества и недостатки.  [c.512]

Некоторые из этих правил значительно экономят время при традиционных методах работы (проставление второго инициала при подписи документа избавляет от его поисков при ответе, указание телефона исполнителя облегчает крнтакт с ним при необходимости уточнений по полученному документу и т.д.), а другие — снижают затраты при автоматизации обработки документов (оформление даты тремя парами арабских цифр исключает необходимость ее кодирования, заголовки к тексту фактически представляют поисковый образ документа, нужный при вводе данных из него в ЭВМ, нумерацию участков текста можно также использовать в виде их кода и др.). -,  [c.35]

Проблема, связанная с индексированием, заключается в том, что приписывание поискового образа документу или информационному ресурсу опирается на представление о словаре, из которого эти термины выбираются, как о фиксированной совокупности терминов. В традиционных системах существовало разбиение на системы с контролируемым словарем и системы со свободным словарем. Контролируемый словарь предполагал ведение некоторой лексической базы данных, добавление терминов в которую производилось администратором системы. Таким образом, все новые документы могли быть заиндексированы только теми терминами, которые были в этой базе данных. Свободный словарь пополнялся автоматически по мере появления новых документов. Однако на момент актуализации словарь также фиксировался. Актуализация предполагала полную перезагрузку базы данных. В момент этого обновления перегружались сами документы и обновлялся словарь, а после его обновления производилась переиндексация документов. Процедура актуализации занимала достаточно много времени, и доступ к системе в момент ее актуализации закрывался.  [c.244]

Для того чтобы при помощи ИПС можно было отыскать документы, соответствующие некоторому информационному запросу, сам запрос также должен быть заиндексирован. Процесс поиска осуществляется путем сопоставления поисковых образов документов с поисковым образом запроса. При полном или частичном совпадении образов документ считается соответствующим запросу и выдается пользователю.  [c.17]

Посткоординируемые (дескрипторные языки) основаны на методе координатного индексирования. В посткоординируемых ИПЯ лексические единицы объединяются в поисковом образе лишь во время индексирования документа. Словарь дескрипторного ИПЯ состоит из специальным образом выбранных отдельных слов или словосочетаний ЕЯ — ключевых слов и дескрипторов.  [c.505]

ДЕСКРИПТОР [des riptor] — единица языка информационно-поисковой системы, соответствующая определенному ключевому или базовому понятию, включенному в тезаурус этой системы. Это термин со строго фиксированным значением, без синонимов. Из дескрипторов для каждого документа, хранящегося в системе, составляется его поисковый образ. Напр., для статьи, посвященной применению экономико-математических методов в планировании технического прогресса на предприятиях металлургии, Д. (то же ключевыми словами) могли бы стать слова (либо их цифровые или иные обозначения, "понятные" компьютеру) экономико-математическая модель, эффективность, технология, металл. Для поиска с помощью ИПС материалов на эту тему надо также сопоставить поисковый образ запроса (предварительно отредактированный машиной) с поисковыми образами всех хранящихся в системе документов, машина выберет те документы, для которых они совпадут или будут достаточно близки к ним, что также проверяется автоматически.  [c.79]

В результате обработки документов создается их поисковый образ — выделение ряда признаков, по которым документ можно однозначно идентифицировать, установить его форму и содержание, местонахождение в документном массиве. Это — обязательная процедура, предшествующая использованию, ибо в противном случае документ невозможно будет отыскать. Создаваемый ПОД представляет собой извлеченную и свернутую до различной степени информацию о документе, который получает после этой процедуры название первичной информации (первичного документа), а ПОД — вторичной. Таким образом, вторичная информация — это результат анали-тико-синтетической переработки первичной. Вторичная информация более компактна, более формализована, в силу этого более мобильна и более экономна в движении по системам коммуникаций. Из нее легко формируется информационно-поисковый массив, служащий базой для поиска информации о документах.  [c.134]

Принцип объектографии. В гипертексте информация систематизируется не на библиографических принципах, когда единицей описания и хранения является документ, а на принципах объектографии. При этом единицей хранения является информация, извлеченная из различных документов-первоисточников и относящаяся к конкретному объекту (классу объектов), который является предметом описания в поисковом образе.  [c.63]

Несоблюдение принципа общезначимости можно рассматривать как частный случай неправильного выбора глубины индексирования, когда тема документа, отражаемая в поисковом образе, неправомерно расширяется. Если при таком индексировании документов тему видового запроса заиндексировать буквально так, как просит абонент, не укрупняя ее, то при поиске может быть утеряна часть имеющихся в массиве сведений.  [c.68]

Экономико-математический словарь Изд.5 (2003) -- [ c.124 , c.267 ]