ПОИСК
Это наилучшее средство для поиска информации на сайте
Обработка документов
из "Документоведение "
Распространяясь по каналам коммуникаций, документы оседают в массивах — неких собраниях документов, вливаясь в уже сформированную ранее их совокупность. Оптимальная работа с документами в массивах возможна лишь после предварительной их обработки. Аналитико-синтетическая обработка документов производится с целью свертывания информации о форме и содержании документа до уровня буквенно-цифрового шифра, библиографического описания, аннотации, реферата, научного перевода, обзора, а также включает извлечение из документов фактов, сведений, данных и фиксации их в специальных формах. [c.130]Библиографическое описание — это совокупность библиографических сведений о документе, приведенных по установленным правилам и предназначенных для его идентификации и общей характеристики. [c.131]
Систематизация преследует цель распределить поступающий материал по определенным, заранее заданным признакам, соответствующим той или иной классификации. Каждая из современных наук имеет или развивает свою частную дисциплину, изучающую специально вопросы систематизации соответствующих объектов познания. Такие дисциплины носят самые различные названия типология, систематика, таксономия, теория классификации и др. Но суть их одна - систематизировать определенные объекты в целях более рационального познания. [c.131]
Классификация фиксирует закономерные связи между классами объектов с целью определения места объекта в системе, которое указывает на его свойства. Строго и четко проведенная классификация одновременно подытоживает результаты предшествующего развития данной отрасли и вместе с тем отмечает начало нового этапа в ее развитии. [c.131]
Классификация - система соподчиненных понятий (классов, объектов) какой-либо области знания или деятельности человека, часто представляемая в виде различных по форме схем (таблиц) и используемая как средство для установления связей между этими понятиями или классами объектов, а также для ориентировки в многообразии понятий или соответствующих объектов. [c.131]
Классифицирование (распределение документов по классам) сопровождается индексированием — проставлением условных обозначений, соответствующих подразделениям принятой классификации. Идентичные шифры присваиваются ограниченному количеству документов, обладающих идентичными сторонами принадлежащих к одной отрасли знания, предметной области, имеющих единую типовую форму, функциональное предназначение и т.д. Таким образом, достигается обособление небольшого количества документов, зашифрованных одним обозначением, логическая последовательность обозначений способствует структурированию массива. Индексирование должно проводиться на основе непосредственного анализа документа с учетом характера информационно-поискового массива, элементом которого становится поисковый образ документа (ПОД), характера информационных потребностей пользователей данной информационно-поисковой системы (ИПС) в соответствии с общими принципами индексирования и особенностями их применения в конкретной организации. [c.132]
В зависимости от задач поиска применяются различные принципы классифицирования документов, которые можно объединить в две большие группы формальные и содержательные. К формальным классификациям относятся классификации документов по их собственным признакам, таким, например, как функции документа, размеры, степень машиночитаемое , материал, на котором документ изготовлен и т.д. Содержательные классификаторы используются для систематизации и поиска содержащейся в документах информации. [c.132]
В результате обработки документов создается их поисковый образ — выделение ряда признаков, по которым документ можно однозначно идентифицировать, установить его форму и содержание, местонахождение в документном массиве. Это — обязательная процедура, предшествующая использованию, ибо в противном случае документ невозможно будет отыскать. Создаваемый ПОД представляет собой извлеченную и свернутую до различной степени информацию о документе, который получает после этой процедуры название первичной информации (первичного документа), а ПОД — вторичной. Таким образом, вторичная информация — это результат анали-тико-синтетической переработки первичной. Вторичная информация более компактна, более формализована, в силу этого более мобильна и более экономна в движении по системам коммуникаций. Из нее легко формируется информационно-поисковый массив, служащий базой для поиска информации о документах. [c.134]
Обработка различается в зависимости от ее направленности на весь документ, в единстве формы и содержания, и на его структурную часть — текст. В силу этого выделяется документная обработка, в результате которой документ получает идентификационные признаки (библиографическое описание, классификационный шифр, инвентарный номер и т.д.), и информационная обработка, предполагающая манипуляции с текстом документа. В процессе такой информационной обработки текст может быть сокращен, переведен на другой язык, сделана аннотация, реферат, обзор, тезисы, резюме. В результате получается еще один текст, связанный с оригиналом идентификационными признаками. Он более компактен, отражает его содержание и может быть использован вместо оригинала. [c.134]
Все подпроцессы аналитико-синтетической обработки требуют творческого участия специалиста. Только человек может глубоко вникнуть в текст, выявить его глубинные взаимосвязи, оценить значимость. Но современные компьютерные средства позволяют эти операции частично формализовать, что дает возможность освободить специалиста от трудоемких рутинных операций, более эффективно организовать поиск документов в большом массиве, увеличить скорость обработки и степень релевантности. [c.135]
Вернуться к основной статье