Разделитель — управляющий символ, разделяющий данные.
Форматы серии MARC имеют иерархическую структуру, которая поддерживает отношения между компонентами внутри записи и позволяет комбинировать связанные записи.
Аналогичное назначение и структуру имеет Единый Коммуникативный Формат (CCF) ЮНЕСКО, содержащий три компонента:
• правила структуризации среды хранения (включая физические размеры элементов среды — длина блоков и т. п.);
• идентификационные коды элементов данных (поля, подполя, метки, разделители);
• правила представления содержимого элементов данных (словари и алгоритмы индексирования и кодирования информации).
Форматы полнотекстовых документов. Понятие модель документа охватывает аспекты создания, преобразования, хранения, поиска, передачи и отображения документов. Принято рассматривать структуру документа в двух аспектах: логическом (содержание) и физическом (макетном) — представление [30].
Логическая структура определяет составные компоненты и их соотношения в понятиях, отвечающих взгляду на документы как смысловые структуры. Например, к основным смысловым компонентам относятся: авторские данные (имя автора, место работы), аннотация, оглавление, главы, разделы, параграфы, рисунки, сноски.
На рис. 1.12 приведен пример структуры документа «Пояснительная записка к дипломному проекту (работе)». Здесь выделены такие базовые понятия структуры, как обязательность/'необязатель-
К данной компоненте лингвистического обеспечения в первую очередь относятся кодификаторы, классификаторы, тезаурусы.
Кодификаторы АИС представляют собой словари, не обязательно несущие семантическое соответствие между обозначаемым (класс, понятие, сущность) и обозначающим (код, символ). Например, в персональной БД атрибут SEX (Пол) может обозначаться либо М/Ж, либо 1/0 или 0/1, либо еще как-то в рамках двухсим-вольного алфавита (домена). Это соответствие необязательно и может произвольно выбираться разработчиками различных систем. Основанием для использования кодификаторов (впрочем как и других типов нормативных словарей) являются: экономия времени для заполнения форм и ввода документов; минимизация ошибок; экономия памяти.
Классификаторы АИС являются словарями, обязательно несущими определенную смысловую нагрузку. Они подразумевают иерархическое разбиение предметной области на совокупность сужающихся классов и последующее отнесение обозначаемого объекта реального мира (документ, продукт и пр.) к одному из классов (индексирование).
0 коммент.:
Отправить комментарий