Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Информатика, автоматизированные информационные технологии и системы

ОБЕСПЕЧИВАЮЩАЯ И ФУНКЦИОНАЛЬНАЯ ЧАСТИ АИС

Информационное обеспечение

Основной принцип создания ИО — решение задачи удовлетворения информационных потребностей пользователя и/или системы управления объектом (производством).

В ИО выполняются следующие процессы:

  • • накопление информации;
  • • обмен информацией;
  • • обработка информации;
  • • управление данными;
  • • формализация данных и знаний.

Создание И О проходит следующие этапы:

  • • исследование информационных потоков;
  • • разработка системы классификации и кодирования;
  • • разработка унифицированных форм представления данных в информационной базе;
  • • накопление массивов данных и работа с ними.

На предпроектной стадии разработки АС на основании технико-экономического обоснования разрабатывается техническое задание (ТЗ) на создание системы. В ТЗ определяются принципы построения системы, организационная и функциональная структуры, требования к обеспечивающим подсистемам, в том числе к ИО.

Информационное обеспечение определяет размещение и формы организации информации в системе, представляя собой совокупность методов и средств построения и реализации информационной базы. ИО реализуется как внешнее (немашинное) и внутримашинное.

  • 1. Внешнее (немашинное) ИО, которое, однако, должно учитывать принципы автоматизации информационных процессов. Его состав:
    • • СКК (система классификации и кодирования);
    • • НСД (нормативно-справочные документы);
    • • ОД (оперативные документы);
    • • ММ (методические и инструктивные материалы).

Движение этих документов реализуется в соответствии с организационной структурой управления.

  • 2. Внутримашинное ИО включает:
    • • ИМ (информационные массивы), составляющие информационную базу системы;
    • • ПП (пакеты программ).

Информационное обеспечение реализуется в виде банков данных и банков знаний, в основе построения которых — модели накопления данных и представления знаний. Эти процессы должны быть формализованы на концептуальном и логическом уровнях.

Традиционно, в соответствии с ГОСТ 34.03—90 информационное обеспечение рассматривалось как «совокупность форм документов, классификаторов, нормативной базы и реализованных решений по объемам, размещению и формам существования информации, применяемой в АС при ее функционировании».

ИО АИС включало три составляющие:

  • • единую систему классификации и кодирования информации;
  • • унифицированные системы документации;
  • • массивы информации.

Лингвистическое обеспечение рассматривалось как «совокупность средств и правил для формализации естественного языка, используемых при общении пользователей и эксплуатационного персонала АС с комплексом средств автоматизации при функционировании АС». Лингвистическое обеспечение АИС включало две составляющие: лексическую (словарную) базу и языковые средства.

В настоящее время И О рассматривается как совокупность собственно информационного обеспечения и лингвистического обеспечения. При этом под собственно информационным обеспечением понимают файлы операционной системы и базы данных, а под лингвистическим — форматную базу, лексическую базу и языковые средства.

Поэтому можно сформулировать следующее утверждение.

Информационное обеспечение АИС — это совокупность баз данных и файлов операционной системы, форматной и лексической баз, а также языковых средств, предназначенных для ввода, обработки, поиска и представления информации в форме, необходимой потребителю.

Данные, отображающие сведения об определенной предметной области, могут поступать из внешней и внутренней среды системы как в неструктурированном виде (например, различные документы на естественном языке и др.), так и в структурированной форме (анкеты, таблицы и др.). Естественно, что способы сбора и обработки таких данных отличаются друг от друга. Эти данные необходимо так структурировать, т. е. создать такие структурированные документы, чтобы стала возможной их программная обработка. В общем случае документ представляет собой зафиксированную на материальном носителе информацию (данные) с реквизитами, позволяющими ее идентифицировать.

Сбор информации осуществляется от источников по каналам получения информации. Отнесение информации к определенной предметной области — сложная классификационная и плохо поддающаяся автоматизации задача, поэтому данная операция, как правило, выполняется специалистами.

Затем осуществляется комплектование БД, т. е. выполняется предварительная обработка и рубрикация информации. Далее неструктурированная информация подлежит структуризации.

Структуризация информации — процесс представления неформализованной документированной информации на информационном языке представления данных в конкретной АИС.

Структурированная информация заносится в БД системы, и устанавливается ее связь с уже имеющейся в базе информацией.

Структура БД организована в зависимости от типа модели данных (иерархическая, сетевая, реляционная). Определение каждой модели, а также основные сведения о БД приведены в главе 6. Пример иерархической модели представлен на рис. 9.1.

В иерархической модели соблюдается строгая последовательность обхода по вертикали или горизонтали. Операции над данными имеют строгую определенность: найти указанное дерево, в этом дереве найти указанный уровень, в уровне найти указанную запись и т. д. Соблюдается строгая последовательность перехода от родительской сущности к дочерней.

Иерархическая модель организации для определения структуры БД

Рис. 9.1. Иерархическая модель организации для определения структуры БД

Но рассматривается и общая для БД логическая структура. БД включает одну или несколько подбаз (файлов, таблиц, массивов). Каждая подбаза состоит из агрегатов данных (записей, документов). Запись состоит из полей. Поля могут быть элементарные (имеют фиксированную и ограниченную длину), составные (агрегаты элементарных), текстовые (имеют переменную длину и сложную внутреннюю структуру), бинарные (данные, рассматриваемые как поля).

К физической структуре БД относят файлы первичных (исходных) данных, файлы вторичной (справочной) информации, тезаурусы и словари данных (см. описание лексической базы), индексы.

Файлы исходных данных содержат объекты, подлежащие обработке. Файлы вторичной информации содержат описания объектов или их элементов.

Индекс — указатель (файл), связывающий адрес объекта с его содержанием. Включает список и частотный словарь.

В настоящее время для создания баз данных (БД) АИС используют различные СУБД.

В главе 6 рассмотрена методика создания реляционной БД под управлением СУБД Access. Рассмотрим методику создания реляционной БД в среде СУБД FoxPro.

Прежде всего проектируют реляционную структуру БД и выполняют нормализацию таблиц.

Первый этап проектирования БД — построение концептуальной информационной модели организации. Для этого должны быть изучены концептуальные требования заказчика (организации) и на основе анализа этих требований определены сущности. Результатом работ первого этапа проектирования БД должен быть список основных сущностей — прообраз будущих таблиц и информационная (концептуальная) модель данных.

Второй этап проектирования — определение взаимосвязей между сущностями. Результатом работ второго этапа проектирования БД должна быть схема, отражающая взаимосвязи между сущностями.

Третий этап проектирования — задание первичных и внешних ключей для перехода между сущностями. Результатом работ третьего этапа проектирования БД должна быть общая таблица с описанием всех сущностей — прообраз будущих таблиц. В таблице кроме атрибутов (будущих полей) задаются первичные и внешние ключи для каждой таблицы.

Четвертый этап проектирования — приведение модели к требуемому уровню нормальной формы, т. е. выполнение нормализации отношений между таблицами. Следует удалить из БД избыточную информацию. Для этого нужно создать для каждой сущности по одной таблице с тем же именем, а полями будут атрибуты сущности. При этом следует выполнить условия:

  • 1) первой нормальной формы таблицы:
    • • каждое поле должно быть неделимо;
    • • не должно быть повторяющихся полей или групп полей;
  • 2) второй нормальной формы таблицы:
    • • все условия первой нормальной формы;
    • • первичный ключ однозначно определяет всю запись;
    • • все поля зависят от первичного ключа;
    • • первичный ключ не должен быть избыточен;
  • 3) третьей нормальной формы таблицы:
    • • все условия второй нормальной формы;
    • • каждое неключевое поле не должно зависеть от другого неключевого поля.

Пятый этап проектирования — описание каждой таблицы: присвоение имен таблицам и полям, определение типа и размера полей, указание полей, по которым надо построить ключи и индексы, определение виртуальных полей, указание назначения каждого поля. Результатом работ пятого этапа проектирования БД должны быть нормализованные таблицы с полным описанием всех их элементов.

После проектирования БД выполняют ее создание.

Пример созданных таблиц приведен на рис. 9.2.

Создать файл БД, открыть таблицы и работать с записями можно двумя способами: с помощью специальных команд и с помощью главного меню.

Вид созданных таблиц

Рис. 9.2. Вид созданных таблиц

Для облегчения поиска данных в таблице выполняют индексирование таблиц.

Индексы создаются по значениям одного поля (простой) или нескольких полей (сложный). Во время построения индекса записи в таблице сортируются по значениям поля (или полей) будущего индекса. Индекс (ключ) имеет свой тип (Туре): первичный (Primary) — только один, уникальный; внешние — Candidate, Unique или Regular. Если построен один индекс, то он хранится в одноиндексном файле, имеющем расширение .idx. Файлы, хранящие много индексов, называются мультииндексными и имеют расширение .cdx. Создать индекс можно с помощью командной строки или главного меню (рис. 9.3, 9.4).

Сортировку данных в таблицах осуществляют по возрастанию или убыванию двумя способами: в соответствии с индексом или с помощью команды SORT.

При поиске данных в таблицах используют два метода:

  • • последовательного (полного) перебора;
  • • деления пополам (по полю текущего индекса).
Создание индексов с помощью диалогового окна Table Designer (Конструктор таблиц)

Рис. 9.3. Создание индексов с помощью диалогового окна Table Designer (Конструктор таблиц)

Рис. 9.4. Создание сложных индексов с помощью диалогового окна Expression Builder (Построитель выражений)

Поиск методом полного перебора производится по любому полю таблицы с помощью определенных команд или при выборе из главного меню команд Table -> Go to Record Locate (Таблица -> Перейти к записи -> Найти).

Поиск данных в таблицах по полю текущего индекса (метод деления пополам) выполняется также с помощью определенных команд или при выборе из главного меню команд Edit -» Find (Правка -> Найти).

Фильтрация данных осуществляется с помощью фильтров двух видов:

  • • фильтр для строк, когда ограничивается количество строк;
  • • фильтр для полей, когда ограничивается количество полей, отображаемых на экране.

Для установки фильтра данных используют команду set

FILTER ТО <выр. L>.

Очень важным моментом является установление взаимосвязей между таблицами.

Для одновременной работы с несколькими таблицами нужно поместить каждую таблицу в свою рабочую область и установить взаимосвязи между ними. Указатели записей во взаимосвязанных таблицах будут двигаться синхронно.

В старшей таблице указатель перемещается произвольно. В младшей или подчиненной таблице указатель перемещается в соответствии с перемещением указателя в старшей таблице. К одной старшей таблице можно подключать несколько младших.

Родительская таблица должна иметь первичный ключ (индекс). Дочерняя таблица должна иметь внешний ключ (индекс). Одна запись в родительской таблице порождает несколько записей в дочерней. Общее поле, т. е. имеющее одинаковые имя, тип и размер, необходимо для установления взаимосвязи между родительской и дочерней таблицами. Таблицы могут быть объединены параллельно, последовательно и смешанно.

Перед установлением взаимосвязей все таблицы следует открыть в своих рабочих областях. Таблицы попарно должны иметь хотя бы одно общее поле, для которого в обеих таблицах (или хотя бы в одной) должен быть построен индекс.

Для организации взаимосвязей «один к одному», «один ко многим» используют различные команды.

В реляционной БД взаимосвязи между таблицами можно установить также с помощью главного меню. Для этого предварительно в каждой таблице строят первичный и внешние ключи. Затем выводят на экран диалоговое окно Table Designer. Указатель мыши наводят на имя первичного ключа родительской таблицы и перетаскивают его внутрь дочерней таблицы до имени соответствующего внешнего ключа. Обратная буксировка (от дочерней таблицы к родительской) не допустима. Проверить, а при необходимости и уточнить параметры взаимосвязи можно с помощью диалогового окна Edit Relationship (Редактировать связи). На рис. 9.5 представлен пример схемы взаимосвязи таблиц, образующих БД, по ключевым полям (индексам).

Имеются команды для сведения информации из нескольких таблиц в одну, для корректировки данных в связанных таблицах, для создания итогового табличного файла (содержит суммы по указанным полям) и др.

Меню является основным инструментом диалога в БД. В FoxPro можно создать меню различных типов: световое меню типа FOX и типа dBase, кнопочное меню.

Световое меню типа FOX существует в трех вариантах:

  • • произвольного типа — LIGHTBAR-меню;
  • • вертикальное — POPUP-меню;
  • • двухуровневое — PULLDOWN-меню.

Световое меню типа dBase существует в двух вариантах:

  • • вертикальное — POPUP-меню;
  • • горизонтальное — BAR-меню;
Пример схемы взаимосвязи таблиц, образующих БД

Рис. 9.5. Пример схемы взаимосвязи таблиц, образующих БД

Кнопочное меню представляет собой набор одно- или двухкнопочных команд. Для создания кнопочного меню используются определенные команды.

Для физически существующей таблицы можно создать экранную форму с помощью Мастера форм (Form Wizard) или Конструктора форм (Form Designer). Примерный вид готовой формы представлен на рис. 9.6.

Создать отчеты можно с помощью Мастера отчетов (Report Wizard) или Конструктора отчетов (New Report).

Мастер отчетов позволяет создать отчет по данным одной или нескольких таблиц. Допускается произвольный выбор полей, сортировка и группировка данных, изменение стиля отображения данных. Этапы создания отчета: определение окружения; размещение текста; размещение полей, линий, рисунков; перемещение объектов; сохранение отчета.

О файлах операционной системы см. раздел 2.8.

Файловая система определенным образом организована и включает в себя таблицу содержания, таблицу размещения файлов, таблицу определения файлов и т. п., а также область данных. ОС поддерживают обычные файлы, каталоги, специальные байт-ориентированные и блок-ориентированные файлы.

Пример готовой формы

Рис. 9.6. Пример готовой формы

По способу выборки информации выделяют файлы последовательного, прямого доступа и доступа по индексу.

Форматная база включает типы, форматы и структуры данных, записей, документов.

Тип данных определяется типом значений, которые могут принимать данные (константы, переменные, выражения), и множеством допустимых операций над ними. В языках программирования, СУБД, И ПС и др. используют следующие основные типы данных: целый (integer), действительный (real), двоичный (binary), логический (boolean), символьный (char), длинный текстовый (memo), дата (date), время (time) и др.

Структуры:

  • • данных — элементарные данные, массивы;
  • • записей — агрегаты данных (именованные группы переменных разного типа);
  • • документов — файл (совокупность данных об объектах, при этом данные могут быть структурированы в элементарные или агрегатные (групповые) поля).

Основные структуры: массивы, записи, текстовые поля, множественные поля записи, групповые поля записи, повторяющиеся поля записи.

Формат — вид записи данных, организованных в файлы. Тип и назначение файла определяют его формат. В ОС, как правило, имеется два типа файлов: символьные и двоичные. В символьном виде обычно представлены исходные данные и программы, а в двоичном — программы, записанные в машинных кодах. Тип файла обозначается в расширении его имени. Например, исполняемые программы имеют расширение .ехе и .сот, командный файл — .bat, системный файл — .sys, текстовый файл в формате ОС MS-DOS — .txt, а ОС Windows — .doc и т. д. Текстовые файлы программ, написанных на определенном языке программирования, имеют и определенное расширение. Например, для программ на языке ассемблера — .asm, на Бейсике — .bas, на языке Паскаль — .pas, на Си — .с.

В настоящее время в различных системах имеется большое разнообразие форматов файлов. Они могут иметь следующие расширения:

  • • графические файлы (бинарные) — .bmp, .рсх, .tif, .gif, .jpg;
  • • табличные файлы (форматированы по столбцам и строкам, содержат информацию разного типа) — .wks, .xls, а также файлы реляционных баз данных — .dbf;
  • • звуковые файлы — .wav, .mid, .mp3, .mod;
  • • видеофайлы — .avi, .mov, .mpg;
  • • мультимедиа-файлы (содержат информацию разного вида: аудио, видео и др.) — .mpeg и др.

Для обмена информацией между системами существуют коммуникативные (обменные) форматы:

  • • МЕКОФ, карточный и др. — для обмена библиографической информацией;
  • • MARC — для обмена библиотечно-справочной информацией;
  • • HTML, SGML, RTF, ODA и др. — для обмена полнотекстовой документальной информацией.

При использовании этих форматов следует учитывать необходимость правильного распознавания и «привязывания» данных, переносимых из одной системы в другую, а также обнаружения ошибок считывания и пропуска данных.

С этой целью применяют специальные методы записи данных: постоянной и переменной длины. При использовании метода записи постоянной длины строго соблюдают на носителе постоянство предусмотренной длины записи, используют разделители, метки, идентификаторы, могут в первом байте каждой записи указывать ее длину и т. д. Для записей переменной длины ограничителем является распознаваемая устройством физическая метка.

Унифицированные документы, используемые в АСУ, представляют собой набор форм организационно-распорядительной информации в соответствии со стандартом и форм для внутрисистемного пользования.

Лексическая база включает классификаторы, кодификаторы, словари, тезаурусы и другие лексико-лингвистические таблицы. Они используются для ввода, обработки и вывода информации в АИС.

Классификатор — систематизированный свод (документ, словарь), отображающий закон разбиения множества объектов на классы, группы и т. д. Классификатор — это также свод кодовых обозначений классификации, наименований этих объектов и фасетов классификационных признаков объектов.

Кодификатор — словарь, в котором присвоены коды (символы) обозначаемым понятиям, объектам, сущностям и т. д.

Тезаурус — толковый словарь дескрипторов (слов или словосочетаний), значение которых объясняется через связи с другими лексическими единицами (дескрипторами).

Во-первых, следует понять, для чего создаются классификаторы, а во-вторых, рассмотреть их структуру и содержание. Очевидно, что огромный объем информации создается в сфере хозяйствования, т. е. производства. Поэтому очень важно представлять себе, что такое экономическая информация и как рационально ее организовать для использования в различных целях.

Экономическая информация — частный случай информации, относящейся к экономике. Это совокупность сведений, отражающих условия, состояния и результаты общественного производства.

Для управления экономикой используются планирование, учет, контроль, регулирование, диспетчеризация и т. д. При этом техническая, технологическая, социальная и любая другая информация становится экономической, так как применяется в экономике. Совокупность таких данных, используемых с указанной целью, образует систему экономической информации.

Экономическая информация обычно носит дискретный характер и представляется буквами, цифрами, символами. Может выражаться графиками, диаграммами и другими способами. Например, применительно к среднему предприятию можно рассматривать постоянную и непостоянную (не всегда участвующую в процессах или производную) информацию.

Состав постоянной экономической информации включает следующую информацию: нормативную, расценочную, справочную, структурную, табличную, маршрутную.

К нормативной информации относятся: конструкторско-технологические нормативы на оборудование и производственные помещения, сырье, материалы, трудовые и стоимостные нормативы, нормативы складских запасов материалов и многие другие. Нормативы регламентируют состав и количественные характеристики продукции, материалов и т. д., определяют порядок выполнения работ, указывают состав технических средств и состав исполнителей. Нормативно-справочная информация заимствуется в справочниках и нормативных документах.

Расценочная информация — данные о стоимости единицы продукции, материальных ресурсов, выполняемых работ. Расценочная информация утверждается соответствующими организациями.

Справочная информация — информация об относительно постоянных свойствах объектов (табельный номер сотрудника, номер цеха и др.).

Структурная информация характеризует структурный состав объекта, т. е. последовательность вхождения каждого составляющего элемента в некоторое соединение (например, в автомобиле 40 000 деталей, а данный завод изготавливает 20—25 деталей).

Табличная информация — совокупность данных, полученных в результате вычисления по соответствующим формулам и занесения в таблицу значений переменных и выходных данных — результатов вычислений (например, таблица налогов по заработной плате и т. п.).

Маршрутная информация — отражает технологическую последовательность выполнения процесса (обработки деталей, очередности сборки и т. д.).

Вся эта информация должна быть рационально организована, структурирована, т. е. классифицирована.

Классификация — система распределения всего множества предметов или понятий по общим признакам или различиям на отдельные группы или подмножества.

В СССР действовала система классификации экономической информации, включающая десятки миллионов наименований изделий и конструкторской документации, 1,5 млн предприятий и организаций, 10 млн материальных и трудовых нормативов, 1 млн стандартов и технических условий, 70 000 показателей финансов, бухгалтерской, статистической и производственной технико-экономической информации.

К настоящему времени в нашей стране разработаны общероссийские классификаторы (ОК). Издано Постановление Правительства РФ от 10 ноября 2003 г. «Об общероссийских классификаторах технико-экономической и социальной информации в социально-экономической области». Ниже приводится перечень некоторых из них:

  • 1. ОК информации об общероссийских классификаторах (ОКОК).
  • 2. ОК стандартов (ОКС).
  • 3. О К объектов административно-территориального деления (ОКАТО).
  • 4. ОК предприятий и организаций (ОКОП).
  • 5. ОК органов государственной власти и управления (ОКОГУ).
  • 6. ОК экономических регионов (ОКЭР).
  • 7. ОК видов экономической деятельности (ОКВЭД).
  • 8. ОК занятий (ОКЗ).
  • 9. ОК управленческой документации (ОКУД).
  • 10. О К продукции (О КП).
  • 11. ОК информации о населении (ОКИН).
  • 12. ОК информации по социальной защите населения (ОКИСЗН).
  • 13. ОК услуг населению (ОКУН).
  • 14. О К профессий рабочих, должностей служащих и тарифных разрядов (ОКПДТР).
  • 15. ОК валют (ОКВ).
  • 16. ОК основных фондов (ОКОФ).
  • 17. О К изделий и конструкторских документов (ЕСКД).
  • 18. ОК единиц измерения (ОКЕИ).
  • 19. ОК специальностей по образованию (ОКСО).
  • 20. О К начального профессионального образования (ОКНПО).
  • 21. ОК специальностей высшей научной квалификации (ОКСВНК).
  • 22. ОК полезных ископаемых и подземных вод (ОКПИиПВ).
  • 23. ОК гидроэнергетических ресурсов (ОКГР).
  • 24. ОК стран мира (ОКСМ).
  • 25. ОК форм собственности и др.

При классификации множества выбирается определенная система кодирования, т. е. каждой позиции классификатора присваивается кодовое обозначение.

Кодирование — это перевод записи из одной формы в другую с помощью символов, процесс, при котором информация, выраженная в одной системе знаков, представляется в другой системе. Кодирование осуществляется для экономии памяти, времени для заполнения форм, ввода и обработки документов, минимизации ошибок. Например, фамилию можно кодировать символом 1 и т. д.

Система кодирования — совокупность правил, определяющих систему знаков и порядок их использования в работе с информацией.

Кодирование должно обеспечить:

  • • компактное и удобное представление информации;
  • • удобство обработки информации;
  • • сопряжение различных технических устройств и людей, работающих с кодированной информацией.

Системы кодирования разных уровней должны быть увязаны. Эта проблема может решаться с помощью машинного перекодирования, машинной подготовки данных для управления кодированием.

Системное кодирование может быть:

  • 1. Последовательное — реализуется иерархическая система классификаций.
  • 2. Параллельное — соответствует фасетной классификации. Отсутствует взаимная зависимость между группами, ее легко изменять.
  • 3. Серийно-порядковое — при наличии двух классификационных признаков объекты делят на группы. В каждой группе — порядковая система кодов, в каждой группе — серия.

Принципы кодирования:

  • • выбирать значимость кода минимальной;
  • • обеспечивать максимальную логичность кода;
  • • учитывать особенности применяемых технических средств;
  • • учитывать особенности автоматизируемого производства;
  • • использовать существующие коды номенклатур и общих обозначений;
  • • учитывать перспективы развития производства.

Коды могут быть разного вида и сочетания (рис. 9.7).

Система обозначений для классификации экономической информации

Рис. 9.8. Система обозначений для классификации экономической информации

Несмотря на свои преимущества, общероссийские классификаторы громоздки, шифры избыточны. Поэтому в ряде случаев целесообразно разрабатывать собственные (локальные) классификаторы и соответствующие им шифры.

Шифр — условное обозначение определенного информационного понятия. Шифр может состоять из комбинации букв, чисел или букв и чисел. Шифры должны:

  • • обеспечить возможность точной идентификации объекта;
  • • иметь по возможности меньшее число разрядов;
  • • шифр одного и того же объекта должен быть одинаков во всех решаемых задачах;
  • • построение шифра должно быть оптимальным.

Например, коды органа старшего уровня образуют из действующих кодов. На уровне министерства коды образуют из них же с приставкой кодов министерства. На уровне предприятия коды образуют из них же с приставкой кодов предприятия. Это упрощает процесс перекодирования.

Например, Общероссийский классификатор специальностей по образованию ОКСО (дата введения — 7 января 1994 г.) являлся составной частью ЕСКК РФ. Он предназначался для использования в процессе автоматизированной обработки и обмена информацией на всех уровнях управления хозяйством страны. Объекты классификации ОКСО — группы специальностей, области знаний, специальности среднего профессионального и высшего образования, направления подготовки в высшем образовании, специализации. Классификатор состоит из двух разделов: «Среднее профессиональное образование» и «Высшее образование». Описание объекта классификации включает три блока: идентификации, наименования и фасетов классификационных признаков.

Блок идентификации строится по иерархическому методу классификации и использует серийно-порядковый, последовательный и параллельный методы кодирования. Длина кода — 7 десятичных знаков и контрольное число (КЧ). Формула для составления кода имеет вид ХХ+ХХ+ХХ+Х+КЧ, где, например, для специальностей среднего профессионального и высшего образования первый и второй знаки — группа специальностей, третий и четвертый знаки — специальность, пятый и шестой знаки — специализация, седьмой знак — уровень подготовки. Для седьмого знака принято следующее: 1 — специальности среднего профессионального образования, 2 — направления высшего образования, 3 — специальности высшего образования. Блок наименования содержит наименование группы специальностей, области знаний (наук), специальности, направления подготовки или специализации.

Блок фасетов классификационных признаков указывает на группу образовательных программ по МСКО (Международной стандартной классификации образования ЮНЕСКО), включает 5 признаков и строится по формуле Х+ХХ+ХХ. В формуле первый знак — ступень образования, второй и третий знаки — изучаемая область в рамках ступени, четвертый и пятый знаки — группа образовательных программ в пределах изучаемой области.

Ниже приведен фрагмент ОКСО, классифицирующий специальности среднего профессионального образования (табл. 9.1).

Тезаурус включает, как правило, лексико-семантические алфавитные указатели и систематические указатели. Лексико-семантические алфавитные указатели содержат дескрипторы с сопровождающими дескрипторными статьями и недескрипторы (с отсылкой «см.» к соответствующему дескриптору).

Таблица 9.1. Фрагмент Общероссийского классификатора специальностей по образованию ОК 009—93

Код

кч

Наименование

Код по МСКО

0100 00 1

9

Естественно-научные специальности

0101 00 1

2

Гидрология

54299

6

Метеорология

54299

0200 00 1

0

Гуманитарно-социальные специальности

0201 00 1

4

Правоведение

53800

0202 00 1

8

Право и организация социального обеспечения

58912

0203 00 1

1

Правоохранительная деятельность

58912

0204 00 1

5

Криминалистическая экспертиза

58912

0205 00 1

9

Социальная работа

58932

0206 00 1

2

Издательское дело

58409

Дескрипторная статья — упорядоченный класс дескрипторов и недескрипторов (синонимов дескрипторов), связанных внеконтекстными отношениями с заглавным дескриптором.

Пример дескрипторной статьи из тезауруса КАДИПС (картографической автоматизированной документальной И ПС) представлен ниже.

499 ДОБЫВАЮЩАЯ ПРОМЫШЛЕННОСТЬ с горная промышленность

горнодобывающая промышленность в ПРОМЫШЛЕННОСТЬ (496) н ДОБЫЧА МЕТАЛЛИЧЕСКОГО СЫРЬЯ (500)

ДОБЫЧА НЕМЕТАЛЛИЧЕСКОГО СЫРЬЯ (503) ТОПЛИВОДОБЫВАЮЩАЯ ПРОМЫШЛЕННОСТЬ (507) а ПОЛЕЗНЫЕ ИСКОПАЕМЫЕ (72)

В дескрипторной статье введены следующие обозначения: 499, (503) и др. — коды (цифры в скобках или без скобок); с — синоним;

в — выше (вышестоящее, подчиняющее понятие); н — ниже (нижестоящее, подчиненное понятие); а — ассоциация (обозначение ассоциативной связи). Систематические указатели содержат дескрипторы, сгруппированные по тем или иным классификационным признакам (например, по содержанию, календарным периодам и т. д.).

Языковые средства — информационные языки (языки описания данных — Я ОД, словари данных, языки манипулирования данными — Я МД).

ЯОД — язык высокого уровня, предназначен для формализованного описания типов данных, их структур и взаимосвязей. С его помощью администратор БД и программисты описывают структуру и содержимое БД.

Словарь данных — файл или таблица БД, содержащие описания данных и типы их обработки.

Я МД предназначен для поиска и отображения данных и включает в себя язык запросов (ЯЗ) и информационно-поисковый язык (ИПЯ). ЯМД является средством, которое применяется пользователем или прикладным программистом для выполнения операций над данными.

Компоненты запросов хорошо развиты в языках SQL, FoxPro и др. В настоящее время стандартом стал язык SQL (Structured Query Language), в котором предусмотрены компоненты для описания БД.

ИПЯ содержат лексику (словарь) и грамматику. Единицы текста словаря используют для индексирования, а по правилам грамматики составляют ПОД — поисковые образы документов (фактов).

Различают индексирование предкоординируемое и постко- ординируемое. Первое предполагает наличие классов, к которым следует относить закодированный соответствующим индексом документ. Второе позволяет приписать документу несколько дескрипторов. Например, к ИПЯ первого вида можно отнести классификационную систему УДК. В основе ИПЯ второго вида лежат тезаурусы, они являются ИПЯ дескрипторного типа.

Контрольные вопросы

  • 1. Каково определение и принципы создания информационного обеспечения?
  • 2. Каковы этапы создания ИО?
  • 3. Каков состав информационного обеспечения АИС?
  • 4. Что такое структуризация информации и как она структурируется в базах данных?
  • 5. Что такое форматная база?
  • 6. Что такое лексическая база?
  • 7. Что такое Единая система классификации и кодирования информации? Приведите примеры общероссийских классификаторов.
  • 8. Для чего предназначены ЯОД и ЯМД?
 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >
 

Популярные страницы