ОСНОВНЫЕ ПОНЯТИЯ
ПОНЯТИЕ ДАННЫХ
Информационные системы предназначены для хранения, выборки и модификации постоянно существующей информации.
Восприятие реального мира можно соотнести с последовательностью разных (часто взаимосвязанных) явлений. Эти явления всегда стремились описать (даже если не всегда понятна причина явления).
Такие описания внешних явлений образуют данные — они хранятся и обрабатываются.
Описание внешних явлений (данных) включает два элемента:
- • разрозненные факты, хранящиеся в ЭВМ (значения);
- • смысл данных (интерпретация данных, их семантика).
Часто используется как синоним термина данные термин информация.
Описание данных требует использование некоторого языка. Описание данных на естественном языке позволяет значения данных (факты) и их семантику фиксировать вместе, так как естественный язык достаточно гибок для этих целей. Например, можно сказать: «Его рост 185 см». Здесь 185 — значение данных, фраза «Его рост ... см» — семантика данных. В данной фразе значение связано с семантикой, и становится понятен и смысл данных, и что с ними можно делать.
Нередко данные и их семантика разделены, и такое разделение можно встретить и в нашей обычной жизни. Например, расписание движения пассажирских поездов может быть представлено в виде таблицы, заголовок которой определяет семантику данных, а расположенные далее строки — значения данных (табл. 1.1).
Та б л и ц а 1.1
Расписание движения пассажирских поездов
Номер поезда |
Станция назначе ния |
Категория поезда |
Дни отправле ния |
Время отправле ния |
Время в пути |
Время прибы тия |
121 |
Вологда |
Пассажир ский |
По четным |
19.40 |
12 |
07.40 |
... |
... |
... |
... |
... |
... |
... |
Если такая таблица большая, строки в ее нижней части уже тяжело читать — забывается смысл колонок, т.е. семантика данных. Если же семантика отсутствует (включена где-то в другом, недоступном в настоящий момент месте), такие данные трудно или вообще невозможно понять.
Применение ЭВМ для хранения и обработки данных приводит к еще большему разделению значений данных и их семантики. Компьютеры чаще всего имеют дело со значениями данных; большая часть их семантики как таковая вообще не фиксируется в ЭВМ. Например, если решается некоторая математическая задача моделирования (дифференциальное уравнение, описывающее некоторый реальный процесс), интерпретация полученных в результате решения значений возлагается на пользователя.
На разных этапах развития информационных систем механизмы интерпретации данных определяются подходами в реализации компонентов хранения и обработки данных.