МОДЕЛЬ АВТОМАТИЧЕСКОГО ОБНАРУЖЕНИЯ И ИСПРАВЛЕНИЯ ОШИБОК В ДОКУМЕНТАХ ТАБЛИЧНОГО ВИДА

Моделирование процесса автоматического обнаружения ошибок и восстановления достоверности значений показателей в табличных документах вызывает необходимость анализа структуры и свойств указанных документов [60, 79, 120]. Модель табличного документа можно представить в виде матрицы. В теории помехоустойчивого кодирования решены вопросы автоматической коррекции ошибок в кодовых ансамблях информации, передаваемой по каналам связи [11, 193]. Рассмотрение метода автоматического обнаружения ошибок и восстановления достоверности значений показателей табличных документов проведем с учетом концепции теории помехоустойчивого кодирования.

Передаваемая в двоичном виде информация имеет вероятность искажения отдельных двоичных символов, что приводит к снижению достоверности сообщений. Одним из способов защиты сигналов от искажений является ввод в передаваемую кодовую комбинацию информационной избыточности. Обычно корректирующие коды состоят из информационных и контрольных разрядов. Последние по существу в информационном отношении избыточны и выполняют функции корректировки ошибок в соответствующем разряде двоичного слова. Имеются двоичные модификации корректирующих кодов — код Хэмминга, Боуза—Чоудхури—Хоквингема (БЧХ), векторный, треугольный и др. [11, 193]. При кодировании информации, например, кодами Хэмминга разряды информационной части кода делятся на группы. Значение каждого контрольного разряда вычисляется путем суммирования по модулю разрядов соответствующей группы. При декодировании информации по модулю суммируются информационный и контрольный разряды кода соответствующей группы.

По результатам суммирования формируется синдром — корректирующее двоичное число, у которого каждый разряд есть результат суммирования. Синдром в общем случае выступает как опознаватель ошибки. Если синдром состоит из нулей, то это означает отсутствие ошибки в передаваемом коде, а ненулевое значение синдрома указывает адрес ошибки, то есть номер разряда кода, в котором произошло искажение символа. Если в информационном разряде находится символ ноль, то при коррекции он заменяется на достоверный, то есть единица, и наоборот. Эта схема работы кода Хэмминга не исчерпывает состав средств помехоустойчивого кодирования, но она достаточна для применения в нашей задаче в значении исходного положения. Рассмотрим структуру и свойства условного табличного документа в виде матрицы (рис. 3.2).

Матрица документа табличного вида

Рис. 3.2. Матрица документа табличного вида

Модель табличного документа можно отобразить четверкой

где — матрица документа (/ = д-, i — 1, m,j = 1, л; q— реквизиты-снования (числа), отражающие количественное состояние объектов; А — кортеж реквизитов-признаков (наименование строк таблицы), отражающий качественные стороны состояния объектов; В — кортеж реквизитов-признаков (наименования столбцов таблицы), отражающий качественные стороны состояния объектов; D — кортеж реквизитов-признаков, отражающий качественные стороны состояния объектов общего уровня и относящиеся как к А, так и к В <7;. n+l, qm+ij — реквизиты-основания типа «итого», «всего» или контрольные суммы соответственно по строкам и столбцам, отражающие количественное состояние объектов.

Рассматриваемая модель табличного документа в определенном допущении может быть представлена в синтаксическом отношении как кодовый ансамбль. В этом ансамбле информационные группы отображаются совокупностью значений показателей по документо- строкам и (или) документо-графам, а также контрольными суммами и (или) значениями показателей типа «всего» и «итого». В данном случае контрольные суммы обладают своеобразными свойствами синдромов, то есть опознавателей ошибок. Вместе с тем, семантические свойства документа, в частности, арифметическая связь контрольных сумм с соответствующими значениями показателей, представленными не в двоичной, а в десятичной системе, устраняют необходимость модульного или другого способа формирования синдромов. Указанные связи между значениями элементов матрицы документа обеспечивают потенциальную возможность автоматического обнаружения ошибок и их исправление без непосредственного участия оператора ЭВМ. С учетом выявленных выше свойств аналогии построим модель алгоритма автоматического восстановления достоверности показателей документов табличного вида.

Исходя из анализа свойств реквизитов-оснований, наблюдается взаимосвязь элементов типа арифметического баланса

При условии внесения ошибки в какой-либо элемент qr на этапах обработки нарушаются условия соотношений типа (3.S.), (3.56). С целью автоматического обнаружения ошибок и их исправления при вводе в ЭВМ указанные соотношения проверяются программно. Сначала проверяется равенство

Если равенство не соблюдается, то на принтер или дисплей в рамках протокола ввода документов в ЭВМ выдается сообщение об отсутствии равенства указанного типа и идентификатор документа. Если же равенство (3.57) соблюдается, то проверяется далее условие

если в /-й строке равенство не выполняется

то производится замена ошибочной строки / на строку с элементами

после чего оператору выдается сообщение на принтер об ошибке и ее исправлении с указанием индекса документа, а также значение замененного ошибочного реквизита-основания и заменяющего достоверного реквизита-основания.

Если же нарушение условия (3.58) происходит более чем в одной строке, то для столбцов матрицы проверяется условие

Если же нарушение условия имеет место в одном столбце то заменяется столбец j на столбец с элементами

и выдается сообщение на принтер об ошибке и ее исправлении.

Если же нарушение происходит более чем в одном столбце, то на дисплей или принтер выдается сообщение об ошибках с обозначением модификации ошибок и их адресов. Заметим, что при условии какой-либо ошибки, например, транспозиции (перестановки) qij, qi J+l нарушается условие (3.55). Это и идентифицируется как ошибка относительно qm+ j и qm+l j+l. Обнаружение выполняется не только в случаях транспозиции, но и других различных искажений лексического, синтаксического, логического и арифметического свойства по набору qtj каждой отдельной строки и (или) столбца матрицы документа. Таким образом, алгоритм позволяет программное исправление однократных и обнаружение многократных ошибок относительно строки и (или) столбца матрицы контролируемого документа.

При практическом применении данного метода следует учитывать два случая. В первом случае в формате первичного документа отсутствуют реквизиты типа «всего», «итого» как по строкам, так и по столбцам. Во втором случае указанные реквизиты взаимосвязаны с неполным набором реквизитов-оснований строки и (или) столбца. В первом случае на этапе подготовки документа целесообразно подсчитать контрольные суммы, а во втором случае можно применить данный метод по субматрице документа в пределах соответствующих контрольных сумм (реквизиты типа «всего»), если реализация дополнительных трудозатрат в конкретной ИС является проблематичной. Следует иметь в виду, что в любом случае применение контрольных сумм является целесообразным.

С учетом рассмотренных выше моделей примем определение — «формализованная модель совершенствования качества ИС — это отображение существенных свойств информационной системы математическими и (или) графическими средствами». В нашем случае к графическим средствам можно отнести рисунки, эскизы, графики, диаграммы, гистограммы, экспликации, чертежи и др. Каждый из указанных видов графического материала применяется в зависимости от характера отображения системы СКИС.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >