Логико-лингвистический анализ инструктивной документации по проектированию станций и узлов
При разработке схем железнодорожных станций проектировщик использует значительный по объему материал нормативного характера (параметры путей и стрелочных переводов, схемы их взаимного расположения, технические условия проектирования, методики расчета устройств и др.). Однако инструктивная документация, регламентирующая порядок проектирования железнодорожных станций (инструкции, нормы, правила, руководства, указания), оперирует предметными знаниями, которые выражаются естественным языком, понятным пользователю, но сложным для восприятия компьютерной программой. САПР ЖС — это, прежде всего, инструмент помощи для проектировщика, поэтому включение в базу данных автоматизированной системы всех нормативных сведений позволяет резко сократить потери времени на поиск необходимой информации.
Однако на практике оказывается, что инструктивные документы по проектированию объектов железнодорожного транспорта активно используют нечеткие по содержанию выражения («как правило», «технически оснащенные», «разрешается», «большой поток», «постепенно» и т.п.). Например, указание в документе: «Как правило, на участковых станциях число сортировочных путей должно быть не менее одного пути для вагонов, поступающих в адрес станции. Если число местных вагонов превышает 30, то рекомендуется выделять два пути...» содержит три нечетких словоформы (в тексте выделены курсивом), которые не могут храниться в компьютерной базе знаний в обычном их представлении. Они должны пройти определенную обработку, состоящую в сужении смыслового содержания и уточнении предмета, события или действия, на которые указывают. Таким образом, все нормативные сведения необходимо формализовать, используя процедуры выделения четкой смысловой информации.
Однако исключение второстепенных знаний из базы не должно приводить к искажению смысла нормативных сведений. Справочная информация является основой получения эффективного проектного решения, и любое преломление содержания отдельных положений может привести к грубым ошибкам проектирования.
Лингвистический анализ нормативных положений проектирования позволяет раскрыть смысл используемых словосочетаний. В зависимости от подхода к формальному представлению выделяются следующие типизированные классы.
Шкалометрические параметры. В теории языка разработана методика измерения значения слов по шкалированным антонимическим осям типа «хорошо — плохо». Данная методика заключается в том, что определяется пространство понятий, имеющих узкосмысловую ориентацию на граничные условия. Чем ближе по содержанию понятие к границе пространства, тем ближе соответствующий количественный аналог к некоторому пределу.
Отбор параметров, принадлежащих к классу шкалометрических, производится по принципу тематической классификации. Слова, обозначающие предметы, события, факты, находящиеся между собой в отношениях сходства, принадлежат одной группе. Темати- че-ская группа слов имеет заглавное слово (гипероним), обобщающее охватываемые им слова и представляющее их в качестве видовых понятий или частей целого. Элементы тематической группы располагаются по степени интенсивности признака. В этот класс включаются эмпирические характеристики, измеряющиеся посредством некоторой условной шкалы. В соответствии с этой шкалой все слова, отождествляющие некоторые близкие по смыслу состояния системы, процесса или события, группируются в одну категорию (гиперонимы «Величина», «Продолжительность», «Скорость» и др.).
На рис. 38.1 представлен переход различных оттенков понятий категории «Продолжительность» и «Величина». Признаки различных категорий эмпирических характеристик охватывают диапазон
Рис. 38.1. Шкала измерения количественной информации гиперонимов «Продолжительность» и «Величина»
от 0 до 2. В общем множестве элементов данной категории выделяется качественный параметр средней интенсивности признака. Например, для категории «величина» таким элементом является «достаточный», а в категории «продолжительность» — параметр «средней длительности». По предлагаемой шкале оценки признаков эти параметры получают значение ?, = 1.
Для количественной интерпретации любого смыслового оттенка /-го элемента некоторой /-й категории используется выражение:
где Pqi — базовое значение количественной оценки /-й категории качественного параметра при = 1. Например, PQj для выражения «поток грузовых поездов достаточного объема, перерабатываемого на сортировочной станции» экспертно принимается равным: Р^ =30 поезд/сут. По предлагаемой схеме оценка величины потока грузовых поездов как незначительного = 0,2): Ру= 30-0,2 = 6 поезд/сут.
При потоке пассажирских поездов достаточного объема, поступающих на станцию, в соответствии с некоторой экспертной оценкой Pqi — 5 поезд/сут, соответствующее значение незначительного потока:
Аналогично выполняется выделение других категорий качественных характеристик данного класса, присутствующих в нормативных положениях. Характеристика гиперонимов качественных понятий дана в табл. 38.1.
Характеристика гиперонимов качественных понятий
Таблица 38.1
Гипероним |
Элементы категории |
Оценка значения |
категории |
по шкале |
|
1 |
2 |
3 |
Легкие (благоприятные) |
0,5 |
|
Условия А |
Средние (нормальные) |
1,0 |
(среда функциони- |
Трудные Сложные |
1,2 Г4 |
рования) |
Особо трудные |
1,6 |
Особо сложные |
1,8 |
|
Редко |
0,5 |
|
Средней интенсивности |
1,0 |
|
Периодичность |
Часто |
1,3 |
Интенсивно |
1,4 |
|
Систематически |
1,6 |
|
Отдельные |
0,6 |
|
Существование |
Некоторые |
0,8 |
Все |
1,0 |
|
Менее |
Р( 1 + ^U = 0,2 |
|
Диапазон |
Не менее Не более |
|
Более |
0,8 |
|
Темп |
Медленно |
0,5 |
Быстро |
1,5 |
|
Скорость изменения |
Постепенно |
0,5 |
Резко |
1,5 |
|
Условия Б |
Легкие |
0,5 |
Средней тяжести |
1,0 |
|
(трудность выполнения) |
Тяжелые |
1,2 |
Трудоемкие |
1,4 |
1 |
2 |
3 |
Местные |
1,0 |
|
Условия В |
Трудные местные |
1,2 |
Особо трудные местные |
1,4 |
|
Недостаточная |
0,5 |
|
Видимость |
Достаточная |
1,0 |
Ясная |
1,5 |
|
Слабое |
0,6 |
|
Развитие |
Недостаточное |
0,8 |
Достаточное |
1,0 |
|
Сильное |
1,5 |
|
Стоимость |
Дешевые |
0,5 |
Дорогостоящие |
1,5 |
|
Ближайшее время (в первую очередь) |
1,0 |
|
Ближайшая перспектива |
1,2 |
|
Время |
В перспективе (на перспективу) |
1,4 |
В будущем (в дальнейшем) |
1,6 |
|
Далекая перспектива |
1,8 |
|
Минимально |
0,5 |
|
Доля |
Часть |
1,0 |
Максимально |
1,5 |
|
Полностью |
2,0 |
|
Максимально приближено |
0,4 |
|
В непосредственной близости |
0,6 |
|
Расстояние |
Вблизи (рядом) |
0,8 |
На определенном расстоянии |
1,0 |
|
На достаточном расстоянии |
1,2 |
|
На удалении |
1,5 |
|
Признак |
Другие Прочие |
|
«второго плана» |
Остальные |
1,4 |
Протяженность |
Короткие Длинные |
|
Приблизительно (примерно) |
0,5 |
|
Точность |
Около |
0,7 |
Близкое к |
0,9 |
Примечание. В таблицу включаются только те словоформы, которые используются в нормативных документах по проектированию станций. Элементы, не регистрируемые инструкциями, косвенно входят в соответствующее подмножество гиперонима. Так, например, в категории «Темп» оттенок «нормальный» (или «средний») отсутствует, тем не менее, за отсутствующей лексемой закрепляется 't,i — 1. Этот же факт имеет место для категорий «Скорость изменения», «Стоимость» и некоторых других.
Использование предлагаемой градации отдельных элементов в выделяемой категории признаков позволяет отождествить соответствующую языковую конструкцию с численным значением в базе знаний САПР.
Алетические параметры. В документах по проектированию имеется достаточно обширное множество неоднозначно определяемых элементов, характеризующих возможность или необходимость выполнения нормативных требований с различной степенью категоричности.
Языковые конструкции можно сгруппировать в категорию але- тических высказываний. Алетические лексемы «разрешается», «может быть», «допускается», «рекомендуется», «следует», «необходимо» и другие используются как самостоятельные языковые единицы, несущие определенную смысловую нагрузку, так и в сочетании с лингвистическими конструкциями, ограничивающими свойства результирующего образования, (например, «допускается, как правило», «разрешается в исключительных случаях», «следует по возможности»). Причем часто наблюдается связь различных алетичес- ких лексем в одном сочетании: «следует предусматривать», «должна допускать», «необходимо устанавливать», «можно предусматривать» и др.
Кроме рассмотренных утвердительных алетических лексем, используются высказывания отрицающего типа, например: «не следует», «нецелесообразно», «допускается не предусматривать», «не должно» и др. Отрицающие алетические лексемы также применяются с ограничивающими конструкциями: «не предусматривается, как правило», «как правило, не следует допускать» и т.п.
Для систематизации алетических выражений модальные конструкции анализируются на предмет синонимичности и лексической сочетаемости. Лингвистический анализ таких форм проводится посредством таблиц, синтезирующих совместное применение алетических высказываний и ограничивающих правил. Заполняются две принципиальные таблицы: для утверждающих (табл. 38.2) и отрицающих (табл. 38.3) лексем. Языковые конструкции располагаются в порядке усиления требования (от «разрешается» до «обязательно»). Ограничивающие факторы имеют аналогичный вектор действия (от «во всех случаях» до «только»).
Утвердительные алетические лексемы
Таблица 38.2
Ограничивающие лексемы |
1 |
Разрешается |
Рекомендуется |
Предусматривается |
Обеспечивается |
Устанавливается |
Целесообразно |
Следует |
Обязательно |
— |
|||||||||
Во всех случаях |
|||||||||
Как правило |
|||||||||
По возможности |
|||||||||
В обоснованных случаях |
|||||||||
По согласованию |
|||||||||
В отдельных случаях |
|||||||||
В виде исключения |
|||||||||
В отдельных исключительных случаях |
|||||||||
За исключением |
|||||||||
Только |
Отрицающие алетические лексемы
Таблица 38.3
Ограничивающие лексемы |
1 |
Могу не |
Допускается не предусматривать |
Не рекомендуется |
Не целесообразно |
Не предусматривается |
Не следует |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
— |
|||||||
Во всех случаях |
|||||||
Как правило |
|||||||
По возможности |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
В обоснованных случаях |
|||||||
По согласованию |
|||||||
В отдельных случаях |
|||||||
В виде исключения |
|||||||
В отдельных исключительных случаях |
|||||||
За исключением |
|||||||
Только |
Примечание. В табл. 38.2 и 38.3 использованы следующие условные обозначения:
— лексически не сочетаемые конструкции;
— разрешенные сочетания, используемые в нормативных документах;
— разрешенные сочетания языковых конструкций, не используемые в нормативных документах проектирования.
Фокусные параметры. Этот класс языковых конструкций относится к трудно формализуемым сочетаниям. Даже входящие в одну категорию, они достаточно различны по смысловому содержанию. Их объединяет только условная семантическая направленность (фокус признаков). Выделяется 8 категорий фокусных параметров, представленных в табл. 38.4.
Отличительной особенностью фокусных параметров от шкалометрических является их недискретный характер. В нормативных документах используются словоформы «поточность», «плавность», «комплексное развитие» и другие, без каких-либо градаций, что не позволяет сформировать сравнительный ряд близких по смыслу признаков, обладающих различной степенью насыщенности, сложности, темпа, точности и т.п. Фокусные параметры тяготеют к некоторому «центру» смысловой значимости, интуитивно фиксируют определенный аспект значения данного слова, однако эта фиксация оказывается менее определенной, чем для шкалометрических параметров. Объективно говоря, фокус не удается детализировать на уровне определенного количественного параметра.
Элементы данной категории размыты, насыщены качественными свойствами. Поэтому к данному классу лингвистических объектов применимы экспертные методы оценки качественной информации. Степень их вхождения в базу данных САПР ЖС определяется проектировщиком.
Таблица 38.4
Характеристика фокусных параметров
Фокус |
Перечень параметров И ПСУ |
Превосходная степень достигаемого уровня |
Наиболее полно Наилучшая Наибольший Массовая Особо сильно Резко выраженные Наиболее рационально Комплексное развитие Полное взаимодействие Коренное переустройство |
Гравитационные |
Концентрация Компактность Кооперирование Сгущенное прибытие Сосредоточение по возможности |
Благоприятные |
Поточность Плавность Удобство Надежность Безопасность Защита Рациональность Оснащенность |
Неблагоприятные |
Ограниченная Неточная Стесненная Малодеятельные Затруднительно |
Связь с другими параметрами |
Аналогично Такое же В сочетании Соответствующим Переходный этап |
Нормированные |
Эксплуатационные условия Нормы проектирования Допустимая загрузка Достаточная длина Определяемые расчетом Принятая система обслуживания Установленной длины |
Динамичные |
Возможные изменения на перспективу Несколько отличается Удлинение участков обращения Перспективная норма |
Сетецентрические параметры. Этот класс нечетких языковых понятий может быть формализован только построением семантических сетей и разработкой соответствующих правил, определяющих содержание таких лингвистических конструкций. К классу сетецентрических параметров относятся: «и т.д.», «и т.п.», «а также», «не препятствует», «кроме того», «путем» (синоним «посредством»), «независимо» и др.
Конструкции «и т.д.», «и т.п.» используются после перечисления множества некоторых близких параметров, например:
- — районы, причалы и т.д.;
- — развитие существующих станций, проектирование развязок, обходов и т.п.;
- — приемо-отправочные пути, экипировочные устройства, пункты технического осмотра и т.п.
Обобщенные семантические сети некоторых фрагментов нормативных положений, использующих лексемы «и т.д.», «и т.п.», приведены на рис. 38.2. Анализ этих сетей показывает, что языковые конструкции «и т.д.», «и т.п.» основываются на иерархии отдельных признаков. Вершина (1) определяет основную тему («удобство для населения», «развитие узла», «устройства»), фиксируемую нормативным положением. Вершина (2) указывает подтему, которая непосредственно формирует множество охватываемых элементов — вершины (21), (22), (23)...
Семантическая подсеть (2) — {(21)+(22)+(23)+...} по формальным признакам реализует тематический подход к классификации близких по значению элементов. В данном случае гиперонимом выступает подтема («устранение негативных эффектов», «развитие элементов», «устройства для обслуживания грузовых транзитных поездов»). Однако определенную шкалу применить нельзя из-за не замкнутости множества. В первом приближении можно принять, что приведенный перечень {(21)+(22)+(23)} оказывается достаточно полным для эффективного функционирования базы знаний САПР. По мере необходимости данное множество следует расширять, тем самым, сокращая нечеткое подмножество признаков, охватываемое лексемами «и т.д.», «и т.п.».
Лексема «а также» близка по содержанию к конструкциям «и т.д.», «и т.п.». Этот вывод подтверждают обобщенные семантические сети, представленные в табл. 38.5.

Рис. 38.2. Семантические сети фрагментов нормативных положений: а — проектирование района; б — развитие железнодорожного узла; в — обустройства станций
Отличительной особенностью использования конструкции «а также» является наличие финального элемента варианта подтем («вокзал», «сортировочная станция»). Данный сетецентрический параметр может быть заменен на элемент «и». При использовании сочетания «а также» подчеркивается некоторая внутренняя интонация, выделяющая указываемый элемент. При замене союзом «и» семантически содержание высказывания не изменяется, поэтому считаем, что «а также», «и» близки по содержательному значению с точностью до отсутствия различий с точки зрения формального представления языковых конструкций в базе знаний САПР.
Таблица 38.5
Характеристика сетецентрической лексемы «а также»
Фрагмент положения |
Обобщенная семантическая сеть |
1. «Расположение здания вокзала между путями (островного типа), в торце путей (тупикового типа), а также комбинированного типа допускается в отдельных обоснованных случаях...» |
![]() |
2. «При переустройстве сортировочных станций с расположением главных путей внутри станции должны быть рассмотрены варианты выноса этих путей (с односторонним или объемлющим расположением), а также с сохранением их на месте...» |
![]() |
Таким образом, все языковые параметры нечеткого характера, используемые в нормативных документах проектирования железнодорожных станций, разделены по четырем классам. В табл. 38.6 дается общая характеристика лингвистических выражений нечеткого характера, используемых в нормативных положениях проектирования станций и узлов.
Сложность формализации признаков увеличивается от шкалометрических к сетецентрическим. Нечеткое содержание языкового элемента, частота его повторяемости в средствах информации, близость к другим, синонимично определяемым понятиям, характеризуют семантическое поле лингвистического параметра, «размах» его оттеночных характеристик.
Таблица 38.6
Общая характеристика лингвистических выражений нечеткого характера, используемых в нормативных документах по проектированию станций и узлов
Класс параметров |
Особенности классификации |
Примечания |
Шкалометрические |
Тематический подход с выделением гиперонима |
Наиболее простая схема формализации с прямым переходом к количественному признаку |
Алетические |
Модальные конструкции |
Формализация посредством разработки в качестве промежуточного звена интерпретатора языковых конструкций (таблицы сочетаемости) |
Фокусные |
Объединение по фокусу признаков |
Выделение центра смысловой значимости результата |
Сете центрические |
Разработка многоуровневой иерархической структуры семантических сетей |
Методически менее определенная процедура представления признака в базе знаний |