Метод альтернатив как способ измерения предпочтений эксперта в интервальной шкале

Л. Заде, основатель теории нечетких множеств, в работе [ 114J писал: «Обычные количественные методы анализа не эффективны при анализе гуманистических систем, то есть систем, в которых существенная роль принадлежит суждениям и знаниям человека. Как правило, такие системы являются слабо структурируемыми и гораздо более сложны, чем механистические системы, поведение которых допускает численное описание».

В результате проведенного анализа установлено, что существующие методы квалиметрии по сбору экспертных данных имеют как системные, так и специфические недостатки, связанные с природой экспертных суждений и особенностями количественных оценок как таковых. Очевидна необходимость в ином подходе к сбору и формализации эвристических суждений экспертов, основанном на понятиях и принципах принятия решений в отношении риска, среди которых ключевым является теория ожидаемой полезности фон Неймана — Моргенштсрна [58].

Нами предложен и экспериментально проверен способ альтернативного оценивания функции полезности. Такой способ мы будем называть методом альтернатив [25-А].

Среди особенностей оценки функции полезности методом альтернатив можно выделить следующие [26-А, 27-А, 28-А]:

  • ? получение информации от эксперта в вербальном виде;
  • ? альтернативные оценки функции полезности одним и тем же экспертом;
  • ? проверка на совпадение альтернативных оценок функции полезности.

Выбор шкалы. Первый вопрос, который возникает перед экспертом: существует ли способ измерить функцию полезности и если способ существует, то в какой шкале следует производить измерения. По этому поводу имеются самые разнообразные точки зрения [103].

Для представления значений функции полезности экспертной системы управления рисками стандартизации нами предлагается вариант половинного деления интервальной шкалы, близкий к варианту шкалы Т. Саати [107], — обобщенная дихотомическая шкала (табл. 3.7, А). Варианты такой шкалы с вербальной расшифровкой уровней Vi, соответствующих числовым оценкам щ, представлены в табл. 3.7, Б. Интервальная шкала допускает положительные линейные преобразования: g(x) = ах + b (а > 0).

Таблица 3.7

Обобщенная дихотомическая шкала сравнительной оценки уровня полезности

Л

Б

Число

интервалов

Уровни

Вербальная оценка

Числовая

оценка

20= 1

0; 1

i

К

Uj

21

0; 1; 2

0

Одинаковый уровень

0

22

0; 1; 2; 3; 4

1

Почти эквивалентный уро-

1

вень

23

0; 1; 2; 3; ...; 8

3

П редпочтител ы iee

3

5

Строго предпочтительнее

5

7

Значительно предпочти-

7

тельнее

8

Абсолютное превосходство

8

Преимущество такой шкалы состоит в адаптивном выборе количества уровней исходя из сложности решаемой задачи и квалификации экспертов.

Организация процесса оценивания. Определим аксиоматику предпочтений эксперта в интервальной шкале. Пусть существует множество, на котором определена функция полезности U = 11ь х2,..., хп), где Х, х2,..., х„ — факторы, влияющие па полезность. Рассмотрим конечное число точек М подпространства Каждую из точек множества QM обозначим со' = (х[,х2,..., х'„), где г = 1, 2, ..., М, а соответствующее ей значение функции — If = (со'), i = 1, 2, ..., М. Назовем U = (С/1, [/, ..., IIм) вектором полезности для точек Будем считать, что множество точек эксперимента QM упорядочено с помощью алгоритма сортировки, например слиянием:

и1

В процессе оценивания значений вектора полезности U = (U1, U2,..., IIм) эксперт в общем случае не способен точно оценить численные значения уровней U1, U2,..., IIм. Вместе с тем при сравнении двух альтернативных вариантов он обычно способен определить, какой из рассматриваемых признаков выражен сильнее, и вербально оценить различие между рассматриваемыми альтернативами.

Естественно предположить, что оценивать различие можно, сравнивая отношения а '1 = U'/и3 или разности г3' = Ul - U3 уровней. При этом эксперту можно задавать соответствующие вопросы: «Во сколько раз уровень полезности U1 превосходит уровень полезности U3 или «На сколько уровень полезности U1 превосходит уровень полезности U?».

С этих позиций наиболее распространенными являются два метода экспертного оценивания значений уровней полезности tr, U2, ..., UM:

? Метод оценивания отношений а31 - Ul3, известный как метод иерархий Саати, включающий вариант конструирования вербальной шкалы для оценки отношений а31 = Ul /U3 и соответствующие числовые оценки уровней [107].

Примечание. Для данного метода характерны еущеетвеппые для практического использования недостатки, например невозможность проверки на непротиворечивость количественной оценки функции полезности. Некоторые ситуации не поддаются интерпретации, например, если уровень U2 слабо превосходит уровень Ux (U2/U1 = 3), а уровень U3, в свою очередь, слабо превосходит уровень U2 (U2/Ux = 3), то уровень U3 абсолютно превосходит уровень IIх (U3/Ux - 9).

? Метод оценивания разности г31 = U1 - U3, известный как метод непосредственного оценивания U{, U2,..., UM, представляющий собой упорядочение исследуемых объектов в зависимости от их важности путем приписывания баллов каждому из них.

Примечание. Как было отмечено выше, для данного метода, считающегося базовым, также характерны существенные для практического использования недостатки: высокая несогласованность мнений экспертов, низкий уровень достоверности, точности экспертных оценок. Кстати, именно неспособность эксперта точно оценить непосредственно численные значения уровней полезности объектов подвигли Саати на разработку своего метода иерархий.

Известно, что измерение любым методом, в том числе и при помощи непосредственного оценивания, является, по сути, сравнением. Выбрав, например, самый высокий уровень ?/тах, мы можем получить вербальную оценку для остальных уровней U' путем их сравнения с максимальным уровнем ?/тах, задавая эксперту вопрос

«Насколько уровень полезности U1 превосходит уровень полезности t/max?». Мы считаем, что метод оценивания разности — наиболее перспективный с позиций точности, обоснованности и достоверности экспертных оценок и развития экспертных систем.

Для его совершенствования в рамках разработанного нами метода альтернатив предлагается новый способ оценивания функции полезности, основанный на оценке разностей rji = Ul - UK

Пусть Ul - t/; = h ? rjt, где г определяется на основании шкалирования вербальных ответов эксперта; i,j е {1, 2,..., М), М — натуральное число, h — константа шкалы. Для нахождения С/1, U2,..., UM рассмотрим два плана эксперимента.

План А. Оцениваются значения г*1 для {(i,j): i=p,j= 1,2,..., М}, при этом уровни t/; сравниваются с некоторым фиксированным уровнем U13, р е {1, 2, ..., М) (см. рис. 3.11):

где hA константа, которая зависит только от данного альтернативного плана эксперимента.

Вектор полезности, полученный решением системы линейных уравнений (3.5), соответствующей первому альтернативному плану эксперимента, обозначим 0А.

План В. Оцениваются значения г для {(i,j): i = 1, 2, ..., М - 1; j = i + 1}, при этом сравниваются между собой пары идущих друг за другом уровней U Ul+1 (см. рис. 3.11):

где hB константа, которая зависит только от данного альтернативного плана.

Вектор полезности, полученный решением системы линейных уравнений (3.6), соответствующей второму альтернативному плану эксперимента, обозначим Ов.

Экспертное оценивание в рамках метода альтернатив по плану А и плану В

Рис. 3.11. Экспертное оценивание в рамках метода альтернатив по плану А и плану В

Критерий достоверности и точности экспертных оценок. Альтернативные оценки вектора полезности 0А и Ов, полученные па основании решения систем уравнений (3.5) и (3.6), определены с точностью до линейного преобразования, так как константы hA и hB неизвестны. Относительно полученных оценок (UlA, UB), i = 1, 2,..., М полагаем, что U'A = щ + w2 ? U'B + e,, где г = 1,2, ..., M; et, е2,..., гм независимые, одинаково распределенные случайные величины, W, w2 константы. Сформулируем критерий устойчивости предпочтений эксперта К.

Критерий К. Экспертные оценки полезности устойчивы, если альтернативные оценки связаны статистически значимой адекватной возрастающей линейной зависимостью.

Пример. Рассмотрим практическую реализацию метода альтернатив на примере решения задачи шкалирования исходных данных — уровней фактора «Актуальность разработки стандарта», используемого в экспертной системе оценки, анализа и управления рисками стандартизации. По результатам анкетирования группы экспертов было установлено, что фактор имеет пять значимых уровней. Соответствующие им лингвистические значения и оценки приведены в табл. 3.8.

Таблица 3.8

Уровни фактора «Актуальность разработки стандарта»

Номер

уровня

Уровень фактора

Оценка

1

Разработка по решению Совета Министров

Ц]

2

Проект стандарта взаимосвязан с техническим регламентом

и2

3

Актуальность разработки приведена в технико-экономическом обосновании

Щ

4

Проект стандарта включен в программу стандартизации органа государственного управления (министерства, ведомства)

Щ

5

Актуальность проекта стандарта не обоснована

Цд

Обозначим оценки предпочтений экспертов по каждому уровню фактора г4 = (u1q - u-q^/Hq, где i, j — индексы сравниваемых уровней фактора; Hq — константы масштаба, Q — метод опроса экспертов (план А или план В). Результаты оценивания уровней фактора группой экспертов с применением двух методов приведены в табл. 3.9.

Таблица 3.9

Сравнительные оценки уровней фактора «Актуальность разработки стандарта»

Номер

План А

План В

уровня

Q

i

j

f’j

Q

i

j

jiJ

1

1

2

2

1

2

2

2

А

1

3

5

В

2

3

5

3

1

4

5

3

4

2

4

1

5

6

4

5

5

Проверка выполнения критерия адекватности сводится к проверке существования линейной связи нормализованных альтернативных оценок уровней фактора щ, полученных преобразованием сравнительных оценок г^ при решении систем уравнений (3.5) и (3.6) (рис. 3.12).

В качестве критерия линейности логично принять коэффициент детерминации регрессионной модели R2. Поскольку коэффициент детерминации R2 = 0,88 достаточно высок, при этом критерий Фишера F( 1, 3) = 22,8 и /^-уровень р = 0,017, можно сделать

Проверка критерия адекватности К для уровней фактора «Актуальность разработки стандарта»

Рис. 3.12. Проверка критерия адекватности К для уровней фактора «Актуальность разработки стандарта»: иА — оценки экспертов первым методом (план А); ив — оценки экспертов вторым методом (план В) вывод об устойчивости предпочтений экспертов и доверии к экспертным оценкам.

После проверки оценивания предпочтений экспертов по критерию К в качестве оцифрованных значений каждого уровня шкалы принимаем среднее . Шкала готова к использованию.

Полный алгоритм проведения этапа шкалирования для целей построения экспертной системы оценки риска стандартизации приведен в 3.3.2.

Примечание. Сравнительные оценки г®, приведенные в табл. 3.10, являются результатом консенсуса группы экспертов — профессиональных работников Государственного комитета по стандартизации Республики Беларусь. Корректность такого подхода обоснована тем, что экспертные оценки г ^ каждого эксперта также были получены методом альтернатив и проверялись по критерию К. Это автоматически обеспечивало однородность массивов экспертных оценок всей группы.

В табл. 3.10 и 3.11 представлены нормированные шкалы уровней факторов риска, полученные при помощи специально разработанного экспертного метода — метода альтернатив, в совокупности с критерием устойчивости предпочтений эксперта и обобщенной дихотомической шкалой, согласно алгоритму проведения эксперимента.

Шкалы, представленные в табл. 3.10, считаются достоверными, так как были проверены по критерию устойчивости К — коэффициенту детерминации регрессионной модели R2. Проверка устойчивости полученных экспертных данных сводится к проверке существования линейной связи нормализованных альтернативных оценок уровней фактора по «плану А» (оценки экспертов первым методом ?/д) и по «плану В» (оценки экспертов вторым методом Ur).

Таблица 3.10

Результаты шкалирования этапа «Планирование разработки стандарта»

Номер

уровня

Расшифровка уровня

Шкала фактора UAb

Ф1 Согласованность предложений-заявок на разработку стандарта

VI

Аналогичное предложение отсутствует

1

V2

Предложение противоречит другому (одобренному)

0

Продолжение табл. 3.10

Номер

уровня

Расшифровка уровня

Шкала фактора илн

Ф2 Существующее решение

VI

Нет никакого решения

1

V2

Предложение было одобрено, но не включено в план государственной стандартизации предшествующего года

0,732

V3

Предложение было отклонено

0

ФЗ Состояние объекта стандартизации

VI

Стандарты в данной области отсутствуют

1

V2

Стандарты в данной области существуют, но не актуальны (устарели, противоречат международным и т.д.)

0,757

V3

Стандарты в данной области существуют, по не охватывают все аспекты

0,465

V4

Аналогичные стандарты в данной области уже существуют

0

Ф4 Степень гармонизации разрабатываемого стандарта с международными/регионалъными требованиями

VI

Стандарт идентичен международпому/регионалыюму стандарту

1

V2

Стандарт модифицирован по отношению к междуна- родпому/региопалыюму стандарту

0,708

V3

Стандарт разработан на основе международного/регио- нального стандарта (неэквивалентен/негармонизиро- ван)

0,522

V4

Стандарт идентичен проекту междупародного/регио- пальпого стандарта

0,374

V5

Стандарт модифицирован по отношению к проекту международпого/регионального стандарта

0,225

V6

Стандарт противоречит международным/региональ- ным требованиям

0

Ф5 Источник финансирования

VI

Источник финансирования определен

1

V2

Источник финансирования не определен

0

Ф6 Компетентность разработчика

VI

Разработчик имеет большой опыт разработки стандартов в данной области

1

Продолжение табл. 3.10

Номер

уровня

Расшифровка уровня

Шкала фактора иЛВ

V2

Разработчик имеет большой опыт разработки стандартов в целом (в других областях)

0,670

V3

Разработчик будет осуществлять разработку стандарта впервые

0,374

V4

Есть отрицательный опыт разработки стандартов данным разработчиком

0,110

V5

Разработчик не определен

0

Ф7 Уровень заявителя

VI

Совет Министров

1

V2

Технический комитет

0,660

V3

Органы государственного управления

0,351

V4

Иной субъект технического нормирования и стандартизации

0

Ф8 Актуальность разработки стандарта

VI

Разработка по решению Совета Министров

1

V2

Стандарт взаимосвязан с техническим регламентом

0,798

V3

Технико-экономическое обоснование разработки

0,437

V4

Стандарт включен в программу органа государственного управления

0,378

V5

Актуальность не обоснована

0,159

V6

Разработка стандарта не актуальна

0

Ф9 Устранение технических барьеров в торговле

VI

Со всеми странами/с регионами

1,000

V2

С отдельной страной

0,423

V3

Ни с кем

0,226

V4

Создает неоправданные барьеры в торговле

0,000

Ф10 Ресурсоемкость внедрения и применения разрабатываемого стандарта

VI

Стандарт не вызовет трудностей, значительных затрат при применении

1

V2

Стандарт скорее не вызовет трудностей, значительных затрат при применении

0,757

V3

Стандарт скорее вызовет трудности, значительные затраты при применении

0,293

V4

Стандарт вызовет трудности, значительные затраты при применении

0

Окончание табл. 3.10

Номер

уровня

Расшифровка уровня

Шкала фактора иЛВ

Ф11 Влияние на действующие стандарты

VI

Стандарт не требует изменений в других стандартах

1,000

V2

Действующие стандарты необходимо актуализировать в данной области

0,598

V3

Действующие стандарты необходимо актуализировать в иных областях

0,000

Таблица 3.11

Результаты шкалирования этапа «Разработать стандарт»

Номер

уровня

Расшифровка уровня

Шкала фактора UAB

Ф1 Наличие соисполнителя

VI

Соисполнитель отсутствует

1,000

V2

Наличие соисполнителя, которому выделено менее 50 % средств от общей суммы на разработку

0,571

V3

Наличие соисполнителя, которому выделено от 50 до 100 % средств от общей суммы на разработку

0,000

Ф2 Наличие организаций, включенных в список рассылки

VI

Перечень субъектов для рассылки составлен максимально полно и объективно

1,000

V2

В перечень субъектов для рассылки не входят только неключевые организации для данного объекта стандартизации

0,757

V3

В перечень субъектов для рассылки не входят только ключевые организации для данного объекта стандартизации

0,171

V4

В перечень субъектов не входят как неключевые, так и ключевые организации для данного объекта стандартизации

0,000

ФЗ Возможные разногласия с заказчиком при утверждении ТЗ

VI

Разногласия отсутствуют

1,000

V2

Несущественные разногласия (например, только по срокам)

0,750

V3

Принципиальные разногласия (например, отсутствие в списке взаимосвязанных ТИПА, содержащих важные аспекты безопасности)

0,000

Окончание табл. 3.11

Номер

уровня

Расшифровка уровня

Шкала фактора UAB

Ф4 Несоблюдение установленных сроков разработки

VI

Все сроки соблюдены

1,000

V2

Сроки были перераспределены (без выхода за отведенные суммарные временные рамки)

0,598

V3

Имело место систематическое несоблюдение сроков (без выхода за отведенные суммарные временные рамки)

0,000

Ф5 Проблемы с обеспечением организации-разработчика необходимыми

ресурсами

VI

Организация-разработчик в полной мере обеспечена всеми необходимыми ресурсами

1,000

V2

Перераспределение ресурсов

0,598

V3

Потребовались дополнительные ресурсы

0,000

Ф6 Наличие замечаний

VI

Замечания отсутствуют или касаются оформления

1,000

V2

Замечания приняты

0,742

V3

Проведения согласителыюго(ых) совещания(ий) с достижением консенсуса

0,522

V4

Проведения согласительного(ых) совсщания(ий) без достижения консенсуса

0,000

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >