ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТОВ

Полный факторный эксперимент и дробные реплики

Планирование экспериментов, как отмечалось в гл. 8, является составной частью процесса имитационного моделирования работы системы управления. Кроме того, инструментарий методологии планирования экспериментов может быть использован для решения экстремальных задач, когда у исследователя очень мало информации о характере оптимизируемой функции и об области ее оптимальных значений.

Как правило, системы, подлежащие оптимизации, оказываются столь сложными, что не поддаются теоретическому изучению, и в большинстве случаев экстремальные задачи решаются экспериментально при неполном знании механизма явлений. Теория планирования экспериментов — математическая теория экстремальных экспериментов, позволяющая выбирать оптимальную стратегию исследования при неполном знании процесса.

Существенно то, что при этом подходе исследователь получает математическую модель процесса. На математическом языке задача формулируется следующим образом.

Нужно получить представление о функции отклика r = (p(xj, х2,..., %), где Г) — параметр процесса, подлежащий оптимизации, X], х2,...,% — независимые переменные, которые можно варьировать при постановке экспериментов.

Основываясь на априорных сведениях об изучаемом процессе, исследователь выбирает некоторую оптимальную стратегию для управления экспериментом. На каждом этапе исследования выбирается оптимальное расположение точек в пространстве переменных, чтобы получить представление о функции отклика. Затем находится направление движения к той области, где условия протекания процесса оптимальны. После ее достижения формируется представление о виде функции отклика в области оптимума.

Далее рассмотрены вопросы, связанные с планированием экспериментов методом полного и дробного факторных экспериментов. Детальное изложение этих вопросов необходимо для отчетливого понимания современных методов планирования экстремальных экспериментов. Факторный эксперимент — есть первое звено в цепи тех идей, последовательное развитие которых привело к разработке статистических методов математического описания сложных процессов.

Построение полного факторного эксперимента и дробных реплик от него. Допустим, что есть две независимые переменные Х и х2 и каждую из них можно варьировать на двух уровнях, условно обозначаемых символами +1 и —1. Например, если в каком-то эксперименте варьировать два фактора — температуру и давление — так, чтобы они принимали только значение 80 или 120°С и 2 или 3 атм, то опыт, в котором температура была 120°С, а давление 2 атм, в кодовом обозначении запишется как: х = +1, х2 = — 1, а кодовое обозначение Xi = — 1, х2 = +1 будет указывать на то, что опыт нужно проводить при температуре 80°С и давлении 3 атм.

Легко видеть, что все возможные комбинации для двух факторов, варьируемых на двух уровнях, будут исчерпаны, если поставить четыре опыта так, как это показано в табл. 9.1. Эта таблица называется матрицей планирования. В первом столбце таблицы приведены значения фиктивной переменной х0 = 1; во втором и третьем столбцах — значения переменных х и х2 (эти два столбца образуют собственно планирование); в четвертом столбце записано значение произведениях! х2, наконец, пятый столбец не относится непосредственно к матрице планирования — это вектор значений результатов наблюдений. Первая строка таблицы соответствует первому опыту, в котором обе независимые переменные и х2 находятся на нижнем уровне. Во втором опыте первая независимая переменная Х находится на верхнем уровне, вторая х2 на нижнем, и т.д.

Таблица 9.1

Полный факторный эксперимент дня двух независимых переменных, варьируемых на двух уровнях (планирование типа 22)

Матрица планирования X

Вектор выхода У

Ч

*1

х2

*1*2

1

2

3

4

5

+ 1

-1

-1

+ 1

У]

+ 1

+ 1

-1

-1

У2

+ 1

-1

+1

-1

Уз

+ 1

+ 1

+1

+ 1

У4

Пользуясь таким планированием, можно вычислить коэффициенты регрессии неполного квадратного уравнения

в этом случае число опытов будет равно числу оцениваемых параметров не останется степеней свободы для проверки нуль-гипотезы об адекватном представлении результатов эксперимента выбранной математической моделью. Если есть основания полагать, что изучаемый процесс в заданном интервале варьирования переменных может быть описан линейной моделью, то можно воспользоваться методом наименьших квадратов для определения трех коэффициентов регрессии Ь$, Ь и bj — одна степень свободы останется для проверки гипотезы адекватности.

Перейдем к рассмотрению экспериментов с тремя независимыми переменными xj, х2, х3, варьируемыми также только на двух уровнях. Чтобы исчерпать все возможные комбинации трех факторов, варьируемых на двух уровнях, нужно поставить восемь опытов, планируя эксперимент так, как это показано в табл. 9.2.

Здесь введены два дополнительных упрощения в системе обозначений: символы +1 и —1 обозначены просто знаками «+» и «—»

Таблица 9.2

Полный факторный эксперимент для двух независимых переменных, варьируемых на двух уровнях (планирование типа 23)

Матрица планирования X

Код строки

Вектор выхода У

*0

*1

*2

*3

*1*2

*1*3

*2*3

*1*2*3

1

2

3

4

5

6

7

8

9

10

+

+

+

+

(1)

У

+

+

м

+

+

а

У2

+

+

+

+

Ь

Уъ

+

+

+

+

ab

У

+

+

+

+

с

У-ь

+

+

+

+

ас

Уб

+

+

+

+

Ьс

У7

+

+

+

+

+

+

+

+

abc

У8

и добавлен новый столбец с условными обозначениями строк с помощью малых латинских букв и одной цифры. Буквы а, Ь, с обозначают, что в соответствующих строчках на уровне +1 был только один из факторов Х, х2, х3; произведение двух букв ab, Ьс,... обозначает, что в соответствующих строчках на верхних уровнях было два фактора: xj, Х2, х3, произведение трех букв abc указывает на то, что на верхнем уровне были все три фактора; наконец, символ (1) означает, что все факторы были на нижних уровня х. С помощью такого кодового обозначения матрица планирования может быть записана одной строкой:

Пользуясь планированием, предоставленным в табл. 9.2, можно определить свободный член bо, три коэффициента регрессии при линейных членах bj, 62, b3, три коэффициента при парных произведениях b2> bj?,, и один коэффициент регрессии при тройном

произведении 6123. Если ограничиться линейным приближением, то останутся четыре степени свободы для проверки гипотезы адекватности.

Матрицу планирования для трех независимых переменных получают из планирования для двух переменных, повторив его дважды: один раз при значениях х3, находящихся на нижнем уровне, второй раз — на верхнем уровне. Если нужно включить в рассмотрение четвертый фактор Хф то аналогичным образом дважды повторяют планирование для трех переменных: один раз для фактора Хф находящегося на нижнем уровне, другой раз — на верхнем уровне. В результате получают матрицу планирования, которая будет представлена строкой

Аналогичным образом могут быть построены планы для сколь угодно большого числа независимых переменных. Легко видеть, что с ростом числа факторов к число опытов растет по показательной функции N = 2к. Планирования, представленные в табл. 9.1 и 9.2, обычно называют планированиями типа 22 и 23 соответственно. При к независимых переменных будем иметь дело с полным факторным экспериментом типа 2к.

Если при решении той или иной задачи можно ограничиться линейным приближением, то полный факторный эксперимент типа 2к также оказывается недостаточно эффективным, особенно для большого к. При линейном росте числа независимых переменных число опытов для полного факторного эксперимента растет по показательной функции, в результате чрезмерно много степеней свободы остается на проверку гипотезы адекватности. Например, при к = 2 и при линейном приближении для проверки гипотезы адекватности используется только одна степень свободы, тогда как при А = 6 — уже 57 степеней свободы. Правда, при постановке таких больших экспериментов резко снижается ошибка в определении коэффициентов регрессии, поскольку при факторном планировании все опыты используются для оценки каждого из коэффициентов регрессии. Но это обстоятельство далеко не всегда является достаточным основанием для постановки большого числа опытов. Часто, особенно на первых этапах исследования, требуется получить некоторую, хотя бы и не очень точную, информацию о процессе при минимальных затратах труда на проведение экспериментов. Если можно ограничиться линейным приближением, то число опытов удается резко снизить, используя для планирования так называемые дробные реплики от полного факторного эксперимента.

Поясним идею дробных реплик на конкретных примерах. Допустим, что нам нужно получить линейное приближение некоторого небольшого участка поверхности отклика при трех независимых переменных. Для решения этой задачи можно ограничиться четырьмя опытами, если в планировании для полного факторного эксперимента типа 22 произведением ]^2 приравнять третьему фактору м3. Будет получена матрица планирования, представленная в табл. 9.3.

Элементы этой матрицы в точности равны элементам матрицы, представленной в табл. 9.1, но опыты здесь будут уже ставиться с включением третьй независимой переменной м3. В первом опыте переменные х и м2 находятся на нижнем уровне, м3 — на верхнем; во втором опыте м/ находится на верхнем уровне, м2 и м3 — на нижних уровнях, и т.д. Пользуясь таким планированием, можно оценить свободный член Ьц и три коэффициента регрессии при линейных членах. Если коэффициенты регрессии by при парных произведениях не строго равны нулю, то найденные здесь коэффициенты регрессии будут служить оценками для совместных эффектов:

Таблица 9.3

Первая полуреплика от полного факторного эксперимента типа 23 (планирование типа 23-1)

Матрица планирования X

Код

строки

Вектор выхода Y

XQ

XI

х2

*3

1

2

3

4

5

6

+

+

с

У

+

+

а

Уг

+

+

Ь

Уз

+

+

+

+

abc

У4

Эти эффекты не могут быть раздельно оценены в планировании, состоящем всего из четырех опытов, так как здесь неразличимы столбцы для линейных членов и парных произведений. Если, например, в дополнение к столбцам, приведенным в табл. 9.3, вычислить еще столбец для произведения х^, то увидим, что элементы этого столбца в точности равны элементам столбца х2.

Если после постановки первых четырех опытов у исследователя почему-либо возникнут сомнения в том, что bу = 0, то он может поставить еще четыре опыта, приравняв теперь Х3К —xjx2. Матрица такого планирования приведена в табл. 9.4. Пользуясь этой матрицей, можно оценить совместные эффекты:

Здесь элементы столбцовх, х2, Х3 равны соответственно элементам столбцов х^з, xjx3, Х[Х2, взятым с обратным знаком.

Взяв среднее из сумм и разностей для первой и второй систем совместных оценок, получим коэффициенты регрессии, которые будут уже оценками для разделенных эффектов (если ограничиться рассмотрением членов до второго порядка включительно).

Например, и т.д.

Легко видеть, что, объединив схемы планирования, заданные табл. 9.3 и 9.4, получим планирование, представленное табл. 9.2. Первые две схемы планирования можно рассматривать как две половины, или как две «полуреплики» от полного факторного эксперимента типа 23. Отсюда понятно, что, реализовав обе полуреплики от полного факторного эксперимента типа 23, получаем разделенные оценки для линейных эффектов и эффектов взаимодействия. Такие же разделенные эффекты будут получены, если реализовать сразу все восемь опытов для планирования типа 23. Нужно обратить внимание на то, что разбиение матрицы планирования, представленного табл. 9.3, нельзя выполнять механическим распределением строк на две группы. В первую полуреплику здесь отбираются строки с нечетным числом переменных (это соответствует требованию хз = ХХ2 здесь третья переменная попадает на верхний уровень только в тех строках, где две другие переменные находятся одновременно на верхних или нижних уровнях). Во вторую полуреплику берутся строки с четным числом переменных (в соответствии с требованием Хз = —Х1Х2).

Обратимся теперь к задаче с четырьмя независимыми переменными. Здесь можно поступить следующим образом: в планировании 23, представленном табл. 9.2, приравнять тройное взаимодействие Х1Х2Х3 к четвертому фактору х4, постулируя, что 6123 = 0. Мы получим одну из полуреплик от полного факторного эксперимента типа 24. Матрица такого планирования будет задана строкой:

ad, bd, ab, cd, ас, be, abed.

Таблица 9.4

Вторая полуреплика от полного факторного эксперимента типа 23 (планирование типа 23'1)

Матрица планирования X

Код

строки

Вектор выхода Y

х0

*1

х2

х3

1

2

3

4

5

6

+

+

(1)

*5

+

+

ас

Уб

+

+

Ьс

у7

+

+

+

+

ab

У8

Здесь все комбинации четные. Эта матрица планирования получена из матрицы планирования 23:

умножением на d нечетного сочетания букв (соответственно требованию Х4 =XjX2x3, четвертый фактор принимается на верхнем уровне только в тех строках, где на верхнем уровне находится один или три других фактора). Вторую полуреплику получим, приравняв *4= — xjx2x3. Матрица планирования этой полуреплики будет задаваться нечетной строкой

Эта строка получена умножением на d четных комбинаций в исходной матрице планирования. Объединив две полуреплики, опять получим матрицу планирования для полного фактора эксперимента. Число четных и нечетных строк в полном факторном эксперименте всегда одинаковое. Можно пойти дальше и построить дробные реплики высокой степени дробности. Если, например, нужно изучить влияние 7 переменных, то для получения линейного приближения можно ограничиться 8 опытами. Постулируя возможность линейного приближения, можно утверждать, что все эффекты взаимодействия пренебрежимо малы. Это позволяет получить дробную реплику из полного факторного эксперимента типа 23, положив *4 = ххх2, х5 = Х,Х3, х6 = х2х3, х7 = Х!Х2Х3.

Для обозначения дробных реплик, в которыхр линейных эффектов приравнены к эффектам взаимодействия, удобно пользоваться условным обозначением 2к'р. В последнем примере мы рассмотрели дробную реплику, представляющую собой планирование типа 27-4. Полуреплика от полного факторного эксперимента 24 будет записываться как планирование типа 24-1. Такой способ записи еще полностью не характеризует свойства реплики. Дробные реплики можно получать, приравнивая основные эффекты различным эффектам взаимодействия. Например, планирование типа 24-1 можно получить, приравнивая х4 к тройному взаимодействию xtx2x3 или к одному из парных взаимодействий xpcj. Естественно, что при этом изменится система совместных оценок.

Исследование уравнений регрессии, полученных с помощью полного факторного эксперимента и дробных реплик. Легко видеть, что рассмотренные схемы — полный факторный эксперимент и дробные реплики — обладают следующими свойствами:

где к — номер последнего столбца в матрице планирования.

Формально полный факторный эксперимент всегда можно рассматривать как некоторое планирование первого порядка, заменяя в матрице планирования произведения независимых переменных новыми переменными. Выражение (9.1) — это свойство ортогональности: скалярное произведение всех вектор-столбцов здесь равно нулю. Выражение (9.2) — это условие симметричного расположения всех независимых переменных относительно центра эксперимента. Наконец, выражение (9.3) — это равенство сумм квадратов элементов для всех столбцов. Из (9.1) следует, что матрица коэффициентов нормальных уравнений диагональна, из (9.3) — что все диагональные элементы этой матрицы равны числу наблюдений N, а диагональные элементы обратной матрицы cy=l/N.

Для проведения регрессионного анализа получаем здесь следующие очень простые формулы:

В зависимости от постановки задачи можно различным образом использовать информацию, полученную при определении SR:

  • • Если имеет место насыщенное планирование (все эффекты взаимодействия заменены новыми факторами), to/r = 0 и, следовательно, SR также должно быть равно нулю. В этом случае SR вычисляют только для проверки правильности вычисления коэффициентов регрессии.
  • • Если имеет место ненасыщенное планирование и индекс обозначает только число линейных членов, то тогда вычисляют остаточную дисперсию s2R= SR/fR и, пользуясь дисперсионным отношением F= s2R/s2 {у}, проверяют гипотезу адекватности.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >