Об одном подходе к стабилизации нестационарного объекта

Как известно, одним из важнейших направлений аналитического синтеза является поиск законов формирования обратных связей, стабилизирующих линейные нестационарные динамические объекты.

Рассмотрим объект управления, математической моделью которого служит следующая система линейных дифференциальных уравнений с переменными коэффициентами:

где х е Еп, и е Е1, у е Ек, A(f) — матрица размера п х п , Ь(?) — вектор-столбец размера мх1, Н(?) — матрица размера кхп. В дальнейшем будем считать, что все компоненты указанных матриц являются непрерывными и ограниченными функциями на отрезке t е [0, Г].

Содержательная постановка рассматриваемой ниже задачи состоит в построении такого управления и = и(х), чтобы удержать замкнутую им систему вблизи положения равновесия x(f) = 0 при возникновении различных отклоняющих факторов. При этом должны выполняться некоторые ограничения, накладываемые на интенсивность управления.

Заметим, что возможны различные подходы к формализации данной содержательной проблемы. Наиболее очевидный и широко применяемый подход связан с обеспечением устойчивости (асимптотической) по Ляпунову невозмущенного движения x(f) = 0 .

Одним из вариантов математической постановки задачи является поиск управления в виде обратной связи

где k(t) — вектор-строка, компонентами которой служат непрерывные и ограниченные на отрезке [0,Т] функции. Нестационарный регулятор (7.72) должен обеспечивать асимптотическую устойчивость положения равновесия х(?) = 0 замкнутой системы (7.71), (7.72) и доставлять минимум функционалу

со знакоположительной матрицей R .

Указанный подход достаточно подробно представлен в многочисленных работах, например в монографиях [69] и [117]. Однако заметим, что привлечение соответствующего математического аппарата, особенно в рамках автоматизированного подхода к проектированию, не всегда эффективно в силу существенных трудностей вычислительного характера, а также определенной сложности в реализации регулятора (7.62) (в частности, в рамках встраиваемых систем или на борту подвижных объектов).

Предлагаемый ниже подход к формализации указанной содержательной проблемы и к решению соответствующей математической задачи в известной мере связан с понятием технической устойчивости [68] замкнутой системы.

Определение 7.7. Допустимым множеством Qt обратных связей для объекта (7.71) будем называть совокупность регуляторов с математическими моделями

где и компоненты Vxi

(i = 1, к) вектора-строки х являются полиномами от переменной р произвольных конечных степеней, коэффициентами которых служат ограниченные функции времени на отрезке [О, Г].

В отличие от обратной связи (7.72) будем формировать закон управления для объекта (7.71) в виде регулятора из множества Q.t:

с кусочно-постоянными настраиваемыми параметрами, которые объединены в вектор h(t), формируемый в виде

где 0 < Tj < т2 < ... < хдг_1 < Т . Здесь h' е El (i = l,N) — постоянные векторы, N — количество интервалов постоянства параметров. Множество регуляторов вида (7.74а) будем далее обозначать символом Q(cc?V

Очевидно, что синтез обратных связей на множестве Qtc сводится к поиску целого числа N, границ I, (i = 1,N -1) интервалов постоянства, а также векторов h' е Е1 (i = l,N ).

Определение 7.8. Будем говорить, что замкнутая система (7.71), (7.74), обладает в точке t е [О,Т] степенью устойчивости ср, если выполняется равенство

где 8j(t,V(t)J —корни характеристического полинома А3 замкнутой системы с замороженными в момент t коэффициентами

Определение 7.9. Под интенсивностью управления

в замкнутой системе (7.71), (7.74) в момент t е [О, Г] будем понимать величину, определяемую интегралом

который задан на движениях замкнутой системы

с замороженными в этот момент коэффициентами, где А( - А(?), bt=b(f), Hf=H(t), q = d/dQ, Vt(q) = V(p,t), x(Q)q=q = x0. Если при этом deg(V2) Ф 0 , то начальные условия по вектору состояния регулятора принимаем нулевыми.

На основании проведенного обсуждения содержательной задачи и в соответствии с введенными определениями поставим следующую задачу синтеза. Необходимо найти любой регулятор вида (7.74а) из множества Qtc a Qf, для которого: а) степень устойчивости замкнутой им системы (7.71), (7.74а) в любой момент t е [О, Г] не меньше заданной величины а > 0 :

б) интенсивность управления в этой замкнутой системе в любой

момент t е [0,Т] не превышает заданной величины 1и0 > 0:

в) количество N интервалов постоянства параметров не превышает заданного числа N0 :

В дальнейшем будем считать, что ограничения (7.81)-(7.83) для объекта с математической моделью (7.71) при заданном времени Т выполнимы.

Последовательно рассмотрим несколько вариантов подходов к решению поставленной задачи, укладывающихся в рамки многоцелевой идеологии, принятой в учебном пособии.

Вариант 1. Прямой метод решения

Зафиксируем структуру регулятора (7.74а) из множества Qtc, задавая степени полиномов в его передаточной матрице. Зафиксируем также число N < ЛГ0 интервалов постоянства компонент вектора h(f) и введём в рассмотрение следующий объединённый вектор g варьируемых параметров:

При этом функционалы (7.76) и (7.79) становятся функциями вектора g, т. е. функциями ЛГ(/ + 1)-1 вещественных переменных: ср = (p(t,g), Iu = Iu(t,g). Для вычисления значений этих функций от фиксированного аргумента g примем следующее правило формирования границ интервалов постоянства:

После вычисления значений сформируем вспомогательную функцию

Очевидно, что если ограничения (7.81) и (7.82) для некоторого вектора g выполняются, то функция F(g) (7.85) принимает нулевое значение, а если не выполняются, то F(g) > 0 . Но тогда решение задачи на безусловный экстремум

ведет к решению исходной задачи с требованиями (7.81)-(7.83) при достижении нулевого глобального экстремума.

Если же в результате минимизации функция F(g) не достигает нулевого значения, то следует увеличить количество N интервалов постоянства и повторить процесс спуска для задачи (7.86).

Отметим, что предложенный метод наиболее прост по своей идее, однако достаточно сложен для реализации в вычислительном плане, что обусловлено большой размерностью вектора g, неглад- костью функции F(g) и её возможной многоэкстремальностью.

Вариант 2. Модальный метод решения

Будем далее считать, что для любого момента t <е [О,Т] структура регуляторов (7.74) для объекта (7.71) с замороженными параметрами является полной в смысле определения 7.1.

Зададим некоторый момент t = t* е [О,Г] и предположим, что для этого момента времени тем или иным путём удалось синтезировать регулятор и = V*(p,f)у вида (7.74) такой, что в момент t = t* выполняются условия

При этом справедливо следующее утверждение.

Теорема 7.4. Если для некоторого регулятора u = Y* (р, t) у вида (7.74) и для некоторого момента времени t = t* е [О,Г] имеют место условия (7.87), то найдётся такой отрезокрт2], включающий точку t*, что для любого момента t е[ ъ12] справедливо

Доказательство. В силу условий теоремы исходный объект замыкается регулятором с постоянными коэффициентами. Поскольку компоненты матриц A(f), b(t) и Н(/) непрерывны, нетрудно показать, что и функции ф t,V (f)J, [^ /, V (t)

непрерывны на отрезке [О, Г], а следовательно, и в точке t = t*. Но тогда в силу неравенств (7.87) существуют такие отрезки [xf.x^] и [т“,Т2], включающие точку t*, что на первом из них выполняется соотношение cp|^f,V (t) > а , а на втором — Iu V (t) < 1и0 . Но тогда на отрезке [Xj, х, J = [т|р, х?] П [х“, ] одновременно имеют место соотношения (7.88), что и доказывает теорему. ?

На базе теоремы 7.4 можно предложить специализированный метод синтеза, основанный на расчётном алгоритме № 9.

По существу, для каждого /-го интервала постоянства коэффициентов регулятора (7.74а) необходимо найти вектор h', а также правую границу х, этого интервала. При этом левая граница совпадает с правой границей предыдущего участка.

Тогда вычислительная схема поиска состоит в следующем.

  • 1. Отрезок [0,Т] разбивается на равные малые части точками t*m (m = 0, Nj ), причем *о 0 > tN —Т. Вначале принимается т-0, / = 1, т. е. поиск начинается с первого интервала.
  • 2. Для объекта (7.71), замкнутого регулятором

с помощью алгоритма № 9 из параграфа 7.1 выполняется максимизация функции h') по вектору h1 е Е1. Здесь xf

является первым моментом времени после точки t*m, в который нарушается хотя бы одно из условий:

При этом вместо уравнений линейного приближения принимается стационарная система

а при выполнении шага (4) алгоритма № 9 в качестве величины Гы (г) принимается число

  • 3. Назначается новое значение т = т +1 и повторяется шаг (2) алгоритма с увеличением значения t*m до тех пор, пока не выполнится хотя бы одно из трёх требований:
    • а) Гт = Т, при этом условия (7.81)-(7.83) будут обеспечены на всём отрезке рассмотрения, и решение задачи окончено;
    • б) максимальная величина правой границы окажется хуже, чем для предыдущего значения т;
    • в) величина левой границы /-го интервала окажется большей, чем для (/ -1) -го интервала (под левой границей т понимается наибольший момент времени перед точкой Гт, в который нарушается хотя бы одно из условий (7.90) или (7.91)).

Во всех трёх случаях следует вернуться к предыдущей точке Гт и в качестве результата поиска на /-м интервале принять соответствующие оптимуму вектор h' = h'opt и число т. =

"/ opt

4. В качестве новой начальной точки принимается величина t*m , ближайшая к точке xfopt, назначается новый номер i = i +1 и осуществляется поиск для следующего интервала постоянства с повторением вычислений шага (2).

Замечание. На основании теоремы 7.4 необходимо, чтобы в точках t*m выполнялись соотношения ср(Г,У*)>а, Iu(t*,V*) < Iu0. Для обеспечения первого из них с очевидностью следует принять начальный вектор 8 в спуске с ненулевым вектором у (это следует из формул (7.24)-(7.27) для алгоритма № 9). Если при этом второе условие не будет выполнено, следует предварительно, до выполнения шага (2), минимизировать функцию 7H(fV*(e)) по вектору 8.

Вариант 3. Метод решения в структуре LQR

Если в силу определённых соображений поиск решения (7.74а) на множестве Qtc осуществляется в структуре, порождаемой приведением регулятора

к форме (7.64) в силу уравнений (7.71) (по формулам, указанным в главе 3), то для решения поставленной задачи можно предложить метод, базирующийся на аппарате LQR-оптимизации [90, 138, 145].

Суть метода состоит в следующем. Зададим произвольную точку t*m е [0, Г] и рассмотрим объект с моделью

для которого синтезируем регулятор

с постоянными коэффициентами, минимизирующий функционал

на множестве , где X = const, R — заданная знакоположительная матрица, а > 0 — желаемая степень устойчивости замкнутой системы. В работе [138] показано, что оптимальный регулятор можно найти, решая обычную задачу LQR-синтеза:

причём степень устойчивости замкнутой системы будет не хуже заданной величины а для любого значения X . Если предположить, что для любой точки t*m 6 [0,Т] для системы (7.97) может быть выполнено ограничение

(например, если матрица A(t'm) + aE гурвицева), то при заданной матрице R всегда найдётся такое значение X*, что для любого Х<Х* будет иметь место неравенство (7.98). Но при этом любой регулятор, синтезированный для задачи (7.87) при таких значениях , будет удовлетворять условиям (7.87) теоремы 7.4, следовательно, эта теорема будет в данном случае справедлива.

Эти соображения позволяют предложить следующую расчетную схему поиска векторов h' и правых границ тf интервалов постоянства коэффициентов регулятора (7.74а) в структуре, определяемой исходным регулятором (7.93).

  • 1. Выполнить шаг (1) расчетной схемы модального метода и задать произвольную величину множителя X .
  • 2. С помощью стандартной процедуры LQR-оптимизации для задачи (7.97) найти вектор h‘(t*m,X) коэффициентов LQR- оптимального регулятора. Полагая Н = Н(t*m), привести регулятор (7.95) с найденными коэффициентами к виду (7.74).
  • 3. Найти значения T-(f^A) и if(t*w,X) для левой и правой границ i-го интервала соответственно и максимизировать величину X) по множителю X.
  • 4. Выполнить шаги (3) и (4) расчётной схемы модального метода с учётом второй части приведенного замечания относительно условия (7.98) в точках t*m .

Пример 7.3. Рассмотрим вопрос о стабилизации полёта реактивного летательного аппарата в горизонтальной плоскости. В соответствии с работами [1,13] система линейных уравнений, описывающих процесс стабилизации, имеет вид

где хх — боковой снос, х2 — скорость бокового сноса, х3 — угол рыскания, х4 — угловая скорость по рысканию, и — угол поворота вертикальных рулей.

Зависимости коэффициентов а^ от времени [1] для объекта управления приведены в таблице 7.1.

Поиск регулятора будем осуществлять в структуре

где й, (?) (г = 1,4) — кусочно-постоянные коэффициенты, обеспечивая выполнение ограничений (7.81)-(7.83), где а - 0.5 , 1и0 = 0.3 , N0 =5.

Для регулятора (7.100) можно применить метод синтеза в структуре LQR для функционала

Таблица 7.1. Зависимости коэффициентов atj от времени

т

t(c)

«22(6

я2з (б

«24 (б

Мб

«42 (б

«43 (б

«44 (б

Мб

1

0.716

0.0137

0.2388

43.66

6.168

-0.0338

0.0866

-0.0010

5.018

15

14.5

0.2098

1.9236

168.86

31.143

2.3379

0.4729

0.0043

27.123

20

19.5

0.2459

2.2441

245.00

44.774

6.5312

0.4756

0.0085

41.235

25

24.5

0.2130

2.1366

285.22

42.902

15.3940

0.3953

0.0150

43.400

30

28.5

0.1415

0.0610

171.51

24.880

17.6900

0.1367

0.0139

28.152

35

33.5

0.0579

0.0267

65.81

10.008

7.2982

0.0581

0.0061

11.325

40

38.5

0.0232

0.0127

24.95

4.032

3.2972

0.0251

0.0029

4.562

45

43.5

0.0099

0.0062

10.15

1.734

1.5446

0.0115

0.0014

1.952

50

48.5

0.0046

0.0032

4.51

0.801

0.7463

0.0057

0.0007

0.907

55

51.3

0.0020

0.0039

6.81

3.096

-0.9064

0.0041

-0.0009

2.004

60

55.5

0.0014

0.0666

54.64

1.666

-0.6528

0.0249

-0.0005

1.064

65

60.5

0.0009

0.0814

61.88

1.220

-0.3930

0.0288

-0.0003

0.770

70

65.5

0.0005

0.1007

70.84

1.300

-0.2066

0.0348

-0.0001

0.821

75

70.5

0.0002

0.1213

78.33

1.447

-0.0765

0.0418

0.0000

0.925

80

75.5

0.0001

0.1416

86.01

1.600

-0.0150

0.0511

0.0000

1.048

85

80.5

0.0000

0.2033

105.63

1.885

-0.0006

0.0769

0.0000

1.354

89

83.8

0.0000

0.0000

0.01

2.180

0.0001

0.0000

0.0000

1.632

В качестве промежуточного результата на рис. 7.3 изображены области по времени, в пределах которых объект (7.99), замкнутый оптимальным регулятором и = h(t*m,X)x по отношению к функционалу (7.101) и системе х = A(t*m)x + h(t*m)u, имеет степень устойчивости не хуже а = 0.5 , в зависимости от значений t*m и X.

Заметим, что на рис. 7.3 величины t*m и t указаны не в секундах, а с помощью номеров т точек в соответствии с исходной таблицей 7.1 задания коэффициентов системы (7.99).

Области сохранения заданной степени устойчивости

Рис. 7.3. Области сохранения заданной степени устойчивости

Окончательный результат синтеза представлен в таблице 7.2, где приведены значения т,- границ интервалов, величины компонент векторов h' и максимальные значения Iu(t,V*) на указанных интервалах.

!

Vi

X,-

h

hi

h[

h[

r max 1 и

1

0

39.50

-1.4810

-1.0590

16.19

3.774

0.132

2

39.50

51.29

-1.3380

-2.6720

10.57

7.212

0.287

3

51.29

82.50

-0.5180

-0.7260

29.72

10.41

0.0278

4

82.50

83.50

-0.5458

-1.0680

9.129

4.957

5

83.50

83.80

-161.60

-587.40

220.1

781.5

В силу малости двух последних интервалов, величины /™ах для них не вычислялись.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >