Меню
Главная
Авторизация/Регистрация
 
Главная arrow Математика, химия, физика arrow Линейная алгебра: теория и прикладные аспекты

Ортогональные операторы

Линейный оператор <р, действующий в евклидовом пространстве Е, называется ортогональным, если он сохраняет скалярное произведение любых векторов х, у 6 Е, т.е. если выполняется равенство

Полагая в равенстве (8.40) х = у, получаем <рх2 = х2. Это означает, что ортогональный оператор сохраняет длины векторов.

Поскольку угол между векторами определяется из соотношения

и поскольку числитель и знаменатель в этом соотношении не меняются при действии ортогональных операторов, то ортогональные операторы сохраняют углы между векторами.

Теорема 8.25. Ортогональный оператор любую ортонорми- рованную систему векторов переводит в ортонормированную систему векторов, а ортонормированный базисв ортонормированный базис. Если линейный оператор переводит какой-либо ортонормированный базис в ортонормированный базис, то этот оператор ортогональный.

О Первое утверждение теоремы — следствие того, что ортогональный оператор сохраняет длины векторов и переводит ортогональные векторы в ортогональные. Предположим, что линейный оператор переводит ортонормированный базис е = (ei, е2,..., еп) в ортонормированный базис е! = (е^, е2,..., е'п). Тогда для векторов

имеем

Следовательно

а 9? — ортогональный оператор. ?

Теорема 8.26. Если р — ортогональный оператор, то оператор р*, сопряженный с оператором р, совпадает с обратным оператором р~1.

> Сначала отметим, что ортогональный оператор имеет нулевое ядро, так как нулевой вектор может быть образом лишь того вектора, который имеет нулевую длину, т.е. нулевого вектора. Далее, из равенств

вытекает, что (х,у — р*ру) = 0 для любых двух векторов х и у. В частности, при х = у — р*ру заключаем, что |у — р*ру2 = 0 и у— —р*ру = 0. Таким образом, оператор р*р совпадает с тождественным оператором е, т.е. р*р = е. Умножив последнее равенство справа на оператор р-1, приходим к равенству р* — р~1. ?

Замечание. Подчеркнем еще раз факт, использованный в доказательстве теоремы: ортогональный оператор всегда невырожденный.

Теорема 8.27. У ортогонального оператора матрица в любом ортонормированном базисе является ортогональной. Наоборот, если в каком-либо ортонормированном базисе матрица линейного оператора ортогональна, то этот оператор ортогональный.

О Для ортогонального оператора р выполняется равенство р*р = = ?, которое для матрицы А этого оператора имеет вид АТ А = Е. А это равносильно ортогональности матрицы А. Пусть матрица А линейного оператора р удовлетворяет равенству А1 А = Е. Тогда для самого оператора р верно равенство р*р = е. Применяя это равенство, для любых векторов х и у получаем:

Следовательно, р — ортогональный оператор. ?

Используя свойства ортогональных матриц, легко установить некоторые свойства ортогональных операторов:

1) тождественный оператор является ортогональным;

  • 2) произведение ортогональных операторов — ортогональный оператор;
  • 3) оператор, обратный ортогональному оператору, является ортогональным.

Первое из перечисленных свойств очевидно; второе следует из того, что произведение ортогональных матриц является ортогональной матрицей; третье также вытекает из соответствующего свойства ортогональных матриц.

Теорема 8.28. Корни характеристического многочлена ортогонального оператора (включая и комплексные) по абсолютной величине равны единице.

> Утверждение относительно ортогонального оператора можно переформулировать для ортогональных матриц. Если Ао — корень характеристического многочлена ортогональной матрицы А, то |А — —Ао Е = 0 и однородная система в общем случае комплексных уравнений (А — q Е) X = 0 имеет ненулевое решение х, т.е. существует такой ненулевой столбец х, что

Равенство (8.41) транспонируем и перейдем к комплексно сопряженным числам:

Приравняв произведение левых частей равенств (8.41) и (8.42) к произведению их правых частей, получим:

По условию А — действительная ортогональная матрица. Поэтому АТ А = АТ А = Е и

Так как число хт х = х* х положительное ненулевое, на него можно сократить. В результате придем к равенству 1 = АоАо, из которого вытекает, что |Ао| = 1. ?

Следствие 8.5. Собственными числами ортогонального оператора могут быть только числа 1 и -1.

Теорема 8.29. Любые два собственных вектора, принадлежащие различным собственным значениям ортогонального оператора, ортогональны.

> Согласно следствию из теоремы 8.28 речь идет о векторах х и у, из которых вектор х принадлежит собственному значению 1, а другой у — собственному значению -1. В этом случае

Поэтому (х, у) = 0. ?

Теорема 8.30. Если подпространство L инвариантно относительно ортогонального оператора р, то его ортогональное дополнение Lх также инвариантно относительно р.

> Так как подпространство L инвариантно относительно р, линейный оператор р можно рассмотреть как оператор, действующий на этом подпространстве, т.е. рассмотреть сужение рь оператора р на подпространство L. Оператор pi является ортогональным оператором, а потому невырожденным. Следовательно, для любого вектора у 6 L существует вектор z ? L, для которого pz = у.

Пусть х G L1- — выбран произвольно. Условие хLL означает, что (х,у) = 0 для любого вектора уL. Выберем вектор z ? L, для которого pz = у. Тогда

так как вектор х ортогонален любому вектору из L, в том числе и вектору 2. Но условие (рх,у) = 0, выполняющееся для любого вектора у 6 I/, означает, что рх е Ll. тем самым доказано, что L1- инвариантно относительно р. ?

Теорема 8.31. Пусть р — ортогональный оператор, действующий в евклидовом пространстве Е. Евклидово пространство Е может быть представлено в виде прямой суммы инвариантных подпространств оператора р, размерность каждого из которых равна 1 или 2.

> Доказательство теоремы проведем методом математической индукции по размерности пространства. Утверждение теоремы тривиально для одно- и двумерных евклидовых пространств. Предположим, что теорема верна для всех евклидовых пространств размерности, меньшей п, и докажем утверждение для всех евклидовых пространств размерности п. Выберем произвольное n-мерное евклидово пространство Е ив нем произвольный ортогональный оператор р. По теореме 5.13 в Е существует одно- или двумерное подпространство L, инвариантное относительно р. По теореме 8.30 подпространство L1- тоже инвариантно относительно р. На L1 оператор р остается ортогональным, так как для него выполняется условие (рх,ру) = (х,у), которое сохраняется и для любых векторов из L-L. Подпространства L и L1- согласно теореме 8.7 образуют прямую сумму: Е = L ф L . Поскольку L1- имеет размерность п — 1 или п — 2, то согласно предположению математической индукции L1- можно представить в виде прямой суммы одномерных или двумерных инвариантных подпространств оператора р. Добавляя к этой прямой сумме подпространство L, получим нужное разложение в прямую сумму всего пространства Е. ?

Перейдем к исследованию структуры произвольного ортогонального оператора и его матрицы.

Если оператор р действует в одномерном пространстве Е, то для любого вектора е € Е имеем ре = ±е. Следовательно, р — либо тождественный оператор, либо оператор центральной симметрии с матрицей (-1).

Пусть ортогональный оператор р действует в двумерном пространстве Е. Выберем некоторый ортонормированный базис е = (ei, 62). Вектор е[ = ре является единичным, и его координаты можно записать в виде (coscc,sina:)T, где а — угол, который составляет вектор е[ с вектором е. Вектор е’2 = ре2 ортогонален е и имеет единичную длину. Таких векторов два. Первый имеет координаты (— sino;, соsa)T и получается поворотом вектора е на угол ^ против часовой стрелки. Второй противоположен первому и получается поворотом вектора е на угол ^ по часовой стрелке. В первом случае матрица А оператора р имеет вид:

а действие оператора р состоит в повороте вектора на угол а против часовой стрелки (точнее, в направлении от вектора е к вектору 62).

Во втором случае матрица оператора р имеет вид

Замечаем, что эта матрица симметричная, ее характеристический многочлен

имеет корни Ai = 1, Л2 = — 1. Поэтому она (см. разд. 8.9) приводится к диагональному виду

а оператор р является симметрией относительно некоторой прямой.

Рассмотренные случаи в свете теоремы 8.31 оказываются решающими в вопросе выяснения структуры ортогонального оператора. В общем случае верно следующее утверждение.

Теорема 8.32. Для любого ортогонального оператора <р, действующего в п-мерном евклидовом пространстве Е, существует ор- тонормированный базис, в котором матрица А оператора имеет вид:

где Фь ..., Фк — двумерные блоки вида

> Эта теорема напрямую связана с теоремой 8.31. В разложении евклидова пространства Е в прямую сумму одно- и двумерных инвариантных подпространств одномерные подпространства порождаются собственными векторами, и их можно разделить на две группы: собственные векторы, принадлежащие собственному числу 1, и собственные векторы, принадлежащие собственному числу -1. Двумерные инвариантные подпространства по типу действия в них ортогонального оператора могут быть двух видов. В инвариантных подпространствах первого вида действие оператора состоит в повороте вектора на некоторый угол. В инвариантных подпространствах второго вида действие оператора состоит в преобразовании симметрии относительно прямой. Такие инвариантные подпространства содержат собственные векторы оператора и распадаются на пару одномерных инвариантных подпространств. Таким образом, уточняя теорему 8.31, можем утверждать, что для ортогонального оператора евклидово пространство Е может быть представлено в виде

где Pi, ..., Рт — одномерные инвариантные подпространства, порождаемые собственными векторами с собственным значением 1; Qi, ..., Qi — аналогичные одномерные подпространства, но отвечающие собственному значению -1; Pi, ..., Rk — двумерные инвариантные подпространства, в которых оператор осуществляет поворот вектора на некоторый угол а.

Выбрав в этих инвариантных подпространствах ортонормирован- ные базисы и собрав их вместе, получим базис евклидова пространства Е, в котором оператор имеет матрицу вида (8.45). Отметим, что матрица вида (8.45) определена с точностью до перестановки двумерных клеток. ?

Построение ортонормированного базиса, в котором матрица ортогонального оператора имеет канонический вид (8.45), проиллюстрируем примером.

Пример 8.17. Ортогональный оператор в ортонормированием базисе е евклидова пространства имеет матрицу

Построить базис, в котором оператор имеет матрицу В канонического вида, и найти эту матрицу.

Решение. Характеристический многочлен А — Е = — А3+ +2 Л2 — 2 Л + 1 оператора имеет корни

При Л = 1 система (А — Л Е) X = 0 имеет фундаментальную систему решений из одного вектора, например, X = (1,1,1)т. Нормируя этот вектор, получаем:

При Л = а + P i = | ^ система — А Е) X = 0 имеет фундаментальную систему решений из одного вектора, например,

Нормируя векторы и = (2,—1,—1)ти v = (0, —УЗ, УЗ)т, получим еще два вектора ортонормированного базиса:

Базис е' из векторов е'1? е^, 63 является искомым. В нем матрица В оператора ip имеет канонический вид:

а матрицей перехода из базиса е в базис е' является матрица

Замечание. Для комплексного собственного значения А = a+/3i ортогональной матрицы А векторы и и v в решении X = u + iv системы (А — ХЕ) X = 0 всегда ортогональны и имеют одинаковую длину. Эти векторы удовлетворяют условиям <ри = аи — (3v,

Простое доказательство этих фактов дано, например, в [21] (решение задачи 1569). Последние условия выведены в разд. 5.7. Из них, в частности, вытекает, что матрица сужения оператора на подпро-

т / ( а Р

странство L = {и, v) имеет вид I в а )'

Простейшими ортогональными операторами являются операторы вращения и отражения. Оператор простого вращения —

это ортогональный оператор, для которого в каноническом виде (8.45) нет диагональных значений -1, и есть лишь одна двумерная клетка. Если двумерное инвариантное подпространство оператора простого вращения порождено парой базисных векторов и е^, то матрица этого оператора имеет вид:

Такую матрицу называют матрицей простого вращения, или матрицей Гивенса.

Матрицы вращений часто применяются в вычислительных методах при упрощении матриц.

Пример 8.18. Привести матрицу

с помощью вращений к треугольному виду.

Решение. Сначала получим в матрице А нуль на пересечении второй строки с первым столбцом. После умножения матрицы А слева на матрицу

элементом матрицы A = Т А во второй строке первом столбце будет 2 sin а + cos а. Приравнивая этот элемент к нулю, находим: tg а — — |. Поэтому

Следовательно,

и

Возьмем теперь матрицу

Как и в предыдущем случае, из равенства нулю элемента матрицы А2 = 7~2 А в третьей строке первом столбце, т.е. из равенства у/Ъ sin а + /5 cos а = 0, находим:

Поэтому

и

Матрица = R уже является матрицей нужного вида. Иначе процесс преобразований с помощью вращений можно было бы продолжить. ?

Отражением называют оператор (/?, переводящий каждый вектор евклидова пространства Еп в ему симметричный вектор относительно некоторого (п — 1)-мерного подпространства L, т.е. такой оператор, который оставляет неизменными все векторы подпространства L, а векторы его ортогонального дополнения L1- переводит в им противоположные векторы.

Ортогональное дополнение Lявляется одномерным подпространством. Его векторы при отражении меняют лишь направление на противоположное. Такие векторы называют определяющими векторами отражения <р.

Поскольку Еп является прямой суммой подпространств L и Ь±, то любой вектор х из Еп представим в виде

Для произвольного вектора х = ж о + xL ему симметричным является вектор

Определяющие векторы отражения коллинеарны разности любого вектора х из Еп и его образа х', так как

Пусть в подпространстве L1- выбран базис, состоящий из единичного вектора е°, а в подпространстве L — ортонормированный базис, состоящий из векторов е%, ез, ..., е°. Отражение переводит вектор ej в вектор <ре = — ej, а векторы е° при г = 2, ...,тг — в векторы сре^ = е°. Поэтому в ортонормированном базисе е° = (ef,e2,...,е°) пространства -Бп отражение имеет матрицу

Эту матрицу можно представить в виде

где Е — единичная матрица n-го порядка, (ej) — столбец координат вектора е? в базисе е°.

Пусть е = (ei, ег,еп) — произвольный ортонормированный базис в Еп и Т — матрица перехода от базиса е° к базису е. Матрицей отражения ср в базисе е будет матрица

Обозначим столбцы ортогональной матрицы Т-1 через т, тг, тп. Тогда полученное соотношение можно преобразовать в равенство

Поскольку Т-1 — матрица перехода от базиса е к базису е°, то по определению такой матрицы, в матрице Г-1 столбцами являются столбцы координат соответствующих векторов е?, е^, е°п в базисе е. Следовательно, в полученном соотношении столбец Т является столбцом координат единичного определяющего отражение вектора ef в базисе е.

Если в базисе е произвольный фиксированный определяющий отражение вектор имеет столбец координат v, то полагают Т = щ и полученная формула принимает вид

где Е единичная матрица порядка п, v столбец координат в орто- нормированном базисе одного из определяющих векторов отражения.

Отражение с матрицей (8.46) в иностранной литературе называют преобразованием Хаусхолдера.

Матрица (8.46) является симметричной и ортогональной, т.е. удовлетворяет условиям Н = Нт = jfiT-1. Эти условия выполняются ПОСКОЛЬКУ

В вычислительной практике отражения применяют, например, для изменения координат векторов в нужных позициях. Так, в векторе у — (1,1,1,1,1,1,1)т можно одним отражением обратить в нуль 3-ю, 5-ю и 7-ю координаты. При таком отражении можно отобразить данный вектор в любой вектор той же длины, взяв их разность в качестве определяющего вектора. В данном случае в качестве образа вектора у можно взять вектор у' — (—2,1,0,1,0,1,0)т, имеющий нулевые 3-ю, 5-ю и 7-ю координаты, а по длине равный вектору у. Тогда определяющим вектором будет вектор v = у — у' = (3,0,1,0,1,0,1)т.

Нетрудно увидеть, что в определении отражения участвовали только четыре координаты вектора у, три обнуляемые и еще одна, использованная для регулировки длины измененного вектора. Поэтому вместо вектора у можно было взять вектор х = (1,0,1,0,1,0,1)т, у которого ненулевыми являются только изменяемые координаты вектора у и еще одна, в данном случае первая, для регулировки длины. Чтобы обнулить координаты вектора у, в качестве образа вектора х следует взять вектор х' = ±|ж|;г, где z = (1,0,0,0, 0, 0, 0)т. Такое преобразование оставляет неизменными все координаты вектора у, кроме указанных в векторе х. При выборе определяющего вектора v = х — х' = х ± xz есть две возможности, связанные с выбором знака. Обычно знак в этой формуле выбирают так, чтобы он совпадал со знаком дополнительной координаты (в данном случае первой) вектора х, используемой для регулировки длины образа.

Определив вектор v = х + xz = (3,0,1, 0,1,0,1), можно вычислить матрицу отражения (в предположении, что все координаты даны в ортонормированном базисе):

Такая матрица переводит вектор у в вектор

Отражения особенно часто применяют для упрощения матриц, а именно при приведении их к треугольному виду, почти треугольному виду, к двух- и трехдиагональной форме.

Пример 8.19. Привести матрицу

с помощью отражений к треугольному виду.

Решение. Чтобы получить в первом столбце матрицы А нули ниже главной диагонали, отобразим вектор х — (1,2,2)т в вектор х' = (+|ж|, 0,0)т. Для этого, положив 2 = (1,0,0)т, v = хх' = = х + 3 2 = (4,2,2)т, составим матрицу

и найдем матрицу

Для того чтобы в матрице А получить нули ниже главной диагонали по втором столбце, необходимо преобразовать подматрицу, получаемую из А вычеркиванием первой строки и первого столбца. Для этого отобразим с помощью отражения двумерный вектор х = (0, — 3)т в вектор х' — ( —|ж|,0)т. При этом г = (1,0)т, и = х — х' — (3, — 3)т, а матрица отражения имеет вид:

Чтобы преобразовывать не отдельный блок, а всю матрицу А, расширим матрицу Н2, вложив ее как блок в единичную матрицу. Получим матрицу

с помощью которой вычислим матрицу

Матрица А2 = U2 А = U А уже нужного вида, а матрица совокупного преобразования U = U2 Hi из двух отражений имеет вид:

Отражения можно применять для модификации строк матрицы. В этом случае матрица Н отражения может быть найдена по формуле

близкой к формуле (8.46). При этом преобразуемая матрица умножается на матрицу отражения не слева, а справа.

Часто при упрощении матрицы приходится применять отражения к ее столбцам и строкам либо одновременно, либо последовательно. Например, при приведении симметричной матрицы

с помощью отражений к трехдиагональному виду нужно получить нули на месте элементов азх = ац; = 4. Для этого положим х = (3,4)т, 2 - (/, 0)т, v = x + xz~x + bz = (8,4)т и построим матрицу

Найденную матрицу вложим в правый нижний угол единичной матрицы третьего порядка:

Теперь найдем матрицу

Матрица А уже трехдиагональная, причем подобна исходной матрице А.

Здесь мы применили одно и то же отражение одновременно и к первому столбцу, и к первой строке матрицы А, в результате чего получили трехдиагональную матрицу А = UAU~l = UAUi, подобную данной. Так поступают и при приведении произвольной квадратной матрицы А к подобной матрице почти треугольного вида ([3], с. 182-184). В этом случае на г-м шаге получают матрицу Ai = Hi Ai_i Н^1 = Hi Ai_i Hj, i = 1,2,...,&, подобную матрице Л о = А. Процесс продолжают до получения матрицы нужного вида. Например, чтобы привести матрицу

к подобной матрице почти треугольного вида, сначала получим нули в позициях аз1 и сщ. Для этого возьмем х = (1,2,2)т, 2 = (1,0,0)т, v = х + xz = (4,2,2)т и построим матрицу

Вложим матрицу Hi в правый нижний угол единичной матрицы четвертого порядка. Тогда получим матрицу

Далее найдем матрицу

Теперь получим нуль в позиции <242. Для этого возьмем х = (3,4)J 2 = (1,0)т, v = х + xz = (8,4)т и построим матрицу

Вложим матрицу Н2 в правый нижний угол единичной матрицы четвертого порядка. Тогда получим матрицу

Затем найдем матрицу

Матрица А2 почти треугольная и подобна данной.

Если не требуется, чтобы упрощенная матрица была подобна исходной, то отражения можно применять последовательно к столбцам и строкам. Для примера приведем матрицу

к двухдиагональной форме. Сначала получим нули в позициях а21 и аз1. С этой целью возьмем х = (50,50,25)т, z = (1,0,0)т. Построим вектор v = х — |щ| г = (—25,50,25)т и матрицу

Затем найдем матрицу

Теперь получим нуль в позиции а3. Для этого возьмем векторы

х = (—|) и z = (1,0)т. Построим вектор v = х — xz = / я 4^

= и матрицу

Вложим матрицу Н2 в правый нижний угол единичной матрицы третьего порядка. Тогда получим матрицу

и найдем матрицу

Осталось получить нуль в позиции а32. Для этого возьмем х = = (—|, —I) и так же, как и матрицу V построим матрицу

и найдем матрицу

Матрица A3 уже нужного вида — двухдиагональная. ?

 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >
 

Популярные страницы