Меню
Главная
Авторизация/Регистрация
 
Главная arrow Техника arrow Выбор материалов и технологий в машиностроении

ПОСТРОЕНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ

Регрессионный анализ — это метод построения модели, наиболее соответствующей набору экспериментальных данных. Но этот случай не означает, что модель должна в точности совпадать с имеющейся выборкой экспериментальных данных. Наилучшее соответствие выполняется, если функция ошибки, являющаяся показателем отличия модели и реальных данных, может быть минимизирована. Такую функцию ошибки чаще всего представляют суммой квадратов ошибок — разностей между измеренным значением в данной точке и величиной, предсказанной в модели. Поиск вида функции, описывающей зависимость изменения параметра оптимизации У от значений факторов (независимых переменных А) путем минимизации суммы квадратов отклонений расчетных значений У от экспериментально определенных, лежит в основе метода наименьших квадратов.

Рассмотрим один из наиболее простых, но достаточно содержательных случаев, когда множество экспериментальных точек 1 У?) описывается математической моделью вида У=Ь0 + Ь1Х. Коэффициенты Ь0 и Ь подбирают из условия минимизации суммы квадратов отклонений, которые могут быть записаны в виде:

(6.1)

/Г = Х№-А>-*Л)2 =шіп,

где п — число экспериментальных точек.

Необходимым условием наличия минимума является равенство нулю производных ПО Ь0 И Ь от функции Р.

  • (6.2)
  • (6.3)

В результате получаем систему линейных алгебраических уравнении:

П

И

п

п

п

  • (6.4)
  • (6.5)

Я

1

к

п

ы

1

и и

X

А

п

X*, Xх!

1 1

Ь

Хед

1

К-т - Щ - у) _!_

п 1

В матричном представлении эта система имеет вид

В результате решения системы относительно Ь0 и Ь получим

  • (6.6)
  • - х) где X ,У — средние арифметические соответствующих выборок.

Вводя

обозначения

1(Х, - X)2 = - г)2 = V;

Х(*/ - Х)[г, -У) = Э„,

получаем Ьх = 5ХУ /5хх, Ь0 = У - Ь{Х.

Формализм метода наименьших квадратов позволяет получить значения коэффициентов Ь0 и Ьх для любого набора экспериментальных точек (кроме случаев, когда определитель системы уравнений не был равен нулю). В то же время очевидно, что достоверность предсказания линейной модели не беспредельна, и в этой связи необходимо определять показатели качества или степени соответствия модели экспериментальным данным. Для этого рассмотрим тождество

У, - у = У, - У, + У, - у, (6.7)

где У-, — экспериментально определенное значение параметра оптимизации в /-й точке; У, — рассчитанное по модели значение параметра оптимизации в /'-й точке; У/ — общее среднее значение всех У.

Если возвести в квадрат обе части уравнения и просуммировать, получим:

1(г, - У)2 = Х(г( - у)2 + ?(у, - у)2- (6.8)

Сумма квадратов относительно среднего распадается на две суммы: сумму квадратов, обусловленную регрессией "Л >и сум-

дели характеризуется минимальным значением, при котором Я2—И:

Я2 =

КЯ-?)2

  • —2 •
  • 1(г, - у)
  • (6.9)

Величину Я2 называют коэффициентом множественной корреляции. Она показывает долю общего разброса значений У,- относительно среднего, объясняемую регрессией. Эту величину часто выражают в процентах, умножая на 100. Фактически величина Я2 — это корреляция между значениями У1 и У1. Из возможных альтернативных моделей выбирают ту, для которой эта величина имеет большее значение.

Регрессионный анализ основан на предположении, что модель У1 = Ро + РЛ + ?/> / = 1, 2,..., п удовлетворяет следующим требованиям:

1) остаток в, есть нормально-распределенная случайная величина со средним Е, равным нулю, и дисперсией (неизвестной) о2, т.е.

  • (6.10)
  • 2) остатки 8, и еу некоррелированы при / * / , так что

сое (8/8у) = 0. (6.11)

Поэтому Е(У,) = Ро + ДУ,) = а2.

Значения У1 и К некоррелированы при / Фу.

Заметим, что дисперсия о2 может быть (или не быть) равной дисперсии относительно регрессии <52ху Оценкой последней служит остаточный средний квадрат Е2ХУ:

(6.12)

Если постулированная модель не соответствует «истинной», то а2 < о2хУесли же модель корректна, то а2 = в2ху- В последнем случае будем говорить, что модель адекватна экспериментальным данным.

Качество модели определяется ее видом, выбираемым на основе априорных соображений и значений коэффициентов уравнения регрессии, рассчитываемых по формуле (5.13).

а =ш-т-у)1ш-*)2=ш,-х)у<1ш-х)г=...

_ _ (6.13)

= {(*і -*)У + -+(*„ -*)2-

Поскольку^ — величина детерминированная, то можно записать уравнение

{х, - .к)2 Д(1) ) + ??? + (

х„-х)2о(г„)

Р(Г)

[К*/ - X

а2

)2]

2

м

  • 2*
  • 1

^1

2 ~ Пх, -

-X

)2'

р(У)Ш - X)2

Итак,

(6.14)

Отсюда следуют важные рекомендации при планировании эксперимента: для минимизации разброса в определении коэффициента, точки плана эксперимента должны располагаться по периферии факторного пространства.

Стандартное отклонение АЬ{ величины Ь определяют по соотношению

(6.15)

Из опыта, как правило, мы можем вычислять только оценку а2, равную Б2. В этом случае статистическую оценку значения коэффициента Ь определяют по соотношению

п-2,1-1./2а)^

  • 1(х, - *)2
  • 1/2 ’
  • (6.16)

где „-2,-/2а) — коэффициент Стьюдента, определенный при числе степеней свободы (п - 2); п — число точек плана при уровне значимости а.

С другой стороны, если это необходимо, можно проверить нуль-гипотезу о том, что (3| равно (310, где (3|0 — предполагаемое сравнительное значение (31? попадающее или нет в доверительный интервал. В этом случае проверяется статистическая гипотеза Н0: р! = Р10 против альтернативной Я(: (3] Ф (310. Для этого вычисляют

(6.17)

и значение рассчитанного коэффициента Стьюдента сравнивают с табличным значением, определенным при п - 2 числе степеней свободы на уровне значимости а. В частном случае значение (310 может быть равно нулю, и тогда имеется возможность проверить гипотезу о значимости отличия коэффициента (30 от нуля. Для этого следует принять Р10 = 0.

Определение доверительного интервала для Р0 и проверку гипотезы о значимости отличия коэффициента р0 от нуля проводят аналогично тому, как это было описано для Р,:

Щ) =

ух;

"1(х*-х)2

о2.

(6.18)

Замена а2 на 52 позволяет определить доверительный интервал для р0:

Ро - К - п-2,1-1/2«) “

X*/

  • 1/2
  • — 2
  • 5.

«Х(*/ - X)

(6.19)

Проверку нуль-гипотезы проводят по формуле

X*/

  • 1/2
  • (6.20)

Прежде чем перейти к обсуждению вопроса о построении многофакторных моделей методами регрессионного анализа, обратим внимание на удобство использования обозначений и операций из теории матриц для решения задач построения математических моделей. Задачи подобного типа приводят к необходимости решать системы линейных алгебраических уравнений. В случае однофакторных моделей, как было показано ранее, система уравнений имеет вид

П П

Ьф + Ь^Х; =

1 1 (6.21)

п п п

ьах, +ьх}=х,г,.

.1 I 1

Ту же систему можно записать в матричном представлении:

А - В = С,

Л =

П ±х,

п и

; в =

К

А

; с =

п

х^

У)

  • 1т ХТ2
  • 1 1

Ь

Хтт

1

(6.22)

Обратим внимание на то, что наиболее простой является матрица В, так как она состоит только из элементов, представляющих собой совокупность искомых коэффициентов. Матрицы Ли С состоят из элементов, представляющих собой алгебраическую функцию факторов а параметров. Представляется целесообразным раскрыть эти алгебраические функции, т. е. определить элементы матриц Ли В с помощью исходных данных, которыми мы располагали для решения задачи построения математической модели методом регрессионного анализа.

Формально введем две матрицы Хи У, которые являются исходными для формирования матриц Л и С, а значит, и определяют элементы матрицы В, т. е. совокупность искомых коэффициентов уравнения, представляющего собой математическую модель изучаемого явления:

1

*1

У]1

X =

  • 1

*2

; У =

У2

1

Уп

где

(6.23)

Заметим, что Л = Х'Х, С = Х'У.

Матрица X, по существу, задает исходные данные п экспериментов и является матрицей факторов. Кроме факторов, она дополнена лишь единичным столбцом. Введение последнего ориентирует формализм алгебры матриц на определение коэффициента Ь0 в уравнении.

В этой связи для унификации формы уравнения целесообразно считать 1 = Ха, а уравнение (математическую модель) представить в виде

У=Ь0-+Ь1Х. (6.24)

В таком представлении совокупность исходных данных подразделяют на две группы: входные — факторы Л) и выходные У) метры.

Введем следующие обозначения:

У — матрица (вектор-столбец) наблюдений выходной величины У в различных опытах;

X — матрица значений независимых переменных в различиях опытах, включая единичный столбец;

(3 — матрица (вектор-столбец) параметров модели, подлежащих определению, а точнее сказать — оцениванию, поскольку числовое значение параметра, так же как результаты экспериментов, подвержены случайным воздействиям и содержат случайные ошибки;

е — матрица (вектор-столбец) ошибок.

С учетом введенных обозначений система уравнений, в которой параметры модели определены с использованием метода наименьших квадратов, может быть представлена в виде

Х'ХЬ = Х'У (6.25)

Для решения системы уравнений умножим обе части последнего выражения на (XX), получим

(Х'Х) "'СХ'ХЬ) = (Х'Х)-]Х'У;

Ь=(Х'Х)~1Х'У. (6.26)

Таким образом, для получения значений элементов вектора-столбца коэффициентов уравнения модели достаточно обратиться к операциям транспонирования и умножения матриц.

Матрицу дисперсий — ковариаций вектора В определяют следующим образом:

У(Ь)=(Х'Х)-'о2. (6.27)

В случае многофакторной модели порядок или ранг ковариационной матрицы соответствует числу факторов или перелитых в уравнении модели. В соответствии с этим в ковариационной матрице возрастает число строк и столбцов.

Предсказываемые моделью значения определяют из векторного выражения

У = ХЬ. (6.28)

Обратим внимание на одно обстоятельство, существенно расширяющее класс математических моделей, которые можно использовать для описания тех или иных явлений. До сих пор рассматривались линейные модели вида

у = ?*,*,, (6.29)

Однако очень часто на практике приходится иметь дело с нелинейными моделями. Для построения такой модели по методу наименьших квадратов достаточно ввести новую переменную, представляющую собой нелинейную санкцию от исходных переменных. В таком случае модель может быть представлена в виде

к к

Г = + X 0

1 1

Функция/(^) полностью определена и для любого из возможных значений может быть вычислена. Неопределенным является коэффициент Ьк^, который может быть найден с помощью метода наименьших квадратов.

Подобный прием расширяет класс функций, которыми может быть описано явление и процесс. Такие модели — нелинейные относительно переменных, но линейные относительно определяемых параметров Ь-г

В качестве примера приведен двухфакторный эксперимент по плану, включающему в себя пять опытов (см. табл. 5.1).

Таблица 6.1

Значения характеристик опытов

№эксп.

*2

*3

У

1

1,0

2,0

5,0

13,0

2

1,0

3,0

6,0

17,0

3

1,0

4,0

8,0

19,0

4

1,0

6,0

12,0

23,0

5

1,0

9,0

21,0

29,0

После ввода исходных данных переходят в режим формирования вида математической модели

Каждая из фиктивных переменных будет представлять собой функцию от одной или нескольких исходных переменных — факторов. В соответствии с преобразованиями изменяется вид математической модели.

 
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Пред   СОДЕРЖАНИЕ   След >
 

Популярные страницы