Планирование капиталовложений на несколько лет

В разделе 3.4.1 мы рассмотрели задачу однократного принятия решений о распределении имеющегося ресурса (капитала). Часто возникают задачи принятия решений о распределении капитала в течение нескольких лет.

Пусть требуется спланировать деятельность двух предприятий П1 и Ш в течение п лет. Средства Х и Х2, вложенные в каждое предприятие в начале года, в конце года приносят доход, который каждым предприятием делится на две части. Первые части в предприятия не вкладываются. Будем считать, что это расходы на нужды предприятий, не связанные с дальнейшим производством, и условно назовём их накоплениями. Накопления суммируются по двум предприятиям и по годам. А вторые части дохода от каждого предприятия также суммируются и заново распределяются между предприятиями на их дальнейшую деятельность.

В начале планируемого периода имеется Ki средств, все они вкладываются в предприятия (в том или ином соотношении). В начале второго года распределяется только та часть полученного дохода, которая вкладывается в предприятия,

дополнительных средств не поступает и так в начале каждого следующего года. Доход, полученный после n-го года, также делится на две части по тем же правилам, что и в предыдущие годы. Заданы функции, которые позволяют для каждого предприятия в зависимости от вложенных в него средств (Xi и Х2 соответственно) вычислить и часть дохода, идущего на накопление (di(Xi) и d2(X2) соответственно) и часть дохода, направляемую на распределение в начале следующего года (pi (Xi) и р22) соответственно). Другими словами, Xi и Х2 - это то, что выдано каждому из предприятий в начале года, di(Xi) + d2(X2) - это изымаемая часть дохода в конце года (накопления), a pi(Xi) + р22) - это то, что будет заново распределяться в начале следующего года.

Требуется найти такой план распределения средств между предприятиями, чтобы к концу n-го года суммарные накопления были максимальны. Другими словами, максимизируются средства, полученные от предприятий за п лет и им не возвращённые, при заданных единовременных вложениях в начале первого года Кь

Рассмотрим конкретный пример.

Пусть

Итак, планируемый период составляет 5 лет, начальные распределяемые средства равны 10 единиц и в начале каждого следующего года распределяется 0.8Xi+0.2X2, где Xi и Х2 соответственно средства, вложенные в предприятия в истекшем году. Накопления за истекший год составляют

di(Xi) + d2(X2)= Хг+2Х22 и их сумма за пять лет должна быть максимальна.

Задача естественным образом распадается на пять этапов по числу планируемых лет. На каждом этапе достаточно определить только Xi, т. е. средства вкладываемые в первое предприятие, так как сумма распределяемых средств известна.

«Состоянием системы» на каждом из этапов будем считать количество распределяемых средств. На первом этапе состояние задано и определяется числом 10. Обозначим через Ki средства, распределяемые на i-ом шаге, т.е. в начале i- ого года, через х; средства, вложенные в первое предприятие в i-ом году (во второе предприятие вкладывается Ki - Xi), а через Di накопления, которые получаются от использования Ki в i-ом году. В наших обозначениях на первом этапе Xi=xi, Х2=10 - xi, на втором этапе Х|=х2, Х22 - х2,..., на пятом этапе X|—Х5, Х2—К5-Х5.

Состояние, в которое перейдёт система после первого этапа, определяется как 0.8xi+0.2(10-xi), именно столько средств будет распределяться в начале второго года. И управлений xi и соответственно состояний бесконечно много, еслир не ограничиваться целочисленными значениями. Казалось бы нужно ввести дискретность по xi и перейти к конечному числу управлений и состояний, но это не обязательно и мы этого делать не будем.

Рассмотрим последний пятый год. Накопления Ds зависят от распределяемых средств К5 и от того, как они распределяются, то есть от xs. Используя (4.7), можно записать

Величина К5, характеризующая состояние системы на пятом этапе, неизвестна. Далее, xs - любое число на отрезке 0< xs2+2(Кб -Х5)2 при условии 0< Х5<К5. Этот максимум достигается в одной из крайних точек отрезка [0,Ks], (а не при равенстве нулю производной по xs, где функция имеет минимум). При Х5=0 значение функции равно 2К52, а при xs= К5 только К52. Отсюда следует, что надо взять Х5-О для любого состояния К5.

Переходим к четвёртому этапу (году). «Состояние системы» определяется величиной К4 - распределяемыми средствами на четвёртом этапе. Из этого состояния нужно дойти до конца и, в частности перейти на пятый этап, по оптимальной траектории, то есть так, чтобы были максимальны суммарные накопления на оставшихся (четвёртый + пятый) этапах. Эти накопления составят D4(K4, Х4) + D5 (К5, Хб)= D4(K4, Х4)+ 2К52, так как оптимальную величину xs =0, не зависящую от Х4, мы знаем. Ей соответствует Ds=2Ks2. Переход от четвёртого этапа к пятому определяется величиной Х4 - вложениями в первое предприятие на четвёртом году. Во второе предприятие будет вложено К4 - Х4, и для величины К5 в соответствии с (4.7) получим

При любом К4 величину Х4 надо искать из условия

Это соответствует принципу оптимальности и представляет собой запись рекуррентного уравнения Р. Веллмана для нашей задачи применительно к четвёртому этапу. Максимум этой функции может достигаться только в крайних точках отрезка [0,К4]. При Х4=0 имеем 2.08 К42, а при Х4 =К4 соответствующие суммарные накопления на двух последних этапах составят 2.28 К42. Поэтому

ПО выбираем Х4- К4 при любом К4 и переходим к третьему этапу (году). Уравнение Р. Веллмана примет вид

и, следовательно, хз должна быть точкой максимума для при 0< хз<Кз. Аналогично

четвёртому этапу исследуем только значения хз =0 и хз =Кз. При хз =0 имеем 2.0912Кз2, а при хз =Кз соответственно 2.4592 Кз2. Выбираем хз =Кз и при этом на трёх последних этапах суммарные накопления будут составлять 2.4592 Кз2.

На втором этапе нужно найти хг из условия

Здесь Кз= 0.8Х2+0.2 (К2-хг)=0.6х2+0.2К2 и нам нужен максимум

при

Максимум достигается при Х2= Кг и примерно равен 2.57492Кг2. Наконец, на первом шаге х надо выбрать из условия максимума

при 0< xi2+2 (10-xi)2+2.57492 (0.6xi+2)2 при 0

Этот максимум достигается при xi=10. В результате суммарные накопления при оптимальном управлении ресурсами составят примерно 265,8. При этом первое предприятие получит по годам 10, 8, 6.4, 5.12, 0, а второе предприятие получит соответственно 0, 0, 0, 0, 4.096. Точно накопления составят

Полученный результат нельзя считать неожиданным. Действительно, при равных вложениях первое предприятие даёт вдвое меньшие накопления, но вчетверо большие распределяемые средства (см. (4.7)). Естественно, что ему отдаётся приоритет в первые годы деятельности, чтобы обеспечить развитие производства и максимальные суммарные накопления за пять лет. В последний год нас интересуют только накопления, а не дальнейшая деятельность предприятий, поэтому все распределяемые средства отданы второму предприятию. Не случайно функции pi(x) и рг(х) никак не влияют на поиск величины Х5.

Может показаться, что такое распределение сохранится при неизменных функциях и при изменении коэффициентов в pi(x), рг(х), сохраняющем условие pi(x) > рг(х). Однако это не так.

Сохраняя вместо возьмём

и тот же начальный капитал Ki. Очевидно, Х5-О. Для четвёртого этапа имеем теперь условие определения Х4.

При Х4=0 суммарные накопления за два последних года составят 2.18 К42, а при Х4 =KU только 2.125 К42 и поэтому выбирать нужно Х4=0, а не Х4 =К4 как было при коэффициентах 0.8 и 0.2.

Данный пример демонстрирует применение метода динамического программирования не при дискретном, а при непрерывном изменении параметров состояния системы и сведении рекуррентного уравнения Р.Веллмана к задаче поиска максимума квадратичной функции.

При более сложных функциях получаются более

сложные уравнения Р.Веллмана, и на каждом шаге возникает задача поиска максимума функции более сложной, чем квадратическая. Максимум может быть в точке равенства нулю производной или в одной из крайних точек интервала поиска. Условие равенства нулю производной приводит к уравнению относительно неизвестного управления при заданном начальном состоянии. Так на самом простом пятом шаге нужен max D5 (К5, xs) по xs при 0< xsп мы не знаем. Это ещё раз опровергает ставшее стереотипным умозаключение: «в любой задаче динамического программирования «начало» и «конец» можно поменять местами» [6].

В рассматриваемой задаче нет необходимости разбивать регулярную сетку состояний на каждом шаге, иначе пришлось бы решать уравнения для определения Xi при заданном состоянии, в которое «система переходит под управлением х»>. Вместо этого следует, начиная с первого шага рассмотреть с заданным дискретом все значения на отрезке 0< xi

Продемонстрируем эти возможности на уже решённой задаче с исходными данными:

На первом шаге состояние, зависящее от xi, определяется как

а его оценка

Графики функций Si(xi) и Di(xi) представлены на рис.4.5.

Графики функций первого шага Si(xi) и Di(xi)

Рис. 4.5. Графики функций первого шага Si(xi) и Di(xi)

Уже после первого шага выясняется, что все точки (состояния получаемые при соответствующем выборе xi) для 10/3

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >