Динамическое программирование

  • pdf
  • 06.05.2020
Публикация на сайте для учителей

Публикация педагогических разработок

Бесплатное участие. Свидетельство автора сразу.
Мгновенные 10 документов в портфолио.

Иконка файла материала 13. Динамическое программирование.pdf

Задача скачана с сайта http://www.MatBuro.ru

©МатБюро - Решение задач по высшей математике

 

Тема: Динамическое программирование

 

ЗАДАНИЕ. Для двух предприятий выделено a единиц средств. Как распределить все средства в течение 4 лет, чтобы доход был наибольшим, если известно, что доход от x единиц средств, вложенных в первое предприятие, равен f1(x), а доход от y единиц средств, вложенных во второе предприятие, равен f2(y). Остаток средств к концу года составляет g1( )x для первого предприятия и g2(y) для второго предприятия. Задачу решить методом динамического программирования.

 

a

f1

g1

f2

g2

1000

3x

0,1x

2y

0,5y

 

РЕШЕНИЕ. Процесс распределения средств разобьем на 4 этапа – по соответствующим годам.

 Обозначим ak = xk + yk - средства, которые распределяются на k –ом шаге как сумма средств по предприятиям.

 

             Суммарный доход от обоих предприятий на k –ом шаге:

 zk = f1(xk ) + f2(ak xk ) = 3xk + 2(ak xk ) = 2ak + xk

 

            Остаток средств от обоих предприятий на k –ом шаге:

 ak+1 = g1(xk ) + g2(ak xk ) = 0,1xk + 0,5(ak xk ) = 0,5ak 0,4xk

 

 Обозначим z - максимальный доход, полученный от распределения средств ak между двумя предприятиями с k -го шага до конца рассматриваемого периода.  Рекуррентные соотношения Беллмана для этих функций

 

z

 

z

 

            Проведем оптимизацию, начиная с четвертого шага:

 

            4-й шаг.

 Оптимальный доход равен: .к. линейная возрастающая функция достигает максимума в конце рассматриваемого промежутка, т.е.

при x4 = a4.

 

            3-й шаг.

 

                                                                             1

Задача скачана с сайта http://www.MatBuro.ru

©МатБюро - Решение задач по высшей математике

z{2a3 +x3 + 3(0,5a3 0,4x3)}= 0maxx3a3{3,5a3 0,2x3)}= 3,5a3, т.к. линейная убывающая функция достигает максимума в начале рассматриваемого промежутка, т.е.

при x3 = 0.

 

            2-й шаг.

 

z.к. линейная убывающая функция достигает максимума в начале рассматриваемого промежутка, т.е.

при x2 =0.

 

            1-й шаг.

 

z.к. линейная убывающая функция достигает максимума в начале рассматриваемого промежутка, т.е.

при x1 = 0 .

 

 

            Результаты оптимизации:

z(a ) = 3,875a ; x= 0 z

 

 

 

            Определим количественное распределение средств по годам:

 

Т., получаем a2 = 0,5a1 0,4x1 = 500. Далее аналогично: x x x

 

            Представим распределение средств в виде таблицы:

 

 

предприятие

 

г

од

 

 

1

2

 

3

4

1

0

0

 

0

125

2

1000

500

 

250

0

 

 

            При таком распределении средств за 4 года будет получен доход, равный

 

z

             

                                                                             2