Profesor:
José A Castillo
Bachiller:
Oscar Guarimata C.I
27455059
Instituto Universitario Politécnico SantiagoMariño
Extensión Maturín
Escuela de IngenieríaIndustrial
Julio del 2020
CONCEPTOS
 La programación dinámica es una técnica matemática que se
utiliza para la solución de problemas matemáticos
seleccionados, en los cuales se toma un serie de decisiones
en forma secuencial.
 Proporciona un procedimiento sistemático para encontrar la
combinación de decisiones que maximice la efectividad total,
al descomponer el problema en etapas, las que pueden ser
completadas por una o más formas (estados), y enlazando
cada etapa a través de cálculos recursivos.
DEFINICIONES
 Etapa: es la parte del problema que posee un conjunto
de alternativas mutuamente excluyentes, de las cuales se
seleccionará la mejor alternativa.
 Estado: es el que refleja la condición o estado de las
restricciones que enlazan las etapas. Representa la “liga”
entre etapas de tal manera que cuando cada etapa se
optimiza por separado la decisión resultante es
automáticamente factible para el problema completo.
ESQUEMA DE UNA ETAPA
qi Variable de estado en la etapai
Xij Uno de los valores que puede
adoptar la variable de decisión
“Xi” en la etapa i
iX* Decisión óptima de la etapai
ETAPAi
X i1
X ij
X iJ
....
....
E
S
T
A
D
O
S
Xi
*
qi
RESTO
FORMULACIÓN Y SOLUCIÓN DE PROBLEMAS
 La programación dinámica no cuenta con una formulación
matemática estándar, sino que se trata de un enfoque de
tipo general para la solución de problemas, y las
ecuaciones específicas que se usan se deben desarrollar
para que representen cada situación individual.
 Comúnmente resuelve el problema por etapas, en donde
cada etapa interviene exactamente una variable de
optimización (u optimizadora)
 La teoría unificadora fundamental de la programación dinámica es el
Principio de Optimalidad, que nos indica básicamente como se
puede resolver un problema adecuadamente descompuesto en
etapas utilizando cálculos recursivos.
 “Una política óptima tiene la propiedad de que, independientemente
de las decisiones tomadas para llegar a un estado particular, en una
etapa particular, las decisiones restantes deben constituir una
política óptima para abandonar ese estado”,
PARA RESOLVER PROBLEMAS DE PROGRAMACIÓN
DINÁMICA SE NECESITA:
 Un grado de creatividad
 Un buen conocimiento de la estructura general de los
problemas de programación dinámica para reconocer cuando
un problema se puede resolver por medio de estos
procedimientos y como esto se puede llevar a cabo.
CARACTERÍSTICAS DE LOS PROBLEMAS DE
PROGRAMACIÓN DINÁMICA
que requieren una El problema se puede dividir en etapas
política de decisión en cada una.
 Cada etapa tiene cierto número de estados asociados a ella.
 El efecto de la política de decisión en cada etapa es transformar
el estado actual en un estado asociado con la siguiente etapa.
 El procedimiento de solución esta diseñado para encontrar una
política óptima para el problema completo.
CARACTERÍSTICAS DE LOS PROBLEMAS DE PROGRAMACIÓN
DINÁMICA
 Dado un estado actual, una política óptima para las etapas
restantes es independiente de la política adoptada en las etapas
anteriores (principio de optimalidad).
 El procedimiento de solución se inicia al encontrar la política
optima para la ultima etapa.
 Se dispone de una relación recursiva que identifica la política
optima par la etapa n dada la política optima para la etapa (n+1)
RECURSIVIDAD
Existen dos formas de plantear la fórmula de recursividad
en los problemas de programación dinámica:
 Recursividad de Retroceso: el problema se resuelva
partiendo de la última etapa hacia la primera.
 Recursividad de Avance: el problema se resuelve partiendo
de la primera etapa hacia la última.
RECURSIVIDAD
Las formulaciones de avance y retroceso son en realidad
equivalentes en términos de cálculo. Sin embargo, hay
situaciones donde habría alguna diferencia, en la eficiencia
del cálculo, según la formulación que se utilice. Esto
sucede en particular en problemas donde intervine la toma
de decisiones conforme transcurre el tiempo. En esto caso
las etapas se designan con base en el estricto orden
cronológico de los periodos que ellas representan y la
eficiencia de los cálculos dependerá de si se utiliza
formulación de avance o retroceso.
FRACTALES Y RECURSIVIDAD
EJEMPLO PROTOTIPO
(EL PROBLEMA DE LA DILIGENCIA)
Un caza fortunas de Missouri decide irse al oeste a unirse a la fiebre
del oro en California . Tiene que hacer el viaje en diligencia a través de
territorios sin ley donde existían serios peligros de ser atacados por
merodeadores. Aún cuando su punto de partida y destino eran fijos,
tenia muchas opciones en cuanto a que estados debía elegir como
puntos intermedios. Se desea estimar la ruta mas segura , como el
costo de la póliza para cualquier jornada de la diligencia esta basada
en una evaluación de seguridad del recorrido, la ruta mas segura debe
ser aquella que tenga el costo total mas barato.
¿Cuál es la ruta que minimiza el costo total de la póliza ?
SISTEMA DE CAMINOS Y LOS COSTOS DEL PROBLEMA
DE LA DILIGENCIA
A
B
C
D
E
F
G
H
I
J
2
4
3
7
4
6
3
2
4
4
1
5
1
4
6
3
3
3
3
4
2 4 3
7 4 6
3 2 4
4 1 5
1 4
6 3
3 3
3
4
A
B C D
B
C
D
E F G
E
F
G
H I
J
H
I
Costos de
Transición:
Missouri California
SOLUCIÓ
N
 Los cálculos se realizan en etapas dividiendo el problema en
subproblemas.
 Después, se considera por separado cada subproblema con el fin de
reducir el número de operaciones de cálculo.
 Se comienza con una pequeña porción del problema original y se
encuentra la solución optima.
 Luego, se agranda gradualmente el problema y se encuentra la
solución óptima actual a partir de la que le precede , hasta resolver el
problema original completo.
 En cada problema aumentado se puede encontrar la solución óptima
tomando en cuenta los resultados obtenidos en la interacción anterior.
PROCEDIMIENTO DE SOLUCIÓN
Para este caso se empleará el desarrollo del problema con un
recorrido hacia atrás.
Cuando el cazafortunas tiene una sola etapa por recorrer (n=4), su
ruta de ahí en adelante esta perfectamente determinada por su
estado actual (ya sea H o I) y su destino final, x4 = J , de manera que
la ruta para esta ultima jornada en diligencias es s J
La solución al problema es:
f*
4 (H) = 3
f*
4 (I) =4
Cuando se tienen dos etapas por
recorrer (n=3), se analiza de la siguiente
manera: Supóngase que se encuentra en
el estado F, entonces como se ve en la
figura, se debe ir al estado H ó al estado
I. a un costo de CF,H = 6 ó CF,I =3. Si se
elige el estado H, el costo adicional
mínimo al llegar ahí es 3, por tanto el
costo de decisión es 6+3=9, de igual
manera si se elige el estado I, el costo
total es 3+4=7 que es menor por lo tanto
se escogerá el estado I.
PROCEDIMIENTO DE SOLUCIÓN
PROCEDIMIENTO DE SOLUCIÓN
Se trabaja de manera similar con los otros dos estados
posibles s=E y s=G, cuando quedan dos jornadas por
viajar,los resultados son:
f*
3 (E) = 4
f*
3 (F) = 7
f*
3 (G) =6
La solución para el problema de
tres etapas (n=2) se obtiene en
forma parecida. Por ejemplo
supóngase que el agente se
encuentra en el estado C, como
se muestra el diagrama. Ahora
deberá ir al estado E, F ó G con
un costo inmediato de CC,E =3 ó
CC,F =2 ó CC,G=4,
respectivamente.
PROCEDIMIENTO DE SOLUCIÓN
PROCEDIMIENTO DE SOLUCIÓN
Al llegar aquí el costo adicional mínimo hasta llegar a su destino
esta dado de la siguiente manera:
x2 = E
x2 = F
x2 =G
f2(C,E) = cC,E + f*
3(E) = 3 + 4 = 7
f2(C,F) = cC,F + f*
3(F) = 2 + 7 = 9
f2(C,G) = cC,G + f*
3(G) = 4 + 6 = 10
El mínimo de estos tres números es 7, por lo que el costo mínimo
desde el estado C al final es f*
2(C) = 7, y el destino inmediato debe
ser x*
2 =E.
Se realizan cálculos similares cuando se comienza desde el estado B
ó D. Los resultados son:
f*
2 (B) = 11 f*
2 (C) = 7 f*
2 (D) =8
PROCEDIMIENTO DE SOLUCIÓN
Si se pasa al problemade
cálculos son parecidos
los que se acaban
cuatro etapas (n=1), los
a
de
mostrar
para el problema de tres
etapas (n=2) , excepto que
ahora hay solo un inicio
posible, s=A , como se
muestra el diagrama.
PROCEDIMIENTO DE SOLUCIÓN
Los resultados se resumen de la siguiente manera :
x1 =B f1(A,B) = cA,B + f*
2(B) = 2 + 11 = 13
x1 =C f1(A,C) = cA,C + f*
2(C) = 4 + 7 = 11
x1 =D f1(A,D) = cA,D + f*
2(D) = 3 + 8 = 11
Como el mínimo costo es 11, por tanto los caminos pueden ser C ó D.
En este punto se puede identificar la solución óptima. Los resultados
indican los caminos óptimos a seguir:
A D E H J ó A D F I J, las dos tienen un costo total de 11
PROBLEMAS TÍPICOS DE P.D.
 1. PROBLEMA DE INVERSIÓN DE CAPITAL
 Veamos un problema simple de inversión de capital. Una
corporación tiene $5 millones para invertir en sus tres plantas
para una posible expansión. Cada planta ha presentado un
número de propuestas sobre como pretende gastar el dinero.
Cada propuesta entrega el costo de la expansión (c) y la
ganancia esperada (r). La siguiente tabla resume las propuestas:

Cada planta sólo podrá realizar una de sus propuestas. El
objetivo es maximizar el retorno de la firma dada su inversión de
$5 millones. Se supondrá que si no se gastan los $5 millones
completamente, ese dinero se perderá.
TABLA
Propuesta Planta 1 Planta 2 Planta 3
c1 r1 c2 r2 c3 r3
1 0 0 0 0 0 0
2 1 5 2 8 1 4
3 2 6 3 9 - -
4 - - 4 12 - -
INVERSIÓN DE CAPITAL
 Una forma de resolver este problema es intentar todas las
posibilidades y elegir la mejor. En ese caso, hay solo 3 x 4 x 2 = 24
formas de invertir el dinero. Muchas de estas son infactibles (por
ejemplo, propuestas 3, 4 y 1 para las tres plantas cuesta $6 millones).
Otras propuestas son factibles, pero son muy pobres en retorno (como
propuestas 1, 1 y 2, con un retorno de sólo $4 millones.)

 Desventajas de una enumeración
completa:


Para problemas de gran tamaño la enumeración de todas las
posibles soluciones puede no ser factible computacionalmente.
 Las combinacionesNO factibles no pueden ser detectadas a priori,
llevando a una ineficiencia.
 Información sobre combinaciones previamente investigadas no se
usan para eliminar otras combinaciones menos buenas, o no
factibles.
INVERSIÓN DE CAPITAL
 Cabe hacer notar que este problema no puede ser formulado como un
problema de programación lineal, porque los retornos no son funciones
lineales.
 Un método para calcular la solución
es:


Dividamos el problema en 3 etapas: cada etapa representa el dinero asignado a
una
única planta. Así la etapa 1 representa el dinero asignado a la planta 1.
Artificialmente se dará un orden a las etapas, asumiendo que primero se
asignaráa la planta 1, luego a la planta 2 y finalmente a la planta3.
 Cada etapa está dividida en estados. Un estado guarda la información
requerida para ir desde una etapa a la siguiente. En este caso los estados
por etapa 1, 2 y 3 son:
 {0,1,2,3,4,5}: cantidad de dinero gastado en la planta 1, representado como x1 ,
 {0,1,2,3,4,5}: cantidad de dinero gastado en las plantas 1 y 2 (x2), y
 {5}: cantidad de dinero gastado en las plantas 1, 2, y 3 (x3).
INVERSIÓN DE CAPITAL
 Es necesario notar que diferentemente a lo que es
programación lineal, las xi no representan variables
de decisión: ellas son simplemente representaciones
de un estado genérico en la etapa.
 Un retorno se asocia a cada estado. Se debe notar que
para tomar una decisión en el estado 3, es sólo
necesario conocer cuanto se gastó en las plantas 1 y 2,
no cómo esto fue gastado. También note que se desea
que x3 sea 5
 Determinando los retornos asociados a cada estado, lo
más fácil es en la etapa 1, los estados x1. La Tabla 2
muestra el retorno asociado con x1.
TABLA 2
Si el capital disponible
x1 es:
Entonces la propuesta
óptima es:
Y el retorno para la
etapa 1 es:
0 1 0
1 2 5
2 3 6
3 3 6
4 3 6
5 3 6
EL PROBLEMA DE LA MOCHILA.
 El problema de la mochila es un tipo particular
de programación entera con sólo una
restricción.
Cada artículo que puede ir en la mochila tiene
un tamaño y un beneficio asociado. La
mochila tiene una capacidad máxima. ¿Qué
se debe llevar en la
mochila para maximizar el beneficio total? A
modo de ejemplo supongamos que hay tres
artículos
como se muestra en la Tabla 3, y suponga que
la capacidad de la mochila es 5.
EL PROBLEMA DE LA MOCHILA
Artículo (j) Peso (wj) Beneficio (bj)
1 2 65
2 3 80
3 1 30
EL PROBLEMA DE LA MOCHILA
 Las etapas representan los artículos: luego se tienen
tres etapas j = 1,2,3. El estado yi en la etapa j
representa el peso total de los artículos j más todos
los artículos que se agregarán posteriormente a la
mochila. La decisión en el etapa j es cuántos
artículos j poner en la mochila. Sea ese valor kj.

 Luego se tienen las siguientes fórmulas recursivas:
Sea fj(yj) el valor de usar yj unidades de la capacidad
para artículos j más los que se agregarán. Si [a]
representa el mayor entero menor o igual a a.
PROBLEMA DE LA MOCHILA
REEMPLAZO DE EQUIPO
  Suponga que un negocio necesita tener una
máquina en los próximos 5 años. Cada máquina nueva
tiene un costo $1000. El costo de mantener la
máquina durante el año i-ésimo de operación es: m1 =
$60, m2 = $80, y m3 = $120. Una máquina se puede usar
por tres años y luego ser rematada. El valor de remate
de la máquina después de i años es s1 = $800, s2 = $600
, y s3 = $500.¿Cómo podría minimizar los costos el
dueño del negocio sobre un período de 5 años?.
  Las etapas están asociadas a cada año. El estado
será la edad de la máquina en ese año. Las decisiones
son ya sea mantener la máquina o rematarla y
reemplazarla por una nueva.
 Sea ft(x) el mínimo costo desde el instante t al 5, dado
que la
 máquina tiene x años de antigüedad en el instante t.
CONCLUSIONES
  Un problema de optimización que se pueda
dividir en etapas y que sea dinámico en el tiempo
puede resolverse por programación dinámica.
  Las soluciones se pueden ver de manera
parcial.
  Si es posible se validan los resultados usando otros
métodos de solución como programación lineal, no
lineal, entera o teoría de redes.
BIBLIOGRAFÍA
 Bertsekas,D.P., "Dynamic Programming;
Deterministic and Stochastic Models"Academic
Press, 1987.
 Dreyfus S.E. y Law A.M., "The Art and Theory of
Dynamic Programming", Academic Press, 1977.
 Hiller, F. S. “Introducción a la Investigación de
Operaciones”. 2008
 Taha, H. A. “Investigación de Operaciones”. 2005

Más contenido relacionado

PPTX
Programación Dinamica
PDF
Programacion dinamica
PPTX
Presentación: Programación Dinámica
PDF
Programación dinámica
DOCX
Programación dinámica
DOCX
Ejercicios intervalos de confianza
PPTX
Prueba de hipotesis
PDF
Estimacion y desviacion
Programación Dinamica
Programacion dinamica
Presentación: Programación Dinámica
Programación dinámica
Programación dinámica
Ejercicios intervalos de confianza
Prueba de hipotesis
Estimacion y desviacion

La actualidad más candente (20)

DOC
DECISIONES EN INCERTIDUMBRE
DOCX
Ejemplos prueba de hipótesis
PPTX
Intervalos de Confianza
PDF
Estimadores puntuales intervalos de confianza.
DOCX
Intervalos de confianza (7)
PPT
Pruebas para una Media Poblacional: Muestra Grande y Desviación Estándar Pobl...
PPTX
Pruebas de hipótesis
PDF
PDF
Capitulo5 estimacion por_intervalo_es_de_confianza (2)
DOCX
Universidad Tecnológica de Torreón
PPT
Estadistica aplicada
PDF
PRUEBA DE HIPOTESIS
PDF
Estadistica aplicada
PDF
Examen del basico2003
DOC
Contraste de hipotesis para la media
PPT
Prog dinamica
DOCX
Intervalos de confianza
PPTX
Mic sesión 8a
PPTX
Criterios de incertidumbre
PPT
Intervalos de confianza
DECISIONES EN INCERTIDUMBRE
Ejemplos prueba de hipótesis
Intervalos de Confianza
Estimadores puntuales intervalos de confianza.
Intervalos de confianza (7)
Pruebas para una Media Poblacional: Muestra Grande y Desviación Estándar Pobl...
Pruebas de hipótesis
Capitulo5 estimacion por_intervalo_es_de_confianza (2)
Universidad Tecnológica de Torreón
Estadistica aplicada
PRUEBA DE HIPOTESIS
Estadistica aplicada
Examen del basico2003
Contraste de hipotesis para la media
Prog dinamica
Intervalos de confianza
Mic sesión 8a
Criterios de incertidumbre
Intervalos de confianza
Publicidad

Similar a PROGRAMACIÓN DINÁMICA Oscar guarimata 27455059 (20)

PDF
Sesion6_IdaliaFlores_20abr15 (1).pdf
PPTX
Programacion
PPTX
Programacion dinamica
PPTX
Programación Dinámica
PPTX
Programacion dinamica jesus plaza
DOCX
61178886 i-o-ii-principal
PPTX
Programacion dinamica
DOCX
ProgDinamica.docx
PPTX
Programacion Dinamica
PPTX
Programación dinamica (ea)
PPTX
Pro no num Prog dinamica
PPTX
programacion dinámica 1
PDF
PROGRAMACION DINAMICA
PPTX
Unidad IV-ProgramaciónDinámica-VersiónFinal.pptx
DOCX
Programación deterministica
PDF
Programación dinámica (apuntes)
PDF
Baixardoc.com unidad-1-programacion-dinamica
PDF
Baixardoc.com unidad-1-programacion-dinamica
PDF
Baixardoc.com unidad-1-programacion-dinamica
PDF
programacion dinamica, paso a paso en la res
Sesion6_IdaliaFlores_20abr15 (1).pdf
Programacion
Programacion dinamica
Programación Dinámica
Programacion dinamica jesus plaza
61178886 i-o-ii-principal
Programacion dinamica
ProgDinamica.docx
Programacion Dinamica
Programación dinamica (ea)
Pro no num Prog dinamica
programacion dinámica 1
PROGRAMACION DINAMICA
Unidad IV-ProgramaciónDinámica-VersiónFinal.pptx
Programación deterministica
Programación dinámica (apuntes)
Baixardoc.com unidad-1-programacion-dinamica
Baixardoc.com unidad-1-programacion-dinamica
Baixardoc.com unidad-1-programacion-dinamica
programacion dinamica, paso a paso en la res
Publicidad

Último (20)

PPTX
RCP avanzado_Luis Minaya_ Septiembre 25.pptx
PDF
Házlo con Miedo - Scott Allan Ccesa007.pdf
DOCX
TEXTO DE TRABAJO DE EDUCACION RELIGIOSA - PRIMER GRADO.docx
PDF
Temas a elegir para desarrollar oralmente 2do cuatri 2025.pdf
PDF
ciencia_tecnologia_sociedad Mitcham Carl. (1994)..pdf
PDF
Las Matematicas y el Pensamiento Cientifico SE3 Ccesa007.pdf
PDF
Diversos-Rostros-de-la-EPJA-una-vision-desde-universidades-publicas-latinoame...
DOCX
TEXTO DE TRABAJO DE EDUCACION RELIGIOSA - TERCER GRADO.docx
DOCX
PCI LARAOS 2025. 2024 documento de gestión
PDF
Guía de Genética de aces descargado de manera libre
PDF
Didáctica de las literaturas infantiles.
PDF
COLECCIÓN DE PENSADORES FILOSÓFICOS MÁS REPRESENTATIVOS.
PDF
EP2_CONTACTO_GRUPO INICIACIÓN_2024 (1).pdf
PDF
Aprendizaje Emocionante - Begoña Ibarrola SM2 Ccesa007.pdf
PDF
KOF-2022-espanol-mar-27-11-36 coke.pdf tv
PPTX
preeclampsia + eclampsia, sindrome de HeLLP
PDF
Estadística Aplicada a la Psicología y Ciencias de la Salud Ccesa.pdf
PDF
PROSPECTO_ADMISION_PRESENCIAL_2025Medici
PDF
Cuaderno_Castellano_6°_grado.pdf 000000000000000001
PDF
EXODO …La Vida Cristiana. Por Jonathan Bravo
RCP avanzado_Luis Minaya_ Septiembre 25.pptx
Házlo con Miedo - Scott Allan Ccesa007.pdf
TEXTO DE TRABAJO DE EDUCACION RELIGIOSA - PRIMER GRADO.docx
Temas a elegir para desarrollar oralmente 2do cuatri 2025.pdf
ciencia_tecnologia_sociedad Mitcham Carl. (1994)..pdf
Las Matematicas y el Pensamiento Cientifico SE3 Ccesa007.pdf
Diversos-Rostros-de-la-EPJA-una-vision-desde-universidades-publicas-latinoame...
TEXTO DE TRABAJO DE EDUCACION RELIGIOSA - TERCER GRADO.docx
PCI LARAOS 2025. 2024 documento de gestión
Guía de Genética de aces descargado de manera libre
Didáctica de las literaturas infantiles.
COLECCIÓN DE PENSADORES FILOSÓFICOS MÁS REPRESENTATIVOS.
EP2_CONTACTO_GRUPO INICIACIÓN_2024 (1).pdf
Aprendizaje Emocionante - Begoña Ibarrola SM2 Ccesa007.pdf
KOF-2022-espanol-mar-27-11-36 coke.pdf tv
preeclampsia + eclampsia, sindrome de HeLLP
Estadística Aplicada a la Psicología y Ciencias de la Salud Ccesa.pdf
PROSPECTO_ADMISION_PRESENCIAL_2025Medici
Cuaderno_Castellano_6°_grado.pdf 000000000000000001
EXODO …La Vida Cristiana. Por Jonathan Bravo

PROGRAMACIÓN DINÁMICA Oscar guarimata 27455059

  • 1. Profesor: José A Castillo Bachiller: Oscar Guarimata C.I 27455059 Instituto Universitario Politécnico SantiagoMariño Extensión Maturín Escuela de IngenieríaIndustrial Julio del 2020
  • 2. CONCEPTOS  La programación dinámica es una técnica matemática que se utiliza para la solución de problemas matemáticos seleccionados, en los cuales se toma un serie de decisiones en forma secuencial.  Proporciona un procedimiento sistemático para encontrar la combinación de decisiones que maximice la efectividad total, al descomponer el problema en etapas, las que pueden ser completadas por una o más formas (estados), y enlazando cada etapa a través de cálculos recursivos.
  • 3. DEFINICIONES  Etapa: es la parte del problema que posee un conjunto de alternativas mutuamente excluyentes, de las cuales se seleccionará la mejor alternativa.  Estado: es el que refleja la condición o estado de las restricciones que enlazan las etapas. Representa la “liga” entre etapas de tal manera que cuando cada etapa se optimiza por separado la decisión resultante es automáticamente factible para el problema completo.
  • 4. ESQUEMA DE UNA ETAPA qi Variable de estado en la etapai Xij Uno de los valores que puede adoptar la variable de decisión “Xi” en la etapa i iX* Decisión óptima de la etapai ETAPAi X i1 X ij X iJ .... .... E S T A D O S Xi * qi RESTO
  • 5. FORMULACIÓN Y SOLUCIÓN DE PROBLEMAS  La programación dinámica no cuenta con una formulación matemática estándar, sino que se trata de un enfoque de tipo general para la solución de problemas, y las ecuaciones específicas que se usan se deben desarrollar para que representen cada situación individual.  Comúnmente resuelve el problema por etapas, en donde cada etapa interviene exactamente una variable de optimización (u optimizadora)
  • 6.  La teoría unificadora fundamental de la programación dinámica es el Principio de Optimalidad, que nos indica básicamente como se puede resolver un problema adecuadamente descompuesto en etapas utilizando cálculos recursivos.  “Una política óptima tiene la propiedad de que, independientemente de las decisiones tomadas para llegar a un estado particular, en una etapa particular, las decisiones restantes deben constituir una política óptima para abandonar ese estado”,
  • 7. PARA RESOLVER PROBLEMAS DE PROGRAMACIÓN DINÁMICA SE NECESITA:  Un grado de creatividad  Un buen conocimiento de la estructura general de los problemas de programación dinámica para reconocer cuando un problema se puede resolver por medio de estos procedimientos y como esto se puede llevar a cabo.
  • 8. CARACTERÍSTICAS DE LOS PROBLEMAS DE PROGRAMACIÓN DINÁMICA que requieren una El problema se puede dividir en etapas política de decisión en cada una.  Cada etapa tiene cierto número de estados asociados a ella.  El efecto de la política de decisión en cada etapa es transformar el estado actual en un estado asociado con la siguiente etapa.  El procedimiento de solución esta diseñado para encontrar una política óptima para el problema completo.
  • 9. CARACTERÍSTICAS DE LOS PROBLEMAS DE PROGRAMACIÓN DINÁMICA  Dado un estado actual, una política óptima para las etapas restantes es independiente de la política adoptada en las etapas anteriores (principio de optimalidad).  El procedimiento de solución se inicia al encontrar la política optima para la ultima etapa.  Se dispone de una relación recursiva que identifica la política optima par la etapa n dada la política optima para la etapa (n+1)
  • 10. RECURSIVIDAD Existen dos formas de plantear la fórmula de recursividad en los problemas de programación dinámica:  Recursividad de Retroceso: el problema se resuelva partiendo de la última etapa hacia la primera.  Recursividad de Avance: el problema se resuelve partiendo de la primera etapa hacia la última.
  • 11. RECURSIVIDAD Las formulaciones de avance y retroceso son en realidad equivalentes en términos de cálculo. Sin embargo, hay situaciones donde habría alguna diferencia, en la eficiencia del cálculo, según la formulación que se utilice. Esto sucede en particular en problemas donde intervine la toma de decisiones conforme transcurre el tiempo. En esto caso las etapas se designan con base en el estricto orden cronológico de los periodos que ellas representan y la eficiencia de los cálculos dependerá de si se utiliza formulación de avance o retroceso.
  • 13. EJEMPLO PROTOTIPO (EL PROBLEMA DE LA DILIGENCIA) Un caza fortunas de Missouri decide irse al oeste a unirse a la fiebre del oro en California . Tiene que hacer el viaje en diligencia a través de territorios sin ley donde existían serios peligros de ser atacados por merodeadores. Aún cuando su punto de partida y destino eran fijos, tenia muchas opciones en cuanto a que estados debía elegir como puntos intermedios. Se desea estimar la ruta mas segura , como el costo de la póliza para cualquier jornada de la diligencia esta basada en una evaluación de seguridad del recorrido, la ruta mas segura debe ser aquella que tenga el costo total mas barato. ¿Cuál es la ruta que minimiza el costo total de la póliza ?
  • 14. SISTEMA DE CAMINOS Y LOS COSTOS DEL PROBLEMA DE LA DILIGENCIA A B C D E F G H I J 2 4 3 7 4 6 3 2 4 4 1 5 1 4 6 3 3 3 3 4 2 4 3 7 4 6 3 2 4 4 1 5 1 4 6 3 3 3 3 4 A B C D B C D E F G E F G H I J H I Costos de Transición: Missouri California
  • 15. SOLUCIÓ N  Los cálculos se realizan en etapas dividiendo el problema en subproblemas.  Después, se considera por separado cada subproblema con el fin de reducir el número de operaciones de cálculo.  Se comienza con una pequeña porción del problema original y se encuentra la solución optima.  Luego, se agranda gradualmente el problema y se encuentra la solución óptima actual a partir de la que le precede , hasta resolver el problema original completo.  En cada problema aumentado se puede encontrar la solución óptima tomando en cuenta los resultados obtenidos en la interacción anterior.
  • 16. PROCEDIMIENTO DE SOLUCIÓN Para este caso se empleará el desarrollo del problema con un recorrido hacia atrás. Cuando el cazafortunas tiene una sola etapa por recorrer (n=4), su ruta de ahí en adelante esta perfectamente determinada por su estado actual (ya sea H o I) y su destino final, x4 = J , de manera que la ruta para esta ultima jornada en diligencias es s J La solución al problema es: f* 4 (H) = 3 f* 4 (I) =4
  • 17. Cuando se tienen dos etapas por recorrer (n=3), se analiza de la siguiente manera: Supóngase que se encuentra en el estado F, entonces como se ve en la figura, se debe ir al estado H ó al estado I. a un costo de CF,H = 6 ó CF,I =3. Si se elige el estado H, el costo adicional mínimo al llegar ahí es 3, por tanto el costo de decisión es 6+3=9, de igual manera si se elige el estado I, el costo total es 3+4=7 que es menor por lo tanto se escogerá el estado I. PROCEDIMIENTO DE SOLUCIÓN
  • 18. PROCEDIMIENTO DE SOLUCIÓN Se trabaja de manera similar con los otros dos estados posibles s=E y s=G, cuando quedan dos jornadas por viajar,los resultados son: f* 3 (E) = 4 f* 3 (F) = 7 f* 3 (G) =6
  • 19. La solución para el problema de tres etapas (n=2) se obtiene en forma parecida. Por ejemplo supóngase que el agente se encuentra en el estado C, como se muestra el diagrama. Ahora deberá ir al estado E, F ó G con un costo inmediato de CC,E =3 ó CC,F =2 ó CC,G=4, respectivamente. PROCEDIMIENTO DE SOLUCIÓN
  • 20. PROCEDIMIENTO DE SOLUCIÓN Al llegar aquí el costo adicional mínimo hasta llegar a su destino esta dado de la siguiente manera: x2 = E x2 = F x2 =G f2(C,E) = cC,E + f* 3(E) = 3 + 4 = 7 f2(C,F) = cC,F + f* 3(F) = 2 + 7 = 9 f2(C,G) = cC,G + f* 3(G) = 4 + 6 = 10 El mínimo de estos tres números es 7, por lo que el costo mínimo desde el estado C al final es f* 2(C) = 7, y el destino inmediato debe ser x* 2 =E. Se realizan cálculos similares cuando se comienza desde el estado B ó D. Los resultados son: f* 2 (B) = 11 f* 2 (C) = 7 f* 2 (D) =8
  • 21. PROCEDIMIENTO DE SOLUCIÓN Si se pasa al problemade cálculos son parecidos los que se acaban cuatro etapas (n=1), los a de mostrar para el problema de tres etapas (n=2) , excepto que ahora hay solo un inicio posible, s=A , como se muestra el diagrama.
  • 22. PROCEDIMIENTO DE SOLUCIÓN Los resultados se resumen de la siguiente manera : x1 =B f1(A,B) = cA,B + f* 2(B) = 2 + 11 = 13 x1 =C f1(A,C) = cA,C + f* 2(C) = 4 + 7 = 11 x1 =D f1(A,D) = cA,D + f* 2(D) = 3 + 8 = 11 Como el mínimo costo es 11, por tanto los caminos pueden ser C ó D. En este punto se puede identificar la solución óptima. Los resultados indican los caminos óptimos a seguir: A D E H J ó A D F I J, las dos tienen un costo total de 11
  • 23. PROBLEMAS TÍPICOS DE P.D.  1. PROBLEMA DE INVERSIÓN DE CAPITAL  Veamos un problema simple de inversión de capital. Una corporación tiene $5 millones para invertir en sus tres plantas para una posible expansión. Cada planta ha presentado un número de propuestas sobre como pretende gastar el dinero. Cada propuesta entrega el costo de la expansión (c) y la ganancia esperada (r). La siguiente tabla resume las propuestas:  Cada planta sólo podrá realizar una de sus propuestas. El objetivo es maximizar el retorno de la firma dada su inversión de $5 millones. Se supondrá que si no se gastan los $5 millones completamente, ese dinero se perderá.
  • 24. TABLA Propuesta Planta 1 Planta 2 Planta 3 c1 r1 c2 r2 c3 r3 1 0 0 0 0 0 0 2 1 5 2 8 1 4 3 2 6 3 9 - - 4 - - 4 12 - -
  • 25. INVERSIÓN DE CAPITAL  Una forma de resolver este problema es intentar todas las posibilidades y elegir la mejor. En ese caso, hay solo 3 x 4 x 2 = 24 formas de invertir el dinero. Muchas de estas son infactibles (por ejemplo, propuestas 3, 4 y 1 para las tres plantas cuesta $6 millones). Otras propuestas son factibles, pero son muy pobres en retorno (como propuestas 1, 1 y 2, con un retorno de sólo $4 millones.)   Desventajas de una enumeración completa:   Para problemas de gran tamaño la enumeración de todas las posibles soluciones puede no ser factible computacionalmente.  Las combinacionesNO factibles no pueden ser detectadas a priori, llevando a una ineficiencia.  Información sobre combinaciones previamente investigadas no se usan para eliminar otras combinaciones menos buenas, o no factibles.
  • 26. INVERSIÓN DE CAPITAL  Cabe hacer notar que este problema no puede ser formulado como un problema de programación lineal, porque los retornos no son funciones lineales.  Un método para calcular la solución es:   Dividamos el problema en 3 etapas: cada etapa representa el dinero asignado a una única planta. Así la etapa 1 representa el dinero asignado a la planta 1. Artificialmente se dará un orden a las etapas, asumiendo que primero se asignaráa la planta 1, luego a la planta 2 y finalmente a la planta3.  Cada etapa está dividida en estados. Un estado guarda la información requerida para ir desde una etapa a la siguiente. En este caso los estados por etapa 1, 2 y 3 son:  {0,1,2,3,4,5}: cantidad de dinero gastado en la planta 1, representado como x1 ,  {0,1,2,3,4,5}: cantidad de dinero gastado en las plantas 1 y 2 (x2), y  {5}: cantidad de dinero gastado en las plantas 1, 2, y 3 (x3).
  • 27. INVERSIÓN DE CAPITAL  Es necesario notar que diferentemente a lo que es programación lineal, las xi no representan variables de decisión: ellas son simplemente representaciones de un estado genérico en la etapa.  Un retorno se asocia a cada estado. Se debe notar que para tomar una decisión en el estado 3, es sólo necesario conocer cuanto se gastó en las plantas 1 y 2, no cómo esto fue gastado. También note que se desea que x3 sea 5  Determinando los retornos asociados a cada estado, lo más fácil es en la etapa 1, los estados x1. La Tabla 2 muestra el retorno asociado con x1.
  • 28. TABLA 2 Si el capital disponible x1 es: Entonces la propuesta óptima es: Y el retorno para la etapa 1 es: 0 1 0 1 2 5 2 3 6 3 3 6 4 3 6 5 3 6
  • 29. EL PROBLEMA DE LA MOCHILA.  El problema de la mochila es un tipo particular de programación entera con sólo una restricción. Cada artículo que puede ir en la mochila tiene un tamaño y un beneficio asociado. La mochila tiene una capacidad máxima. ¿Qué se debe llevar en la mochila para maximizar el beneficio total? A modo de ejemplo supongamos que hay tres artículos como se muestra en la Tabla 3, y suponga que la capacidad de la mochila es 5.
  • 30. EL PROBLEMA DE LA MOCHILA Artículo (j) Peso (wj) Beneficio (bj) 1 2 65 2 3 80 3 1 30
  • 31. EL PROBLEMA DE LA MOCHILA  Las etapas representan los artículos: luego se tienen tres etapas j = 1,2,3. El estado yi en la etapa j representa el peso total de los artículos j más todos los artículos que se agregarán posteriormente a la mochila. La decisión en el etapa j es cuántos artículos j poner en la mochila. Sea ese valor kj.   Luego se tienen las siguientes fórmulas recursivas: Sea fj(yj) el valor de usar yj unidades de la capacidad para artículos j más los que se agregarán. Si [a] representa el mayor entero menor o igual a a.
  • 32. PROBLEMA DE LA MOCHILA
  • 33. REEMPLAZO DE EQUIPO   Suponga que un negocio necesita tener una máquina en los próximos 5 años. Cada máquina nueva tiene un costo $1000. El costo de mantener la máquina durante el año i-ésimo de operación es: m1 = $60, m2 = $80, y m3 = $120. Una máquina se puede usar por tres años y luego ser rematada. El valor de remate de la máquina después de i años es s1 = $800, s2 = $600 , y s3 = $500.¿Cómo podría minimizar los costos el dueño del negocio sobre un período de 5 años?.   Las etapas están asociadas a cada año. El estado será la edad de la máquina en ese año. Las decisiones son ya sea mantener la máquina o rematarla y reemplazarla por una nueva.  Sea ft(x) el mínimo costo desde el instante t al 5, dado que la  máquina tiene x años de antigüedad en el instante t.
  • 34. CONCLUSIONES   Un problema de optimización que se pueda dividir en etapas y que sea dinámico en el tiempo puede resolverse por programación dinámica.   Las soluciones se pueden ver de manera parcial.   Si es posible se validan los resultados usando otros métodos de solución como programación lineal, no lineal, entera o teoría de redes.
  • 35. BIBLIOGRAFÍA  Bertsekas,D.P., "Dynamic Programming; Deterministic and Stochastic Models"Academic Press, 1987.  Dreyfus S.E. y Law A.M., "The Art and Theory of Dynamic Programming", Academic Press, 1977.  Hiller, F. S. “Introducción a la Investigación de Operaciones”. 2008  Taha, H. A. “Investigación de Operaciones”. 2005