Multiplicadores de Lagrange

método para resolver problemas de optimización dscon restricciones

En los problemas de optimización, el método de los multiplicadores de Lagrange, llamados así en honor a Joseph Louis Lagrange, es un procedimiento para encontrar los máximos y mínimos relativos (o locales) de funciones de múltiples variables sujetas a restricciones.[1]​ Este método reduce el problema restringido con n variables a uno sin restricciones de n + k variables, donde k es igual al número de restricciones, y cuyas ecuaciones pueden ser resueltas más fácilmente. Estas nuevas variables escalares desconocidas, una para cada restricción, son llamadas multiplicadores de Lagrange. El método dice que los puntos donde la función tiene un extremo condicionado con k restricciones, están entre los puntos estacionarios de una nueva función sin restricciones construida como una combinación lineal de la función y las funciones implicadas en las restricciones, cuyos coeficientes son los multiplicadores.

La demostración usa derivadas parciales y la regla de la cadena para funciones de varias variables. Se trata de extraer una función implícita de las restricciones, y encontrar las condiciones para que las derivadas parciales con respecto a las variables independientes de la función sean iguales a cero.

Introducción

editar

Consideremos un caso tridimensional. Supongamos que tenemos la función, f (x, y), y queremos maximizarla, estando sujeta a la condición:

 

donde c es una constante. Podemos visualizar las curvas de nivel de f dadas por

 

para varios valores de dn, y el contorno de g dado por g(x, y) = c. Supongamos que hablamos de la curva de nivel donde g = c. Entonces, en general, las curvas de nivel de f y g serán distintas, y la curva g = c por lo general intersectará y cruzará muchos contornos de f. En general, moviéndose a través de la línea g=c podemos incrementar o disminuir el valor de f. Sólo cuando g=c (el contorno que estamos siguiendo) toca tangencialmente (no corta) una curva de nivel de f, no se incrementa o disminuye el valor de f. Esto ocurre en el extremo local restringido y en los puntos de inflexión restringidos de f.

Un ejemplo familiar puede ser obtenido de los mapas climatológicos, con sus curvas de nivel de presión y temperatura (isóbaras e isotermas respectivamente): el extremo restringido ocurrirá donde los mapas superpuestos muestren curvas que se tocan.

Geométricamente traducimos la condición de tangencia diciendo que los gradientes de f y g son vectores paralelos en el máximo. Introduciendo un nuevo escalar, λ, resolvemos

 [f(x, y) - λ (g(x, y) − c)] = 0

para λ ≠ 0.

Una vez determinados los valores de λ, volvemos al número original de variables y así continuamos encontrando el extremo de la nueva ecuación no restringida.

 

de forma tradicional. Eso es,   para todo (x, y) satisfaciendo la condición porque   es igual a cero en la restricción, pero los ceros de  F(x, y) están todos en  .

El método de los multiplicadores de Lagrange

editar

Sea f (x) una función definida en un conjunto abierto n-dimensional {xRn}. Se definen s restricciones gk (x) = 0, k=1,..., s, y se observa (si las restricciones son satisfechas) que:

 

Se procede a buscar un extremo para h

 

lo que es equivalente a

 
Demostración
Comencemos con el caso de una restricción.

Sea una superficie M contenida en Rn definida por g(x)=0 y sea f(x) la función a obtener su punto crítico. Si p   M un punto crítico entonces se ha de cumplir:

 

para todo v vector tangente a M en p (es decir, sea cual sea la dirección en la que nos desplacemos en M, el incremento de f a primer orden es nulo) La anterior condición significa que   es perpendicular al tangente a M en p y dado que dim M=n-1 existe un único vector perpendicular linealmente independiente que viene dado por  , de modo que se tiene:

 

para algún número  

En el caso de que M esté definida por varias restricciones   el conjunto de vectores perpendiculares al tangente a M en p viene generado por   de modo que al ser   perpendicular al vector tangente a M en p este ha de ser de la forma:

 

para unos ciertos números  


Los multiplicadores desconocidos λk se determinan a partir de las ecuaciones con las restricciones y conjuntamente se obtiene un extremo para h que al mismo tiempo satisface las restricciones (i.e. gk=0), lo que implica que f ha sido optimizada

El método de multiplicadores de Lagrange es generalizado por las condiciones de Karush-Kuhn-Tucker.

Ejemplos

editar

Ejemplo 1

editar

Supongamos que queremos encontrar la distribución probabilística discreta con máxima entropía. Entonces

 
 

Podemos usar los multiplicadores de Lagrange para encontrar el punto de máxima entropía (dependiendo de las probabilidades). Para todo k desde 1 hasta n, necesitamos

 

lo que nos da

 

Derivando estas n ecuaciones, obtenemos

 

Esto muestra que todo pi es igual (debido a que depende solamente de λ). Usando la restricción ∑k pk = 1, encontramos

 

Esta (la distribución uniforme discreta) es la distribución con la mayor entropía.

Ejemplo 2

editar

Determinar los puntos en la esfera   que están más cercanos al punto  

la distancia al punto  :

 

para hacer más sencilla la operación se maximiza o minimiza el cuadrado de la distancia:

 


la restricción:  

De acuerdo con el método de los multiplicadores de Lagrange, se resuelven las ecuaciones "   " y " " y el resultado es:

                          (1)  
                          (2)  
                          (3)  
                          (4)  

la manera más sencilla de resolver estas ecuaciones es dejar x, y, z en función de   y luego sustituimos en la ecuación (4).

En primer lugar se observa que   ≠ 1 porque si   obtenemos un resultado absurdo en la ecuación (1). Ahora, de la ecuación (1) obtenemos  

y lo mismo sucede con las ecuaciones (2) y (3):

 

 .

Sustituyendo en la ecuación (4)

 

se obtiene que  

y entonces los puntos (x, y, z) son :


  y  

Uno de ellos es el más lejano (máximo de la función), y se puede observar que el punto más cercano es  

Ejemplo 3 (restricciones múltiples)

editar

 

Restricciones:
 

 

Aplicar el método:  

 

 

 

Entonces:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Por lo tanto, los puntos críticos son:

 

 

 

 

Bastará entonces evaluar la función en esos puntos para determinar que:

 

 

por lo que en ambos puntos   tiene un máximo en   y un mínimo en   si está restringida de esta manera.

Criterio de la segunda derivada para Extremos con Restricción

editar

El caso bidimensional

editar

Como en el caso no restringido en el que usamos la matriz Hessiana y el criterio de Sylvester para determinar la naturaleza de los puntos críticos, en presencia de multiplicadores de Lagrange existe un método análogo para descubrir si un punto crítico v0 es máximo, mínimo, o punto silla.

Sean f:U⊂ℝ2→ℝ y g:U⊂ℝ2→ℝ dos curvas suaves de clase C2. Sea v0∈U tal que g(v0)= c y sea S el conjunto de nivel de g con valor c. Asumimos que  g(v0)≠0 y existe un número real   tal que  f(v0) =  g(v0). Para la función auxiliar h = f -  g tenemos la matriz hessiana limitada:

  evaluada en v0
  1. Si |H|>0 entonces v0 es un máximo local en f limitada a S
  2. Si |H|<0 entonces v0 es un mínimo local en f limitada a S
  3. Si |H|=0 entonces el criterio no concluye nada

El caso n-dimensional

editar

Análogamente al caso bidimensional, consideramos el caso n-dimensional, Sea f:U⊂ℝn→ℝ y g:U⊂ℝn→ℝ dos curvas suaves de clase C2. Sea v0∈U tal que g(v0)= c y sea S elconjunto de nivel de g con valor c. Asumimos que  g(v0)≠0 y existe un número real   tal que  f(v0) =  g(v0). Para la función auxiliar h = f -  g construimos la matriz hessiana limitada:

  evaluada en v0

Examinamos los determinantes de las submatrices en la diagonal de orden mayor o igual a 3:

  1. Si todos ellos son menores que 0, tenemos un mínimo local en v0
  2. Si el primer subdeterminante de tamaño 3x3 es mayor que cero, el siguiente (el de 4x4) es menor que cero, y de esa manera los subdeterminantes van alternando su signo, tenemos un máximo local en v0
  3. Si todos los subdeterminantes son distintos de cero, pero no siguen ninguno de los dos patrones anteriores, tenemos un punto silla en v0
  4. Si no se da ninguno de los tres casos anteriores, el criterio no concluye nada

Referencias

editar
  1. Hoffmann, Laurence D.; Bradley, Gerald L.; Rosen, Kenneth H. (2004). Calculus for Business, Economics, and the Social and Life Sciences (8a edición). Nueva York; Londres: McGraw-Hill. pp. 575-588. ISBN 0071217827. 

Enlaces externos

editar