Método de Laplace
En matemáticas, el método de Laplace, llamado así por Pierre-Simon Laplace, es una técnica utilizada para aproximar integrales de la forma
dónde es una función dos veces diferenciable, es un número grande y los puntos finales y Podría ser infinito. Esta técnica fue presentada originalmente en el libro de Laplace (1774).
En estadística bayesiana, la aproximación de Laplace puede referirse a la aproximación de la constante de normalización posterior con el método de Laplace o a la aproximación de la distribución posterior con una gaussiana centrada en la estimación máxima a posteriori.[1][2] Las aproximaciones de Laplace se utilizan en el método de aproximaciones de Laplace anidadas integradas para aproximaciones rápidas de inferencia bayesiana.
Concepto
editarSea la función tener un máximo global único en . Es una constante aquí. Se consideran las dos funciones siguientes:
Entonces, es el máximo global de y también. Por eso:
A medida que M aumenta, la relación entre crecerá exponencialmente, mientras que la proporción de No cambia. Por lo tanto, las contribuciones significativas a la integral de esta función provendrán únicamente de los puntos En un entorno de , que luego puede estimarse.
Teoría general
editarPara enunciar y motivar el método es necesario hacer varias suposiciones. Se supone que no es un punto final del intervalo de integración y que los valores No puede estar muy cerca de a menos que está cerca de .
se puede expandir alrededor de x 0 por el teorema de Taylor,
dónde (ver: cota superior asintótica).
Desde tiene un máximo global en , y no es un punto final, es un punto estacionario, es decir . Por lo tanto, el polinomio de Taylor de segundo orden se aproxima es
Luego sólo se necesita un paso más para obtener una distribución gaussiana. Desde es un máximo global de la función Se puede afirmar, por definición de la segunda derivada, que , dando así la relación
para cerca de . La integral puede entonces aproximarse con:
Si Esta última integral se convierte en una integral gaussiana si reemplazamos los límites de integración por y ; cuando es grande, esto crea solo un pequeño error porque el exponente decae muy rápido a partir de . Calculando esta integral gaussiana obtenemos:
Una generalización de este método y una extensión a precisión arbitraria la proporciona el libro Fog (2008).
Declaración formal y prueba
editarSupongamos que 𝑓(𝑥) es una función que tiene derivadas continuas hasta el segundo orden en el intervalo [𝑎, 𝑏], y que existe un único punto 𝑥₀ en el intervalo (𝑎, 𝑏) que satisface la siguiente condición:
Entonces:
Otras formulaciones
editarLa aproximación de Laplace a veces se escribe como
dónde Es positivo.
Es importante destacar que la precisión de la aproximación depende de la variable de integración, es decir, de lo que permanece en ¿Y qué entra en [3]
dónde es la matriz hessiana de evaluado en Y donde denota determinante de matriz . De manera análoga al caso univariado, se requiere que la hessiana sea definida negativamente.[4]
Por cierto, aunque denota un -vector dimensional, el término denota aquí un volumen infinitesimal, es decir .
Extensión de descenso más pronunciado
editarEn las extensiones del método de Laplace, se utiliza el análisis complejo, y en particular la fórmula integral de Cauchy, para encontrar un contorno de descenso más pronunciado para una integral equivalente (asintóticamente con M grande), expresada como una integral de línea. En particular, si no hay ningún punto x 0 donde la derivada de Si se desvanece la función en la línea real, puede ser necesario deformar el contorno de integración a uno óptimo, donde será posible el análisis anterior. Nuevamente, la idea principal es reducir, al menos asintóticamente, el cálculo de la integral dada al de una integral más simple que pueda evaluarse explícitamente. Véase el libro de Erdelyi (1956) para una discusión sencilla (donde el método se denomina descensos más pronunciados).
La formulación adecuada para el plano z complejo es
para una trayectoria que pasa por el punto de silla en z0. Nótese la aparición explícita de un signo menos para indicar la dirección de la segunda derivada: no se debe tomar el módulo. Tenga en cuenta también que si el integrando es meromórfico, es posible que haya que añadir residuos correspondientes a los polos recorridos mientras se deforma el contorno (véase, por ejemplo, la sección 3 del artículo de Okounkov Funciones simétricas y particiones aleatorias).
Otras generalizaciones
editarUna extensión del método de descenso más pronunciado es el llamado método de fase estacionaria no lineal/descenso más pronunciado . Aquí, en lugar de integrales, es necesario evaluar asintóticamente soluciones de problemas de factorización de Riemann-Hilbert.
Dado un contorno C en la esfera compleja, una función definida sobre ese contorno y un punto especial, como el infinito, se busca una función holomorfa M alejada de C, con salto prescrito a través de C, y con una normalización dada en el infinito. Si y por lo tanto M son matrices en lugar de escalares, este es un problema que en general no admite una solución explícita.
Se puede llevar a cabo una evaluación asintótica utilizando el método de fase estacionaria lineal o el descenso más pronunciado. La propuesta consiste en simplificar asintóticamente la solución del problema de Riemann-Hilbert original, transformándola en un problema de Riemann-Hilbert más sencillo y que se puede resolver de manera explícita. Para respaldar las deformaciones del contorno del salto, se recurre al teorema de Cauchy.
La fase estacionaria no lineal fue presentada por Deift y Zhou en 1993, fundamentándose en investigaciones previas de Its. En 2003, Kamvissis, K. McLaughlin y P. Miller desarrollaron un método de descenso más acentuado (específicamente) no lineal, basado en estudios anteriores de Lax, Levermore, Deift, Venakides y Zhou. Al igual que en el contexto lineal, los "contornos de descenso más acentuados" abordan un problema de mínimo-máximo. En el ámbito no lineal, estos se manifiestan como "curvas S", término que fue definido en un contexto diferente en los años 80 por Stahl, Gonchar y Rakhmanov.
El método de fase estacionaria no lineal/descenso más pronunciado tiene aplicaciones en la teoría de ecuaciones de solitones y modelos integrables, matrices aleatorias y combinatoria.
Generalización de la aproximación del punto medio
editarEn la generalización, la evaluación de la integral se considera equivalente a encontrar la norma de la distribución con densidad.
Denotando la distribución acumulativa , si existe una distribución gaussiana difeomórfica con densidad
La norma viene dada por
y el difeomorfismo correspondiente es
dónde denota la función de distribución normal estándar acumulativa.
En general, cualquier distribución difeomorfa a la distribución gaussiana tiene densidad
y el punto mediano se asigna a la mediana de la distribución gaussiana. Al hacer coincidir el logaritmo de las funciones de densidad y sus derivadas en el punto medio hasta un orden dado se obtiene un sistema de ecuaciones que determinan los valores aproximados de y .
La aproximación fue introducida en 2019 por D. Makogon y C. Morais Smith principalmente en el contexto de la evaluación de la función de partición para un sistema de fermiones en interacción.[5]
Integrales complejas
editarPara integrales complejas en la forma:
con hacemos la sustitución t = iu y el cambio de variable Para obtener la transformada de Laplace bilateral:
Luego descomponemos g ( c + ix ) en su parte real y compleja, tras lo cual recuperamos u = t / i . Esto es útil para las transformadas de Laplace inversas, la fórmula de Perron y la integración compleja.
Ejemplo: Aproximación de Stirling
editarEl método de Laplace se puede utilizar para derivar la aproximación de Stirling.
para un entero grande N . De la definición de la función Gamma, tenemos
Ahora cambiamos las variables, dejando de modo que Vuelva a insertar estos valores para obtener
Esta integral tiene la forma necesaria para el método de Laplace con
que es dos veces diferenciable:
El máximo de se encuentra en z 0 = 1, y la segunda derivada de tiene el valor −1 en este punto. Por lo tanto, obtenemos
Véase también
editarReferencias
editar- ↑ Tierney, Luke; Kadane, Joseph B. (1986). «Accurate Approximations for Posterior Moments and Marginal Densities». J. Amer. Statist. Assoc. 81 (393): 82-86. doi:10.1080/01621459.1986.10478240.
- ↑ Amaral Turkman, M. Antónia; Paulino, Carlos Daniel; Müller, Peter (2019). «Methods Based on Analytic Approximations». Computational Bayesian Statistics: An Introduction. Cambridge University Press. pp. 150-171. ISBN 978-1-108-70374-1.
- ↑ Butler, Ronald W (2007). Saddlepoint approximations and applications. Cambridge University Press. ISBN 978-0-521-87250-8.
- ↑ MacKay, David J. C. (September 2003). Information Theory, Inference and Learning Algorithms. Cambridge: Cambridge University Press. ISBN 9780521642989.
- ↑ Makogon, D.; Morais Smith, C. (3 de mayo de 2022). «Median-point approximation and its application for the study of fermionic systems». Physical Review B 105 (17): 174505. Bibcode:2022PhRvB.105q4505M. doi:10.1103/PhysRevB.105.174505.