主題
Search

反問題


為了預測測量的結果,需要 (1) 被研究系統的模型,以及 (2) 將模型引數與被測量引數聯絡起來的物理理論。這種在給定定義模型引數值的情況下對觀測結果的預測構成了“正常問題”,或者用反問題理論的術語來說,是正向問題。“反問題”包括使用實際觀測的結果來推斷表徵被研究系統的引數值。

反問題可能難以解決,至少有兩個不同的原因:(1) 模型引數的不同值可能與資料一致(知道主桅杆的高度不足以計算船長的年齡),以及 (2) 發現模型引數的值可能需要探索巨大的引數空間(在 100 維的乾草堆中找到一根針是困難的)。

儘管大多數反問題的公式直接進入 最佳化 問題的設定,但實際上最好從機率公式開始,然後最佳化公式作為副產品出現。

考慮一個具有體積概念的 流形 M。那麼對於任何 A subset M

 V(A)=int_AdV.
(1)

體積機率是一個函式 f,它將機率與任何 A subset M 相關聯

 P(A)=int_AdVf.
(2)

如果 M 是一個配備了一些座標 {x^1,...,x^n} 的度量流形,那麼

 dV=sqrt(detg)dx^1 ^ ... ^ dx^n
(3)

P(A)=int_Adx^1 ^ ... ^ dx^nsqrt(detg)f_()
(4)
=int_Adx^1 ^ ... ^ dx^nf^_.
(5)

(注意體積機率 f 是不變的,但機率密度 f^_ 不是;它是一個密度。)

體積機率的基本運算是它們的乘積,

 (f·g)(P)=1/nuf(P)g(P),
(6)

其中 nu=int_MdVf(P)g(P)。這對應於“機率的組合”,非常適合許多基本的推斷問題。

考慮一個例子,其中兩架飛機對一名遇難者的地理座標進行了兩次估計。設機率由兩個體積機率 f(phi,lambda)g(phi,lambda) 表示。結合這兩條資訊的體積機率是

 (f·g)(phi,lambda)=(f(phi,lambda)g(phi,lambda))/(intdS(phi,lambda)f(phi,lambda)g(phi,lambda)).
(7)

體積機率的乘積運算擴充套件到以下情況

1. 在第一個流形 M 上定義了一個體積機率 f(P)

2. 在第二個流形 N 上定義了另一個體積機率 phi(Q)

3. 存在從 MN 的應用 P|->Q=Q(P)

那麼,上面介紹的基本運算變為

 g(P)=1/nuf(P)phi(Q(P)),
(8)

其中 nu=int_MdV(P)f(P)phi(Q(P))

在一個典型的反問題中,有

1. 一組模型引數 {m^1,m^2,...,m^n}

2. 一組可觀測引數 {o^1,o^2,...,o^n}

3. 關係 o^i=o^i(m^1,m^2,...,m^n) 預測可能的觀測結果。

模型引數是模型引數流形 M 上的座標,而可觀測引數是可觀測引數流形 O 上的座標。當 M 上的點表示為 MM^'、... 並且 O 上的點表示為 OO^'、... 時,模型引數和可觀測引數之間的關係可以寫成 M|->O=O(M)

一個典型的反問題的三個基本要素是

1. 關於模型引數的一些先驗資訊,由在 M 上定義的體積機率 rho_(prior)(M) 表示。

2. 關於可觀測引數獲得的一些實驗資訊,由在 O 上定義的體積機率 sigma_(obs)(O) 表示。

3. 我們剛剛看到的“正向建模”關係 M|->O=O(M)

方程 (8) 的使用導致

 rho_(post)(M)=1/nurho_(prior)(M)sigma_(obs)(O(M)),
(9)

其中 nu 是歸一化常數。此體積機率表示關於模型引數的最終資訊(透過組合可用資訊獲得)。方程 (9) 提供了反問題的更通用解。常見方法(蒙特卡羅、最佳化等)可以看作是此方程的特定用途。

考慮一個來自採樣的例子,對先驗體積機率 rho_(prior)(M) 進行取樣,以獲得(許多)隨機模型 M_1M_2、.... 對於每個模型 M_i,解決正向建模問題,O_i=O_i(M_i)。給予每個模型 M_isigma_(obs)(O_i(M_i)) 成正比的“生存”機率。倖存的模型 M_(1^')M_(2^')、... 是後驗體積機率的樣本

 rho_(post)(M)=1/nurho_(prior)(M)sigma_(obs)(O(M)).
(10)

考慮一個來自最小二乘擬合的例子,模型引數流形可能是一個線性空間,向量表示為 mm^'、...,並且先驗資訊可能具有高斯形式

 rho_(prior)(m)=kexp[-1/2(m-m_(prior))^(T)C_m^(-1)(m-m_(prior))].
(11)

可觀測引數流形可能是一個線性空間,向量表示為 oo^'、...,並且測量帶來的資訊可能具有高斯形式

 sigma_(obs)(o)=kexp[-1/2(o-o_(obs))^(T)C_o^(-1)(o-o_(obs))]).
(12)

對於這些符號,正向建模關係變為

 o=o(m).
(13)

那麼,模型引數的後驗體積機率為

 rho_(post)(m)=kexp[-S(m)],
(14)

其中失配函式 S(m) 是平方和

 2S(m)=(m-m_(prior))^(T)C_m^(-1)(m-m_(prior)) 
 +(o(m)-o_(obs))^(T)C_o^(-1)(o(m)-o_(obs)).
(15)

最大似然模型是最大化 rho_(post)(m) 的模型 m。它也是最小化 S(m) 的模型。它可以使用擬牛頓演算法獲得,

 m_(n+1)=m_n-H_n^(-1)gamma_n,
(16)

其中 黑塞矩陣 S

 H_n=I+C_mO_n^(T)C_o^(-1)O_n
(17)

並且 梯度 S

 gamma_n=C_mO_n^(T)C_o^(-1)(o(m_n)-o_(obs))+(m_n-m_(prior)).
(18)

這裡,切線線性運算元 O_n 透過以下方式定義

 o(m_n+deltam)=o(m_n)+O_ndeltam+....
(19)

正如我們所看到的,演算法收斂的模型 m_infty 最大化了後驗體積機率 rho_(post)(m)

為了估計後驗不確定性,可以證明,在高斯體積機率的協方差運算元,在 m_infty 處與 rho_(post)(m) 相切的是 H_infty^(-1)C_m


此條目由 Albert Tarantola 貢獻

使用 探索

參考文獻

Groetsch, C. W. 反問題:本科生練習. Washington, DC: Math. Assoc. Amer., 1999.Kozhanov, A. I. 複合型方程和反問題. Utrecht, Netherlands: VSP, 1999.Mosegaard, K. and Tarantola, A. "反問題的機率方法。" 在 國際地震與工程地震學手冊,A 部分. New York: Academic Press, pp. 237-265, 2002.Prilepko, A. I.; Orlovsky, D. G.; and Vasin, I. A. 數學物理中反問題的求解方法. New York: Dekker, 1999.Tarantola, A. 反問題理論和模型引數估計. Philadelphia, PA: SIAM, 2004. http://www.ccr.jussieu.fr/tarantola/.

在 上引用

反問題

請引用為

Tarantola, Albert. "反問題。" 來自 Web 資源,由 Eric W. Weisstein 建立. https://mathworld.tw/InverseProblem.html

主題分類