Skip to article frontmatterSkip to article content

Теорема о неявной и обратной функции

Higher School of Economics
Proof

Так как FF — дифференцируемое в U\mathscr{U}, то для любых точек a,a+hU\m{a}, \m{a}+\m{h} \in \mathscr{U} имеет место равенство

F(a+h)F(a)=(dFa)h+α(h)h,h0. F(\m{a} + \m{h}) - F(\m{a}) = (\mathrm{d}F_\m{a})\m{h} + \alpha(\m{h})\| \m{h}\|, \qquad \|\m{h}\| \to 0.

(1) Так как U\mathscr{U} — открыто, то для любой точки cU\m{c} \in \mathscr{U} найдётся открытый шар B(c,r)UB(\m{c},r) \subseteq \mathscr{U}. Согласно Аксиоме Выбора, мы можем выбрать любые две разные точки: x,yB(c,r)\m{x},\m{y} \in B(\m{c},r). Рассмотрим отображение:

χx,y:[0,1]Rn,txt+(1t)y, \chi_{\m{x},\m{y}}: [0,1] \to \mathbb{R}^n, \qquad t \mapsto \m{x}t + (1-t)\m{y},

покажем, что χx,y(t)B(c,r)\chi_{\m{x},\m{y}}(t) \in B(\m{c},r) для любого t[0,1]t \in [0,1]. Действительно, имеем xc,yc<r\|\m{x} - \m{c}\|, \|\m{y} - \m{c}\| < r, тогда для любого t[0,1]t \in [0,1] получаем

(tx+(1t)y)c=tx+(1t)ytc(1t)c=t(xc)+(1t)(yc)txc+(1t)yc<tr+(1t)r=r,\begin{align*} \| (t\m{x}+ (1-t)\m{y}) - \m{c}\| &=& \| t\m{x}+ (1-t)\m{y}- t\m{c} - (1-t)\m{c}\| \\ &= & \| t(\m{x} - \m{c}) + (1-t)(\m{y} - \m{c}) \| \\ &\le & t \| \m{x} - \m{c} \| + (1-t) \| \m{y} -\m{c} \| \\ &<& tr + (1-t)r = r, \end{align*}

т. е. xt+(1t)yB(a,r)\m{x}t + (1-t)\m{y} \in B(\m{a},r) для любого t[0,1].t \in [0,1].

(2) Пусть отображение FF определено следующим образом

F:(x1xn)(f1(x1,,xn)fn(x1,,xn)).F: \begin{pmatrix} x_1 \\ \vdots \\ x_n \end{pmatrix} \mapsto \begin{pmatrix} f_1(x_1,\ldots, x_n) \\ \vdots \\ f_n(x_1,\ldots, x_n) \end{pmatrix}.

Определим для каждого 1in1 \le i \le n функцию φi(t):[0,1]B(a,r)\varphi_i(t):[0,1] \to B(\m{a}, r) следующим образом

φi(t):=fi(tx+(1t)y),1in, \varphi_i(t): = f_i(t\m{x} + (1-t)\m{y}), \qquad 1\le i \le n,

другими словами, φi:=fiχx,y\varphi_i: = f_i \circ \chi_{\m{x},\m{y}},

alt text

Пусть zt:=tx+(1t)y\m{z}_t:=t\m{x} + (1-t)\m{y}, тогда по теореме о дифференциале композиции Theorem 1 получаем

φi(t)=(dfi)ztχx,y(t)=(dfi)zt(xy)=(fix1(zt)fixn(zt))(x1y1xnyn)=k=1nfixk(zt)(xkyk).\begin{align*} \varphi'_i(t) &= (\mathrm{d}f_i)_{\m{z}_t} \cdot \chi'_{\m{x},\m{y}}(t) \\ &= (\mathrm{d}f_i)_{\m{z}_t} \cdot (\m{x} - \m{y}) \\ &= \begin{pmatrix} \dfrac{\partial f_i}{\partial x_1}({\m{z}_t}) & \ldots & \dfrac{\partial f_i}{\partial x_n} ({\m{z}_t}) \end{pmatrix} \begin{pmatrix} x_1 - y_1 \\ \vdots \\ x_n -y_n \end{pmatrix} \\ &= \sum_{k=1}^n \dfrac{\partial f_i}{\partial x_k}({\m{z}_t}) (x_k - y_k) . \end{align*}

(3) По теореме Лагранжа Theorem 6 существует такой ϑi(0,1)\vartheta_i \in (0,1), что

φi(1)φi(0)=φi(ϑi), \varphi_i(1) - \varphi_i(0) = \varphi_i'(\vartheta_i),

тогда, положив zi:=ϑix+(1ϑi)y\m{z}_i: = \vartheta_i \m{x} + (1-\vartheta_i)\m{y} и принимая во внимание, что φi(1)φi(0)=fi(x)fi(y)\varphi_i(1) - \varphi_i(0) = f_i(\m{x}) - f_i(\m{y}), мы получаем

F(x)F(y)=(f1(x)f1(y)fn(x)fn(y))=(f1x1(z1)f1xn(z1)fnx1(zn)fnxn(zn))(x1y1xnyn)=J(z1,,zn)(xy).\begin{align*} F(\m{x}) - F(\m{y}) &= \begin{pmatrix} f_1(\m{x}) - f_1(\m{y})\\ \vdots \\ f_n(\m{x}) - f_n(\m{y}) \end{pmatrix} = \begin{pmatrix} \dfrac{\partial f_1}{\partial x_1}(\m{z}_1) & \ldots & \dfrac{\partial f_1}{\partial x_n}(\m{z}_1) \\ \vdots & \ddots & \vdots \\ \dfrac{\partial f_n}{\partial x_1}(\m{z}_n) & \ldots & \dfrac{\partial f_n}{\partial x_n}(\m{z}_n) \end{pmatrix}\begin{pmatrix} x_1-y_1\\ \vdots \\ x_n - y_n \end{pmatrix} = J(\m{z}_1,\ldots, \m{z}_n)(\m{x} - \m{y}). \end{align*}

В связи с этим рассмотрим функцию

det(J):Rn××RnnR,(x1,,xn)det(f1x1(x1)f1xn(x1)fnx1(xn)fnxn(xn))\mathrm{det}(J): \underbrace{\mathbb{R}^n \times \cdots \times \mathbb{R}^n}_n \to \mathbb{R}, \qquad (\m{x}_1,\ldots, \m{x}_n) \mapsto \mathrm{det} \begin{pmatrix} \dfrac{\partial f_1}{\partial x_1}(\m{x}_1) & \ldots & \dfrac{\partial f_1}{\partial x_n}(\m{x}_1) \\ \vdots & \ddots & \vdots \\ \dfrac{\partial f_n}{\partial x_1}(\m{x}_n) & \ldots & \dfrac{\partial f_n}{\partial x_n}(\m{x}_n) \end{pmatrix}

Так функция det\mathrm{det} — непрерывная, то det(J)\mathrm{det}(J) непрерывная, с другой стороны, detJ(a,,a)=det(dF)a\mathrm{det}J(\m{a},\ldots, \m{a}) = \mathrm{det} (\mathrm{d}F)_a. По условию, (dF)a(\mathrm{d}F)_\m{a} — обратима, т.е. det(dF)a0\mathrm{det} (\mathrm{d}F)_a \ne 0, т.е. det(J(a,,a))0\mathrm{det}(J(\m{a},\ldots,\m{a})) \ne 0. Но тогда в силу непрерывности det(J)\mathrm{det}(J) можно найти такой открытый шар B(a,ε)B(\m{a}, \varepsilon), что для любых z1,,znB(a,ε)\m{z}_1,\ldots, \m{z}_n \in B(\m{a},\varepsilon) det(J)(z1,,zn)0.\mathrm{det}(J)(\m{z}_1,\ldots, \m{z}_n) \ne 0.

(4) Итак, пусть x,yB(a,ε)\m{x},\m{y} \in B(\m{a},\varepsilon), xy\m{x} \ne \m{y}, тогда из предыдущих рассуждений мы получаем

F(x)F(y)=J(z1,,zn)(xy)F(\m{x}) - F(\m{y}) = J(\m{z}_1,\ldots, \m{z}_n)(\m{x}- \m{y})

и так как det(J)(z1,,zn)0\mathrm{det}(J)(\m{z}_1,\ldots, \m{z}_n) \ne 0, то J(z1,,zn)0J(\m{z}_1,\ldots, \m{z}_n) \ne 0, и тогда F(x)F(y).F(\m{x}) \ne F(\m{y}).

Вывод: мы нашли такой шар B(a,ε), что отображение F:B(a,ε)F(B(a,ε))  биекция!\boxed{ \boxed{ \textbf{Вывод: мы нашли такой шар $B(\m{a}, \varepsilon)$, что отображение $F: B(\m{a}, \varepsilon) \to F(B(\m{a}, \varepsilon))$ — биекция!}}}

(5) Покажем, что F(B(a,ε))F(B(\m{a}, \varepsilon)) — открытое, т.е. для любой точки xF(B(a,ε))\m{x} \in F(B(\m{a}, \varepsilon)) найдётся такой шар малого радиуса с центром в F(x)F(\m{x}), который будет содержаться в F(B(a,ε)).F(B(\m{a}, \varepsilon)).

Для таких целей мы рассмотрим функцию ψv(y):=F(y)v2\psi_\m{v}(\m{y}): = \| F(\m{y}) - \m{v}\|^2 на замкнутом в U\mathscr{U} шаре Bˉ(a,ε)\bar B(\m{a}, \varepsilon), которую можно определить как наклонную стрелку в диаграмме

alt text

где gv(b):=bv2=((b1v1)++(bnvn)2)2=(b1v1)++(bnvn)2g_\m{v}(\m{b}): = \| \m{b} - \m{v}\|^2 = \left( \sqrt{ (b_1-v_1) + \cdots + (b_n - v_n)^2 } \right)^2 = (b_1-v_1) + \cdots + (b_n - v_n)^2, где b=(b1,,bn)\m{b} = (b_1,\ldots, b_n)^\top и v=(v1,,vn).\m{v} = (v_1,\ldots, v_n)^\top.

Тогда по теореме о дифференциале композиции Theorem 1

(dψv)y=(dgv)F(y)(dF)y=(2(f1(y)v1)2(fn(y)vn))(f1x1(y)f1xn(y)fnx1(y)fnxn(y))\begin{align*} (\mathrm{d} \psi_\m{v})_\m{y} &=(\mathrm{d}g_\m{v})_{F(\m{y})} \cdot (\mathrm{d}F)_\m{y} \\ &= \begin{pmatrix} 2(f_1(\m{y}) - v_1) & \ldots & 2(f_n(\m{y}) - v_n) \end{pmatrix} \begin{pmatrix} \dfrac{\partial f_1}{\partial x_1}(\m{y}) & \ldots & \dfrac{\partial f_1}{\partial x_n}(\m{y}) \\ \vdots & \ddots & \vdots \\ \dfrac{\partial f_n}{\partial x_1}(\m{y}) & \ldots & \dfrac{\partial f_n}{\partial x_n}(\m{y}) \end{pmatrix} \end{align*}

тогда для каждого 1in1 \le i \le n

ψxi(y)=2k=1nfixk(y)(fi(y)vi).\dfrac{\partial \psi}{\partial x_i}(\m{y}) = 2 \sum_{k=1}^n \dfrac{\partial f_i}{\partial x_k}(\m{y}) (f_i(\m{y}) - v_i).
Мы хотим показать, что точка минимума этой функции находится в шаре B(a,ε).\boxed{ \textbf{Мы хотим показать, что точка минимума этой функции находится в шаре $B(\m{a},\varepsilon)$.}}

(6) Рассмотрим функцию ρx:Bˉ(a,ε)R\rho_\m{x}: \bar B(\m{a},\varepsilon) \to \mathbb{R}, ρx(y):=F(y)F(x)\rho_\m{x}(\m{y}): = \| F(\m{y}) - F(\m{x})\|, которая, очевидно, непрерывна. Пусть sS(a,ε):={yRn:ya=ε}\m{s} \in S(\m{a},\varepsilon): = \{\m{y}\in \mathbb{R}^n\, :\, \| \m{y} - \m{a}\| = \varepsilon\}, так как SS — компакт (Следствие Corollary 2), то, согласно Теореме Theorem 4, функция ρx\rho_\m{x}, рассматриваемая только на SS, достигает минимума, но так как ρx(s)=F(s)F(x)=0\rho_\m{x}(\m{s}) = \| F(\m{s}) - F(\m{x})\| = 0, если и только если s=x\m{s} = \m{x} (потому что FF биективно на B(a,ε)B(\m{a},\varepsilon)), то минимум этой функции положителен.

Тогда можно выбрать положительное число δ>0\delta>0 так, чтобы ρx(s)=F(s)F(x)>2δ\rho_\m{x}(\m{s}) = \| F(\m{s}) - F(\m{x})\| > 2 \delta для всех sS(a,ε).\m{s} \in S(\m{a}, \varepsilon).

(7) Покажем теперь, что открытый шар B(F(x),δ)F(B(a,ε))B(F(\m{x}), \delta) \subseteq F(B(\m{a}, \varepsilon)). Пусть vB(F(x),δ)\m{v} \in B(F(\m{x}), \delta), т.е. F(x)v<δ\| F(\m{x}) - \m{v}\| < \delta. Для любого sS(a,ε)\m{s} \in S(\m{a}, \varepsilon) согласно Лемме Lemma 1, получаем

F(s)v=(F(s)F(x))(vF(x))F(s)F(x)vF(x)>2δδ=δ.\begin{align*} \| F(\m{s}) - \m{v}\| &=& \| ( F(\m{s}) - F(\m{x} )) - (\m{v} - F(\m{x}))\| \\ &\ge & \Bigl| \| F(\m{s}) - F(\m{x}) \| - \| \m{v} - F(\m{x}) \| \Bigr| \\ &>& |2\delta - \delta| = \delta. \end{align*}

Вернёмся к функции ψv(y):=F(y)v2\psi_\m{v}(\m{y}): = \| F(\m{y}) - \m{v}\|^2, определённой на Bˉ(a,ε)\bar B(\m{a}, \varepsilon), тогда получаем

ψv(s)=F(s)v2>δ2,sS(a,ε),ψv(x)=F(x)v2<δ2.\begin{align*} & \psi_\m{v}(\m{s}) = \| F(\m{s}) - \m{v}\|^2 > \delta^2, \qquad \m{s} \in S(\m{a},\varepsilon),\\ &\psi_\m{v}(\m{x}) = \| F(\m{x}) - \m{v}\|^2 <\delta^2. \end{align*}

С другой стороны, Bˉ(a,ε)\bar B(\m{a}, \varepsilon) — компакт (так как он очевидно ограничен и замкнут согласно Лемме Lemma 3), тогда функция (Теорема Theorem 4) ψv\psi_\m{v} принимает на нём минимальное значение, но тогда из неравенств выше вытекает, что точка минимума wB(a,ε)\m{w} \in B(\m{a},\varepsilon).

(8) В таком случае, если w\m{w} — точка минимума, то из необходимого признака , ψxi(w)=0\frac{\partial \psi}{\partial x_i}(\m{w})=0, но так как J0J \ne 0 в шаре B(a,ε)B(\m{a},\varepsilon), то из (13)вытекает, что fi(w)=vif_i(\m{w}) = v_i для каждого 1in1\le i \le n, т. е. v=F(w)\m{v} = F(\m{w}).

Итак, мы взяли произвольную точку vB(F(x,δ)\m{v} \in B(F(\m{x}, \delta) и только что показали, что v=F(w)\m{v} = F(\m{w}), где wB(a,ε)\m{w} \in B(\m{a},\varepsilon), но это и означает, что B(F(x,δ)F(B(a,ε))B(F(\m{x}, \delta) \subseteq F(B(\m{a}, \varepsilon)), т. е. мы показали, что F(B(a,ε))F(B(\m{a}, \varepsilon)) — открыто.

(9) Нам осталось показать, что F1F^{-1} дифференцируемо в F(B(a,ε))F(B(\m{a},\varepsilon)), т. е. для любой точки aF(B(a,ε))\m{a}' \in F(B(\m{a},\varepsilon)) существует такой линейный оператор Φa\Phi_{\m{a}'}, что для любых двух точек a,a+hF(B(a,ε))\m{a}', \m{a}' + \m{h}' \in F(B(\m{a},\varepsilon)) имеет место равенство

F1(a+h)F1(a)=Φa(h)+β(h)h,h0n. F^{-1}(\m{a}' + \m{h}') - F^{-1}(\m{a}') = \Phi_{\m{a}'}(\m{h}') + \beta(\m{h}') \| \m{h}'\|, \qquad \m{h}' \to \m{0}_n.

Пусть a:=F1(a)\m{a}: = F^{-1}(\m{a}') и a+h:=F1(a+h)\m{a} + \m{h} := F^{-1}(\m{a}' + \m{h}'), т. е. F(a)=aF(\m{a}) = \m{a}' и F(a+h)=a+hF(\m{a} + \m{h}) = \m{a}' + \m{h}'.

Тогда

Φa(h)=Φa(F(a+h)a)=Φa(F(a+h)F(a))\begin{align*} \Phi_{\m{a}'}(\m{h}') &= \Phi_{\m{a}'}\left( F(\m{a} + \m{h}) - \m{a}' \right) \\ &= \Phi_{\m{a}'}\left( F(\m{a} + \m{h}) - F(\m{a}) \right) \end{align*}

так как FF дифференцируемо в U\mathscr{U}, то, согласно определению,

F(a+h)F(a)=(dFa)h+α(h)h,h0 F(\m{a} + \m{h}) - F(\m{a}) = (\mathrm{d}F_\m{a})\m{h} + \alpha(\m{h})\| \m{h}\|, \qquad \|\m{h}\| \to 0

тогда, требуя, чтобы Φa\Phi_{\m{a}'} была обратной к матрице (dF)a(\mathrm{d}F)_\m{a}, получаем

Φa(h)=Φa((dFa)h+α(h)h)=h+Φa(α(h))h\begin{align*} \Phi_{\m{a}'}(\m{h}')&= \Phi_{\m{a}'}\left( (\mathrm{d}F_\m{a})\m{h} + \alpha(\m{h})\| \m{h}\| \right) \\ &= \m{h} + \Phi_{\m{a}'}(\alpha(\m{h}))\cdot \| \m{h}\| \end{align*}

Рассмотрим теперь

β(h):=hhΦa(α(h)), \beta(\m{h}'): = \frac{\|\m{h}\|}{\| \m{h}'\|}\Phi_{\m{a}'}(\alpha(\m{h})) ,

и покажем, что limh0nβ(h)=0\lim_{\m{h}' \to \m{0}_n} \beta(\m{h}') = 0.

Вернёмся к равенству ((10)) и рассмотрим теперь функцию J(z1,,zn)J(\m{z}_1,\ldots, \m{z}_n) на замкнутом шаре Bˉ(a,ε)\bar B(\m{a},\varepsilon), тогда по теореме Theorem 1, эта функция принимает минимальное значение μ, т.е., мы получаем

F(x)F(y)=J(xy)μxy. \| F(\m{x}) - F(\m{y})\| = \| J(\m{x}-\m{y})\| \ge \mu \|\m{x} - \m{y}\|.

Так как h=F(a+h)F(a)\m{h}'= F(\m{a} + \m{h}) - F(\m{a}), то из неравенства выше, получаем

h=F(a+h)F(a)μh. \| \m{h}'\| =\| F(\m{a} + \m{h}) - F(\m{a}) \| \ge \mu \| \m{h} \|.

Тогда

β(h):=hhΦa(α(h))μΦa(α(h)), \beta(\m{h}'): = \frac{\|\m{h}\|}{\| \m{h}'\|}\Phi_{\m{a}'}(\alpha(\m{h})) \le \mu \Phi_{\m{a}'}(\alpha(\m{h})),

в силу непрерывности Φa\Phi_{\m{a}'} (так как это линейный оператор, Лемма Lemma 1), мы получаем, что

β(h):=Φa(α(h))0,h0n, \beta(\m{h}'): = \Phi_{\m{a}'}(\alpha(\m{h})) \to 0, \qquad \m{h}' \to \m{0}_n,

что и показывает limh0nβ(h)=0\lim_{\m{h}' \to \m{0}_n} \beta(\m{h}') = 0, а тогда имеет место равенство

F1(a+h)F1(a)=Φa(h)+β(h)h,h0n. F^{-1}(\m{a}' + \m{h}') - F^{-1}(\m{a}') = \Phi_{\m{a}'}(\m{h}') + \beta(\m{h}') \| \m{h}'\|, \qquad \m{h}' \to \m{0}_n.

Тем самым, теорема об обратной функции полностью доказана.

Proof

Для заданного отображения F(x,y)F(\m{x},\m{y}) мы положим Φ(x,y):=(x,F(x,y))\Phi(\m{x},\m{y}):=(\m{x}, F(\m{x},\m{y})). Тогда

(dΦ)(x0,F(x0,y0))=(EOO(dF)(x0,y0)) (\mathrm{d}\Phi)_{(\m{x}_0, F(\m{x}_0, \m{y}_0))} = \begin{pmatrix} E & O \\ O & (\mathrm{d}F)_{(\m{x}_0,\m{y}_0)} \end{pmatrix}

Тогда det(dΦ)(x0,F(x0,y0))0\mathrm{det} (\mathrm{d}\Phi)_{(\m{x}_0, F(\m{x}_0, \m{y}_0))} \ne 0 и по теореме об обратной функции Theorem 1, имеется обратное к Φ отображение Ψ, т.е. Ψ(Φ(x,y))=(x,y)\Psi(\Phi(\m{x},\m{y})) = (\m{x},\m{y}), или, другими словами Ψ(x,F(x,y))=(x,y)\Psi(\m{x}, F(\m{x},\m{y})) = (\m{x},\m{y}). Тогда если F(x,y)=0F(\m{x},\m{y})=0, то вектор f(x)f(\m{x}) это вектор Ψ(x,0m)\Psi(\m{x}, \m{0}_m) без первых nn координат.

Тогда в новых терминах теорема об обратном отображении утверждает, что если в точке aU\m{a} \in \mathscr{U} дифференциал (dF)a(\mathrm{d}F)_\m{a} отображения FCp(U,V)F \in C^p(\mathscr{U}, \mathscr{V}) обратим, то существуют такое открытое множество UU\mathscr{U}' \subseteq \mathscr{U}, содержащее точку a\m{a}, что F:UVVF:\mathscr{U}' \to \mathscr{V}' \subseteq \mathscr{V} — диффеоморфизм на некоторое открытое множество VV\mathscr{V}' \subseteq \mathscr{V}, содержащее точку F(a)F(\m{a}).