Skip to article frontmatterSkip to article content

Теория условных экстремумов

Higher School of Economics

Рассмотрим вопрос об экстремумах функции f:Rn+mRf:\mathbb{R}^{n+m} \to \mathbb{R} от n+mn+m переменных, x1,,xn+mx_1,\ldots, x_{n+m} в предположении, что эти переменные подчинены ещё mm уравнениям связи

{Φ1(x1,,xn,,xn+m)=0Φ2(x1,,xn,,xn+m)=0Φm(x1,,xn,,xn+m)=0\left\{\begin{matrix} \Phi_1(x_1,\ldots, x_{n}, \ldots, x_{n+m}) = 0 \\ \Phi_2(x_1,\ldots, x_{n}, \ldots, x_{n+m}) = 0 \\ \vdots\\ \Phi_m(x_1,\ldots, x_{n}, \ldots, x_{n+m}) = 0 \end{matrix} \right.
Proof

Рассмотрим отображение

Φ:Rn+mRn+m,(x1xmxm+1xn+m)(φ1(x1,,xn+m)φm(x1,,xn+m)xm+1xn+m) \Phi: \mathbb{R}^{n+m} \to \mathbb{R}^{n+m}, \qquad \begin{pmatrix} x_1 \\ \vdots \\ x_m \\ x_{m+1} \\ \vdots \\ x_{n+m} \end{pmatrix} \mapsto \begin{pmatrix} \varphi_1(x_1,\ldots, x_{n+m}) \\ \vdots \\ \varphi_m(x_1,\ldots, x_{n+m}) \\ x_{m+1} \\ \vdots \\x_{n+m} \end{pmatrix}

согласно условиям, оно непрерывно дифференцируемо в окрестности W\mathscr{W} точки a\m{a}.

Сделаем теперь замену переменных

u1=φ1(x1,,xn+m)um=φm(x1,,xn+m)um+1=xm+1um+n=xm+n\begin{matrix} u_1 & = & \varphi_1(x_1,\ldots, x_{n+m}) \\ \vdots & & \vdots\\ u_m & = & \varphi_m(x_1,\ldots, x_{n+m}) \\ u_{m+1} &=& x_{m+1} \\ \vdots && \vdots \\ u_{m+n} &=& x_{m+n} \end{matrix}

Если нужно, то, перенумеровав переменные, можно считать, что из условия о ранге матрицы вытекает

det(φ1x1(x)φ1xm(x)φmx1(x)φmxm(x))0. \mathrm{det} \begin{pmatrix} \dfrac{\partial \varphi_1}{\partial x_{1}}(\m{x}) &\ldots& \dfrac{\partial \varphi_1}{\partial x_{m}}(\m{x}) \\ \vdots & \ddots & \vdots \\ \dfrac{\partial \varphi_m}{\partial x_{1}}(\m{x}) &\ldots & \dfrac{\partial \varphi_m}{\partial x_{m}}(\m{x}) \end{pmatrix} \ne 0.

Тогда по теореме об обратном отображении Theorem 1, Φ — локально обратима в окрестности UW\mathscr{U} \subseteq \mathscr{W} точки a.\m{a}. Это значит, что существуют такие непрерывно дифференцируемые функции ψi:VR\psi_i: \mathscr{V} \to \mathbb{R}, 1in+m1\le i \le n+m, где V\mathscr{V} — окрестность точки Φ(a)\Phi(\m{a}), что мы получаем обратную замену координат к замене ((6)) $$

x1=ψ1(u1,,um)xn+m=ψn+m(u1,,um)\begin{matrix} x_1 & = & \psi_1(u_1,\ldots, u_{m}) \\ \vdots & & \vdots\\ x_{n+m} & = & \psi_{n+m}(u_1,\ldots, u_m) \end{matrix}

$$

В итоге, мы получаем две коммутативные диаграммы

alt text

т.е.,

fu(u1,,un+m):=f(φ1(x1,,xn+m),,φm(x1,,xn+m),xm+1,,xm+n), f_u(u_1, \ldots, u_{n+m}) := f(\varphi_1(x_1,\ldots, x_{n+m}), \ldots, \varphi_m(x_1,\ldots, x_{n+m}), x_{m+1},\ldots, x_{m+n}),

и

f(x1,,xn+m)=fu(ψ1(u1,,ψm),,ψn+m(u1,,um)). f(x_1,\ldots, x_{n+m})= f_u(\psi_1(u_1,\ldots, \psi_m), \ldots, \psi_{n+m}(u_1,\ldots, u_m)).

Тогда, если мы ограничимся рассмотрением точек на множестве Ω, то во-первых, мы получаем, что

Φ(Ω)={(u1,,un+m)U:u1=0,,um=0}, \Phi(\Omega) = \{(u_1,\ldots, u_{n+m}) \in \mathscr{U}\, : \, u_1=0,\ldots, u_m=0\},

во-вторых мы получаем функцию уже от nn переменных fu(0,,0,um+1,,um+n)f_u(0,\ldots, 0, u_{m+1},\ldots, u_{m+n}).

Далее, из диаграммы

alt text

следует, что при yΦ(ΩU)\m{y} \in \Phi(\Omega \cap \mathscr{U}), отображение Φ1\Phi^{-1} имеет вид

Φ1:(00um+1um+n)(00xm+1xm+n), \qquad \Phi^{-1} : \begin{pmatrix} 0\\ \vdots \\ 0\\ u_{m+1} \\ \vdots \\ u_{m+n} \end{pmatrix} \mapsto \begin{pmatrix} 0\\ \vdots \\ 0\\ x_{m+1} \\ \vdots \\ x_{m+n} \end{pmatrix},

а так как um+1=xm+1,,um+n=xn+mu_{m+1} = x_{m+1}, \ldots, u_{m+n} =x_{n+m}, то

fu(0,,0,um+1,,um+n)=f(0,,0,xm+1,,xn+m)Φ1. f_u(0,\ldots, 0, u_{m+1},\ldots, u_{m+n}) = f(0,\ldots, 0, x_{m+1}, \ldots, x_{n+m}) \circ \Phi^{-1}.

Но тогда Φ(a)\Phi(\m{a}) — точка экстремума функции fu(0,,0,um+1,,um+n)f_u(0,\ldots, 0, u_{m+1},\ldots, u_{m+n}) и по необходимому признаку , мы получаем

fuum+1(Φ(a))==fuum+n(Φ(a))=0. \dfrac{\partial f_u}{\partial{u_{m+1}}}(\Phi(\m{a})) = \cdots = \dfrac{\partial f_u}{\partial{u_{m+n}}}(\Phi(\m{a})) = 0.

Это значит, что в точке Φ(a)\Phi(\m{a}) имеем

(dfu)Φ(a)=(λ1λm00). (\mathrm{d}f_u)_{\Phi(\m{a})} = \begin{pmatrix} \lambda_1 & \ldots & \lambda_m & 0 & \ldots & 0 \end{pmatrix}.

Наконец, из диаграммы

alt text

и из теоремы о композиции дифференциалов Theorem 1 получаем

(df)a=(dfu)Φ(a)(dΦ)a=(λ1λm00)(φ1x1(a)φ1xm(a)φ1xm+1(a)φ1xm+n(a)φmx1(a)φmxm(a)φnxm+1(a)φmxm+n(a)00100001)=λ1(dφ1)a++λm(dφm)a,\begin{align*} (\mathrm{d}f)_\m{a} &= (\mathrm{d}f_u)_{\Phi(\m{a})} \cdot (\mathrm{d}\Phi)_{\m{a}} \\ &= \begin{pmatrix} \lambda_1 & \ldots & \lambda_m & 0 & \ldots 0 \end{pmatrix} \begin{pmatrix} \dfrac{\partial \varphi_1}{\partial x_1}(\m{a}) & \ldots & \dfrac{\partial \varphi_1}{\partial x_m}(\m{a}) & \dfrac{\partial \varphi_1}{\partial x_{m+1}}(\m{a}) & \ldots & \dfrac{\partial \varphi_1}{\partial x_{m+n}}(\m{a}) \\ \vdots & \ddots & \vdots & \vdots & \ddots & \vdots\\ \dfrac{\partial \varphi_m}{\partial x_1}(\m{a}) & \ldots & \dfrac{\partial \varphi_m}{\partial x_m}(\m{a}) & \dfrac{\partial \varphi_n}{\partial x_{m+1}}(\m{a}) & \ldots & \dfrac{\partial \varphi_m}{\partial x_{m+n}}(\m{a}) \\ 0 & \ldots & 0 & 1 & \ldots &0 \\ \vdots & \ddots & \vdots & \vdots & \ddots & \vdots\\ 0 & \ldots & 0 & 0 & \ldots & 1 \end{pmatrix} \\ &= \lambda_1 (\mathrm{d}\varphi_1)_{\m{a}} + \ldots + \lambda_m (\mathrm{d}\varphi_m)_{\m{a}}, \end{align*}

что и требовалось доказать.