Skip to article frontmatterSkip to article content

Необходимые и достаточные условия дифференцируемости

Higher School of Economics

Что касается необходимых условия дифференцируемости, то мы их уже знаем. Но для удобства мы сделаем из этого следующую теорему:

Proof

Пусть f:RnRf:\mathbb{R}^n \to \mathbb{R}, дифференцируемая на каком-то открытом URn\mathscr{U} \subseteq \mathbb{R}^n или в фиксированной точке x\m{x}. Тогда её дифференциал (df)x(\mathrm{d}f)_\m{x} в точке x\m{x} задаётся матрицей размера n×1n\times 1, (df)x=(a1an)(\mathrm{d}f)_\m{x} = \begin{pmatrix} a_1 & \ldots & a_n \end{pmatrix}, где все aia_i есть функции от x\m{x}. Наша цель — найти эти aia_i. Пусть h=(h1,,hn)URn\m{h} = (h_1, \ldots, h_n)^\top \in \mathscr{U} \subseteq \mathbb{R}^n, тогда получаем

f(x+h)f(x)=(df)x(h)+o(h)=(a1an)(h1hn)+o(h)=a1h1++anhn+o(h).\begin{align*} f(\m{x} + \m{h}) - f(\m{x}) &=& (\mathrm{d}f)_\m{x}(\m{h}) + o(||\m{h}||) \\ &=& \begin{pmatrix} a_1 & \ldots & a_n \end{pmatrix} \begin{pmatrix} h_1 \\ \vdots \\ h_n \end{pmatrix} + o(||\m{h}||) \\ &=& a_1h_1 + \cdots + a_nh_n + o(||\m{h}||). \end{align*}

Видно, что aia_i не зависит от координат вектора h\m{h} кроме hih_i т. е. чтобы найти aia_i, нам достаточно рассмотреть вектор hi=hiei\m{h}_i = h_i \m{e}_i, где ei\m{e}_i — базисный вектор. В таком случае, hi=hi||\m{h}_i|| = |h_i|, и тогда для каждого 1in1 \le i \le n мы получаем

f(x+hiei)f(x)=aihi+o(hi), f(\m{x} + h_i \m{e}_i) - f(\m{x}) = a_ih_i + o(|h_i|),

таким образом,

ai=limhi0f(x+hiei)f(x)hi, a_i = \lim_{h_i \to 0} \frac{f(\m{x} + h_i \m{e}_i) - f(\m{x})}{h_i},

такое выражение называется частной производной функции по переменной xix_i и обозначается либо как fxi\frac{\partial f}{\partial x_i}, либо как fxif'_{x_i}, т. е.

fxi:=limhi0f(x+hiei)f(x)hi, \frac{\partial f}{\partial x_i}: = \lim_{h_i \to 0} \frac{f(\m{x} + h_i \m{e}_i) - f(\m{x})}{h_i},

если же мы хотим знать её значение в точке x0\m{x}_0, то получаем

fxi(x0):=limhi0f(x0+hiei)f(x0)hi. \frac{\partial f}{\partial x_i}(\m{x}_0): = \lim_{h_i \to 0} \frac{f(\m{x}_0 + h_i \m{e}_i) - f(\m{x}_0)}{h_i}.

Таким образом, в случае функции f:RnRf:\mathbb{R}^n \to \mathbb{R}, дифференциал в точке x0\m{x}_0 находится по формуле

(df)x0:=(fx1(x0)fxn(x0)). (\mathrm{d}f)_{\m{x}_0}: = \begin{pmatrix} \frac{\partial f}{\partial x_1}(\m{x}_0) & \ldots & \frac{\partial f}{\partial x_n}(\m{x}_0) \end{pmatrix}.

Мы сейчас обобщим теорему Лагранжа о конечных приращениях. Ради краткости мы будем говорить, что вектор v=(v1,,vn)\m{v} = (v_1,\ldots, v_n)^\top лежит между нулём и вектором h=(h1,,hn)\m{h} = (h_1,\ldots, h_n)^\top, если 0vihi0\le v_i \le h_i. 1in.1\le i \le n.

Proof

Пусть

f1=f(a1+h1,a2,,an)f(a1,,an),f2=f(a1+h1,a2+h2,a3,an)f(a1+h1,,an),f3=f(a1+h1,a2+h2,a3+h3,a4,,an)(a1+h1,a2+h2,a3,an),fn=f(a1+h1,,an+hn)f(a1,,an),\begin{matrix} f_1 & = & f(a_1 + h_1, a_2, \ldots, a_n) - f(a_1, \ldots, a_n), \\ f_2 & = & f(a_1 + h_1, a_2+h_2,a_3 \ldots, a_n) - f(a_1+h_1, \ldots, a_n),\\ f_3 &=& f(a_1+h_1, a_2+h_2, a_3+h_3,a_4,\ldots, a_n) - (a_1 + h_1, a_2+h_2,a_3 \ldots, a_n),\\ \vdots & & \vdots \\ f_n & = & f(a_1 + h_1, \ldots, a_n+h_n) - f(a_1, \ldots, a_n), \end{matrix}

тогда f(a+h)f(a)=f1++fn.f(\m{a} + \m{h}) - f(\m{a}) = f_1 + \cdots + f_n.

Пусть

φk(t):=f(a1+h1,,ak1+hk1,ak+tk,ak+1,,an)f(a1+h1,,ak1+hk1,ak,,an). \varphi_k(t): = f(a_1 + h_1, \ldots, a_{k-1}+h_{k-1},a_k+t_k, a_{k+1}, \ldots, a_n) - f(a_1 + h_1, \ldots, a_{k-1}+h_{k-1}, a_k,\ldots, a_n).

Для удобства мы запишем в векторном виде, т. е. в таком виде

φk(t):=f(a+h1e1++hk1ek1+tek)f(a+h1e1++hk1ek1) \varphi_k(t): = f(\m{a} + h_1 \m{e}_1 + \cdots + h_{k-1}\m{e}_{k-1} + t\m{e}_k) - f(\m{a} + h_1 \m{e}_1 + \cdots + h_{k-1}\m{e}_{k-1})

Тогда получаем

φk(t)φk(t0)=f(a+h1e1++hk1ek1+tek)f(a+h1e1++hk1ek1)f(a+h1e1++hk1ek1+t0ek)+f(a+h1e1++hk1ek1)=f(a+h1e1++hk1ek1+tek)f(a+h1e1++hk1ek1+t0ek),\begin{align*} \varphi_k(t) - \varphi_k(t_0) &=& f(\m{a} + h_1 \m{e}_1 + \cdots + h_{k-1}\m{e}_{k-1} + t\m{e}_k) - f(\m{a} + h_1 \m{e}_1 + \cdots + h_{k-1}\m{e}_{k-1}) \\ &-& -f(\m{a} + h_1 \m{e}_1 + \cdots + h_{k-1}\m{e}_{k-1} + t_0\m{e}_k) + f(\m{a} + h_1 \m{e}_1 + \cdots + h_{k-1}\m{e}_{k-1}) \\ &=& f(\m{a} + h_1 \m{e}_1 + \cdots + h_{k-1}\m{e}_{k-1} + t\m{e}_k) - f(\m{a} + h_1 \m{e}_1 + \cdots + h_{k-1}\m{e}_{k-1} + t_0\m{e}_k), \end{align*}

в частности

φk(hk)φk(0)=fk. \varphi_k(h_k) - \varphi_k(0) = f_k.

Пусть x0:=a+h1e1++hk1ek1+t0ek\m{x}_0 := \m{a}+ h_1 \m{e}_1 + \cdots + h_{k-1}\m{e}_{k-1}+t_0\m{e}_k, тогда

a+h1e1++hk1ek1+tek=a+h1e1++hk1ek1+(tt0)ek+a+h1e1++hk1ek1+t0ek=x0+(tt0)ek\begin{align*} \m{a} + h_1 \m{e}_1 + \cdots + h_{k-1}\m{e}_{k-1} + t\m{e}_k &=& \m{a} + h_1 \m{e}_1 + \cdots + h_{k-1}\m{e}_{k-1} + (t-t_0)\m{e}_k \\ &+& \m{a} + h_1 \m{e}_1 + \cdots + h_{k-1}\m{e}_{k-1} + t_0\m{e}_k \\ &=& \m{x}_0 + (t-t_0) \m{e}_k \end{align*}

Таким образом, мы можем написать

φk(t)φk(t0)=f(a+h1e1++hk1ek1+tek)f(a+h1e1++hk1ek1+t0ek)=f(x0+(tt0)ek)f(x0),\begin{align*} \varphi_k(t) - \varphi_k(t_0) &=& f(\m{a} + h_1 \m{e}_1 + \cdots + h_{k-1}\m{e}_{k-1} + t\m{e}_k) - f(\m{a} + h_1 \m{e}_1 + \cdots + h_{k-1}\m{e}_{k-1} + t_0\m{e}_k) \\ &=& f(\m{x}_0 + (t-t_0) \m{e}_k) - f(\m{x}_0), \end{align*}

а тогда

φk(t0):=limtt0φk(t)φk(t0)tt0=limtt0f(x0+(tt0)ek)f(x0)tt0=:fxkx0=fxk(x0).\begin{align*} \varphi_k'(t_0) &:=& \lim_{t \to t_0} \frac{\varphi_k(t) - \varphi_k(t_0)}{t-t_0} \\ &=& \lim_{t \to t_0} \frac{f(\m{x}_0 + (t-t_0) \m{e}_k) - f(\m{x}_0)}{t-t_0} \\ &=:& \left.\frac{\partial f}{\partial x_k}\right|_{\m{x}_0} = f'_{x_k}(\m{x}_0). \end{align*}

Это значит, что функция φk(t)\varphi_k(t) дифференцируема на отрезке [0,hk][0,h_k], потому что по условию существуют все частные производные в U\mathscr{U}.

Применим теперь к каждой φk(t)\varphi_k(t) теорему Лагранжа (теорема Theorem 6); существует θk(0,hk)\theta_k \in (0, h_k) такое, что

φk(θk)=φk(hk)φk(0)hk, \varphi_k'(\theta_k) = \frac{\varphi_k(h_k) - \varphi_k(0)}{h_k},

тогда, если vk:=a+h1e1++hk1ek1+θkek\m{v}_k:= \m{a}+ h_1 \m{e}_1 + \cdots + h_{k-1}\m{e}_{k-1} + \theta_k\m{e}_k, то для каждого 1kn1\le k \le n мы получили

fk=φk(hk)φk(0)=φk(θk)hk=fxk(a+vk)hk, f_k = \varphi_k(h_k) - \varphi_k(0) = \varphi_k'(\theta_k)h_k = f'_{x_k}(\m{a} + \m{v}_k)h_k,

где все k\m{k} расположены между a\m{a} и a+h\m{a}+ \m{h}, тогда окончательно получаем

f(a+h)f(a)=f1++fn=fx1(a+v1)h1++fxn(a+vn)hn=k=1nfxk(a+vk)hk,\begin{align*} f(\m{a} + \m{h}) - f(\m{a}) &=& f_1 + \cdots + f_n \\ &=& f'_{x_1}(\m{a} + \m{v}_1)h_1 + \cdots + f'_{x_n}(\m{a} + \m{v}_n)h_n \\ &=& \sum_{k =1}^n f'_{x_k}({\m{a} + \m{v}_k}) \cdot h_k, \end{align*}

что и требовалось доказать.

Proof

Пусть U\mathscr{U} — окрестность точки a\m{a}, и пусть a+hU\m{a} + \m{h} \in \mathscr{U}. Согласно формуле конечных приращений, (теорема Theorem 2) мы имеем

f(a+h)f(a)=k=1nfxk(a+vk)hk, f(\m{a} + \m{h}) - f(\m{a}) = \sum_{k=1}^n f'_{x_k}({\m{a} + \m{v}_k})\cdot h_k,

где a+vkU\m{a} + \m{v}_k \in \mathscr{U}, 1kn1 \le k \le n.

По условию, все частные производные непрерывны и конечны, тогда для любого ε>0\varepsilon >0 из vk<δ||\m{v}_k|| < \delta следует fxk(a+vk)fxk(a)<ε|f'_{x_k}({\m{a} + \m{v}_k}) - f'_{x_k}(\m{a})| < \varepsilon. Другими словами, можно сказать, что

fxk(a+vk)=fxk(a)+εk(h), f'_{x_k}({\m{a} + \m{v}_k}) = f_{x_k}'(\m{a}) + \varepsilon_k(\m{h}),

где εk(h)0\varepsilon_k(\m{h}) \to 0 когда h0.\m{h} \to 0.

Таким образом, получаем

f(a+h)f(a)=k=1n(fxk(a)+εk(h))hk=k=1nfxk(a)hk+α(h), f(\m{a} + \m{h}) - f(\m{a}) = \sum_{k=1}^n \bigl( f'_{x_k}(\m{a}) + \varepsilon_k(\m{h}) \bigr)h_k = \sum_{k=1}^n f'_{x_k}(\m{a}) h_k + \alpha(\m{h}),

где α(h):=k=1nεk(h)hk\alpha(\m{h}): = \sum_{k=1}^n \varepsilon_k(\m{h}) h_k. Ясно, что

α(h)h=k=1nεk(h)hkh. \frac{\alpha(\m{h})}{|| \m{h} ||} = \sum_{k=1}^n \varepsilon_k(\m{h}) \frac{h_k}{||\m{h} ||}.

Наконец, согласно ((1)),

h=h12++hn2max1inhi, || \m{h} || = \sqrt{h_1^2 + \cdots + h_n^2} \ge \max_{1\le i \le n} |h_i|,

тогда

hkh<himax1inhimax1inhimax1inhi=1 \frac{h_k}{|| \m{h}||} < \frac{h_i}{ \max_{1\le i \le n} |h_i|} \le \frac{\max_{1\le i \le n} |h_i|}{\max_{1\le i \le n} |h_i|} = 1

т. е. все дроби hkh\frac{h_k}{||\m{h}||} ограничены. Далее, так как εk(h)\varepsilon_k(\m{h}) бесконечно малые, мы получаем

f(a+h)f(a)=k=1nfxk(a)hk+o(h), f(\m{a} + \m{h}) - f(\m{a}) = \sum_{k=1}^n f'_{x_k}(\m{a}) h_k + o(||\m{h}||),

а это и означает, что ff дифференцируема.

Непрерывность линейных отображений

Напомним, что линейное отображение L:RnRmL: \mathbb{R}^n \to \mathbb{R}^m — это такое отображение, что

L(αv+βu)=αL(v)+βL(u), L(\alpha \m{v} + \beta \m{u}) = \alpha L(\m{v}) + \beta L(\m{u}),

для любых v,uRn\m{v}, \m{u} \in \mathbb{R}^n, α,βR\alpha,\beta \in \mathbb{R}.

Заметим, что

L(0n)=0m, L(\m{0}_n) = \m{0}_m,

где 0k\m{0}_k — нулевой вектор векторного пространства Rk\mathbb{R}^k.

Proof

(1) \Longrightarrow (2). Это просто следует из того, что если LL непрерывно, то оно непрерывно во всех точках R\mathbb{R}, в частности и в нуле тоже.

(2) \Longrightarrow (3). Если LL непрерывно в нуле, то это значит, что для любого ε>0\varepsilon >0 можно всегда найти такое δ>0\delta>0, что из h<δ||\m{h}|| <\delta будет следовать L(h)<ε||L(\m{h})|| <\varepsilon. Пусть ε=1\varepsilon = 1, тогда мы всегда найдём такой δ>0\delta>0, что если h<δ|| \m{h} || < \delta, то L(h)<1|| L(\m{h})|| < 1. Зафиксируем такое δ.\delta.

Возьмём теперь произвольный ненулевой вектор[1] v\m{v}, тогда имеем

L(v)=2δvL(δv2v)=2δvL(δv2v)<2δv\begin{align*} || L(\m{v}) || &=& \left\| \frac{2}{\delta} || \m{v} || L\left( \frac{\delta \m{v}}{2 || \m{v} ||}\right) \right\| \\ &=& \frac{2}{\delta} || \m{v}|| \cdot \left\| L\left( \frac{\delta \m{v}}{2 || \m{v} ||}\right) \right\| < \frac{2}{\delta} || \m{v}|| \end{align*}

потому что

δv2v=δ2<δ, \left\|\frac{\delta \m{v}}{2 || \m{v} ||} \right\| = \frac{\delta}{2} < \delta,

и так как δ фиксировано, мы получаем требуемое.

(3) \Longrightarrow (1). Имеем

L(v)L(u)=L(vu)Kuv, || L(\m{v}) - L(\m{u}) || = || L(\m{v} - \m{u}) || \le K || \m{u} - \m{v} ||,

тогда если uv<δ||\m{u} - \m{v}|| < \delta, то L(v)L(u)<Kδ|| L(\m{v}) - L(\m{u}) ||< K \delta, поэтому для любого ε>0\varepsilon >0, если мы положим, что 0<δ<εK0<\delta < \frac{\varepsilon}{K}, то мы и получаем непрерывность LL.

Proof

Пусть LL задаётся матрицей (ai,j)1in,1jm(a_{i,j})_{1\le i \le n, 1 \le j \le m}, тогда

L(v)=(a11a1nam1amn)(v1vn)=(a11v1++a1nvnam1v1++amnvn)=(u1,,um)=:uRm,L(\m{v}) = \begin{pmatrix} a_{11} & \ldots & a_{1n} \\ \vdots & \ddots & \vdots \\ a_{m1} & \ldots & a_{mn} \end{pmatrix} \begin{pmatrix} v_1 \\ \vdots \\ v_n \end{pmatrix} = \begin{pmatrix} a_{11}v_1 + \cdots + a_{1n}v_n \\ \vdots \\ a_{m1}v_1 + \cdots + a_{mn}v_n \end{pmatrix} = (u_1, \ldots, u_m)^\top =:\m{u} \in \mathbb{R}^m,

тогда

L(v)=u=(a11v1++a1nvn)2++(am1v1++amnvn)2mmax1kmak1v1++aknvnmmax1km(ak1v1++aknvn)mmax1km(ak1v++aknv)=mmax1km(ak1++akn)v=Kv,\begin{align*} ||L(\m{v})|| &=& ||\m{u}|| \\ &=& \sqrt{(a_{11}v_1 + \cdots + a_{1n}v_n)^2 + \cdots + (a_{m1}v_1 + \cdots + a_{mn}v_n)^2} \\ &\le & \sqrt{ m } \max_{1 \le k \le m} \left| a_{k1}v_1 + \cdots + a_{kn}v_n \right| \\ &\le & \sqrt{ m } \max_{1 \le k \le m} \left( |a_{k1}| \cdot |v_1| + \cdots + |a_{kn}| \cdot |v_n| \right) \\ &\le & \sqrt{ m } \max_{1 \le k \le m} \left(|a_{k1}| \cdot || \m{v}|| + \cdots + |a_{kn}| \cdot || \m{v}|| \right) \\ &=& \sqrt{ m } \max_{1 \le k \le m}\left(|a_{k1}| + \cdots + |a_{kn}| \right) \cdot || \m{v}|| \\ &=& K || \m{v}||, \end{align*}

где K:=mmax1km(ak1++akn)K: = \sqrt{ m } \max_{1 \le k \le m}\left(|a_{k1}| + \cdots + |a_{kn}| \right), тогда по Предложению Proposition 1 оно непрерывно.

Footnotes
  1. Аксиома Выбора позволяет.