Skip to article frontmatterSkip to article content

Дифференцируемость

Higher School of Economics

Напомним, что векторное пространство Rn\mathbb{R}^n это просто набор {(x1,,xn)}\{(x_1,\ldots, x_n)^\top\} столбцов, которые можно покомпонентно складывать и умножать на число. Выделяется особый набор таких столбцов e={e1,,en}\mathbb{e} = \{\mathbf{e}_1, \ldots, \mathbf{e}_n\}, где e1=(1,0,,0),,en=(0,0,,1)\mathbf{e}_1 = (1,0, \ldots, 0)^\top, \ldots, \mathbf{e}_n = (0,0,\ldots, 1)^\top. Множество таких столбцов называется стандартным базисом для Rn\mathbb{R}^n. Имеют место очевидные равенства, возьмём x=(x1,,xn)Rn\mathbf{x} = (x_1,\ldots, x_n)^\top \in \mathbb{R}^n, тогда ясно, что

(x1xn)=x1(10)++xn(01)\begin{pmatrix} x_1 \\ \vdots \\x_n \end{pmatrix} = x_1 \begin{pmatrix} 1 \\ \vdots \\ 0 \end{pmatrix} + \cdots + x_n \begin{pmatrix} 0 \\ \vdots \\1 \end{pmatrix}

Линейное отображение L:RnRm\mathscr{L}:\mathbb{R}^n \to \mathbb{R}^m — это такое отображение, что L(αx+βy)=αL(x)+βL(y)\mathscr{L}(\alpha \m{x} +\beta \m{y} ) = \alpha \mathscr{L}(\m{x}) +\beta \mathscr{L}(\m{y}), где x,yRn\m{x,y} \in \mathbb{R}^n, α,βR.\alpha, \beta \in \mathbb{R}.

Любое линейное отображение L:RnRm\mathscr{L}:\mathbb{R}^n \to \mathbb{R}^m удобно задавать матрицей LL. Так как оно линейно, то достаточно знать образы базисных векторов. Действительно, пусть

L:(100)(a11a21am1),L:(010)(a12a22am2),,L:(001)(a1na2namn) \mathscr{L}: \begin{pmatrix} 1 \\ 0 \\ \vdots \\ 0 \end{pmatrix} \mapsto \begin{pmatrix} a_{11} \\ a_{21} \\ \vdots\\ a_{m1} \end{pmatrix}, \qquad \mathscr{L}: \begin{pmatrix} 0 \\ 1 \\ \vdots \\ 0 \end{pmatrix} \mapsto \begin{pmatrix} a_{12} \\ a_{22} \\ \vdots\\ a_{m2} \end{pmatrix}, \quad \ldots, \quad \mathscr{L}: \begin{pmatrix} 0 \\ 0 \\ \vdots \\ 1 \end{pmatrix} \mapsto \begin{pmatrix} a_{1n} \\ a_{2n} \\ \vdots\\ a_{mn} \end{pmatrix}

тогда матрица принимает вид

L=(a11a12a1na21a22a2nam1am2amn) L = \begin{pmatrix} a_{11} & a_{12} & \ldots & a_{1n} \\ a_{21} & a_{22} & \ldots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \ldots& a_{mn} \end{pmatrix}
Линейное отображение f:\mathbb{R}^2 \to \mathbb{R}^2, которое задаётся матрицей A = \begin{pmatrix}
a & c \\
b & d
\end{pmatrix}.

Figure 1:Линейное отображение f:R2R2f:\mathbb{R}^2 \to \mathbb{R}^2, которое задаётся матрицей A=(acbd).A = \begin{pmatrix} a & c \\ b & d \end{pmatrix}.

Разумеется, не все отображения линейны. Однако некоторые из них локально очень похожи на линейные. Чтобы формализовать эту идею, вводят понятие дифференцируемости.

Прежде всего, мы должны убедиться, что линейные отображения тоже дифференцируемы.

Proof

Действительно, так как L\mathscr{L} — линейное, то для любых x,hRn\m{x,h} \in \mathbb{R}^n,

L(x+h)=L(x)+L(h), \mathscr{L}(\m{x}+\m{h}) = \mathscr{L}(\m{x}) + \mathscr{L}(\m{h}),

полагая теперь, что dLx:=L\mathrm{d}\mathscr{L}_\mathbf{x}:=\mathscr{L}, и так как нулевая функция 0, очевидно, лежит в o(h)o(||\m{h}||), мы и получаем требуемое.

В дальнейшем нам понадобится следующая

Proof

Так как h=h12++hn2|| \m{h} || = \sqrt{h_1^2 + \cdots + h^2_n}, то согласно неравенству ((1)),

max1knhkhnmax1knhk \max_{1\le k \le n} |h_k| \le || \m{h} || \le \sqrt{n} \max_{1\le k \le n} |h_k|

поэтому если h0||\m{h} || \to 0, то hk0|h_k| \to 0, что и доказывает требуемое.

Proof

Возьмём произвольный ненулевой вектор hRn\m{h} \in \mathbb{R}^n и рассмотрим выражение F(x0+h)F(x0)F(\m{x}_0 + \m{h}) - F(\m{x}_0), так как FF — дифференцируемо в x0\m{x}_0, то

limh0F(x0+h)F(x0)h=(dF)x0(h)Rm,\lim_{\m{h} \to \m{0}} \frac{F(\m{x}_0 + \m{h}) - F(\m{x_0})}{|| \m{h} ||} = (\mathrm{d}F)_{\m{x}_0}(\m{h}) \in \mathbb{R}^m,

тогда

limh0(F(x0+h)F(x0))=limh0F(x0+h)F(x0)hh=(dF)x0(h)limh0h=0,\begin{align*} \lim_{\m{h} \to \m{0}}( F(\m{x}_0 + \m{h}) - F(\m{x}_0) ) &=& \lim_{\m{h} \to \m{0}} \frac{F(\m{x}_0 + \m{h}) - F(\m{x_0})}{|| \m{h} ||} || \m{h}|| \\ &=& (\mathrm{d}F)_{\m{x}_0}(\m{h}) \lim_{\m{h} \to \m{0}} || \m{h} || \\ &=& 0, \end{align*}

но тогда limvx0F(v)=F(x0)\lim_{\m{v} \to \m{x}_0}F(\m{v}) = F(\m{x}_0) но это и означает непрерывность F.F.[1]

Дифференцируемость функций от одной переменной.

Пусть n=m=1n=m=1, тогда любое линейное отображение L:RR\mathscr{L}:\mathbb{R} \to \mathbb{R} имеет простой вид L(x)=kx\mathscr{L}(x) = kx, kRk \in \mathbb{R} — фиксированное число, и h:=h||\m{h}|| : = |h| — обыкновенный модуль. Тогда, согласно определению, функция f:RRf:\mathbb{R} \to \mathbb{R} дифференцируема в точке x0x_0, если существует такое число kRk\in \mathbb{R}, что

f(x0+h)=f(x0)+kh+o(h),h0. f(x_0+h) = f(x_0)+kh + o(h), \qquad h \to 0.

Рассмотрим примеры.

Вернёмся к функциям от одной переменной.

Запись f(x0+h)=f(x0)+kx0+o(h),f(x_0+h) = f(x_0)+kx_0 + o(h), h0h \to 0 означает также, что

k=limh0f(x0+h)f(x0)h k = \lim_{h \to 0} \frac{f(x_0 +h) - f(x_0)}{h}

таким образом, дифференцируемость функции равносильна существованию этого предела.

Нам нужно показать, что limxx0f(x)=f(x0)\lim_{x \to x_0}f(x) = f(x_0), так как значение f(x0)f(x_0) по определению определено. Пусть x:=x0+hx:=x_0 +h, тогда если h0h \to 0, то xx0x \to x_0 и тогда из определения производной в точке x0x_0 следует, что существует предел

f(x0)=limxx0f(x)f(x0)xx0. f'(x_0) = \lim_{x\to x_0} \frac{f(x) - f(x_0)}{x-x_0}.

Имеем

f(x)f(x0)=f(x)f(x0)xx0(xx0), f(x) - f(x_0) = \frac{f(x) - f(x_0)}{x-x_0}(x-x_0),

тогда

limxx0(f(x)f(x0))=limxx0f(x)f(x0)xx0(xx0)=f(x0)limxx0(xx0)=0,\begin{align*} \lim_{x \to x_0} (f(x) - f(x_0)) &=& \lim_{x \to x_0}\frac{f(x) - f(x_0)}{x-x_0}(x-x_0) \\ &=& f'(x_0) \lim_{x \to x_0}(x-x_0) \\ &=& 0, \end{align*}

т. е. limxx0f(x)=f(x0)\lim_{x \to x_0} f(x) = f(x_0), что и означает её непрерывность.\

Типичные недифференцируемые функции

Позже мы покажем, что если функция дифференцируема в точке, то к ней можно провести касательную в этой точке. Физически дифференцируемость функции от одной переменной означает, что скорость процесса (который описывается заданной функцией) меняется непрерывно от точки к точке, т. е. не может быть мгновенного скачка скорости в какой-то точке.

Красным показан график функции f(x) = |x|, а синим — график функции g(x) = \mathrm{sign}(x), мы видим, что g(x) делает резкий скачок в точке 0, что и означает, что функция f(x) недифференцируема.

Красным показан график функции f(x)=xf(x) = |x|, а синим — график функции g(x)=sign(x)g(x) = \mathrm{sign}(x), мы видим, что g(x)g(x) делает резкий скачок в точке 0, что и означает, что функция f(x)f(x) недифференцируема.

График функции Вейерштрасса

Figure 4:График функции Вейерштрасса

Proof

(1) Это сразу следует из того, что предел суммы — это сумма пределов.

Footnotes
  1. мы тут положили, что v:=x0+h\m{v}: = \m{x}_0 +\m{h}.