[婆茶留高校数学科☆HP] Top pageに戻る このページを閉じる |
Copyright (C) virtual_high_school, 2018
§1. 言葉の由来
§2. 間違った証明
§3. →の2つの意味
§4. 正しい証明法
関数 $y=f(u)$ に関数 $u=g(x)$ を代入すれば、合成関数 $y=f(g(x))=(f \circ g)(x)$ ができあがる。これを$x$で微分すると
$\frac{dy}{dx} = \frac{dy}{du} \frac{du}{dx}$ ……(1)
これをチェーン・ルール chain rule と呼ぶ。日本語だと鎖率となる。なぜチェーンなのかというと、「形が似ているから」とある本に書かれていた。$f$ が多変数関数で
$y=f(u_{1},u_{2},\cdots,u_{n})$
で、独立変数たちが $u_{1}=g_{1}(x), u_{2}=g_{2}(x), \cdots, u_{n}=g_{n}(x)$ なら
$\frac{dy}{dx} = \frac{dy}{du_{1}}\frac{du_{1}}{dx} + \frac{dy}{du_{2}}\frac{du_{2}}{dx}
+\cdots + \frac{dy}{du_{n}}\frac{du_{n}}{dx}$ ……(2)
となる。この式の形がチェーン(下の写真)に似ているのだろう。
ところで、(1)の証明が高校の数学Vの教科書に書かれているが、たいがい間違っている。その点を調べてみよう。
某教科書には、まず
と書いている。ここまでは間違いはない。問題なのはこの次だ。
ここで、
$\displaystyle \lim_{\Delta x \rightarrow 0} \frac{\Delta y}{\Delta u} = \lim_{\Delta
u \rightarrow 0} \frac{\Delta y}{\Delta u} $
としている所が間違いだ。証明の前段で述べている、
$\Delta x \rightarrow 0$ のとき $\Delta u \rightarrow 0$
の部分を少し詳しく考えてみよう。
関数 $u=g(x)$ の挙動が上図(左)のようであれば、$\Delta u$ は 0 にはならず、0 に限りなく近づく。ところが(右)だと $\Delta x=0$ の近傍で $\Delta u=0$ とズッと 0 のままの状態で居続けるのである。後者の場合、$\displaystyle \lim_{\Delta x \rightarrow 0} \frac{\Delta y}{\Delta u} $ を計算しようとしても、$\Delta u=0$ の状態から脱することができないのだから、$\frac{\Delta y}{\Delta u} $ の分母は常に 0 になり、値を持たず、当然極限値も持たない。
蛇足ながら、(左)の場合なら、分母は常に0にならずに0に近づくだけだから、分数は値を持ち、極限値も持つのである。
前節で述べた教科書による証明の間違いの原因を調べよう。我々は
$x \rightarrow a $ のとき $f(x) \rightarrow b$
という言い方をするが、左の→と右の→は意味が違う。
左の独立変数の方は、「$a$にはならずに$a$に限りなく近づく」のであって、右の従属変数の→は「常に$b$であってもよいし、$b$ に等しくならず
$b$ に限りなく近づくのであっても、どっちでもよい」のである。大学風に書くと
$\forall \varepsilon >0 \exists \delta >0: 0<| x-a | <\delta
\Rightarrow |f(x)-b|< \varepsilon$
となる。独立側には "$0<$" が付くのに従属側にはそれが付かない。
関数の連続性の定義は
$x \rightarrow a$ のとき $ f(x) \rightarrow f(a)$
だが、$\varepsilon-\delta$ で書くと
$\forall \varepsilon >0 \exists \delta >0: | x-a | <\delta
\Rightarrow |f(x)-f(a)|< \varepsilon$
である。今度は独立側にも "$0<$" が付かない。
なんとも→は難しい。
教科書の間違いを修正して、チェーンルールの証明を完成させよう。分母が0になるところがネックなのだから、分母を払ってしまえばよい。
そもそも微分係数の定義は
$\Delta x \rightarrow 0 $ のとき $ \frac{f(a+\Delta x)-f(a)}{\Delta x}
\rightarrow f'(a)$
だが、これを書き直していく。
$\frac{f(a+\Delta x)-f(a)}{\Delta x} =f'(a)+o(1)$, ただし $\Delta x \rightarrow
0 \mbox{のとき}o(1) \rightarrow 0$
$f(a+\Delta x)-f(a) =f'(a)\Delta x+o(1)\cdot \Delta x$
$f(a+\Delta x)=f(a) +f'(a)\Delta x+o(\Delta x),$
ただし $\Delta x \rightarrow 0$ のとき $ \frac{o(\Delta x)}{\Delta x}\rightarrow
0$ ……(3)
この最後の表式を使ってチェーンルールを証明するのである。上に出てきた $o(\Delta x)$ をランダウのオーとか、$\Delta x$ より高位の無限小という。
$o(\Delta x)$ という関数は $\Delta x \rightarrow 0 $ のとき $o(\Delta x)/\Delta
x\rightarrow 0$ であり、(3)を常に成り立たせるために $o(0)=0$ と約束する。また、当然のことながら $o(\Delta
x)=o(\Delta x)/\Delta x \cdot \Delta x \rightarrow 0$ である。
(チェーンルールの証明)
$g(x_{0}+\Delta x)=g(x_{0}) +g'(x_{0})\Delta x+o(\Delta x)$
と
$f(u_{0}+\Delta u)=f(u_{0}) +f'(u_{0})\Delta u+o(\Delta u)$
の2つから、
$\Delta u=g(x_{0}+\Delta x)-g(x_{0})=g'(x_{0})\Delta x+o(\Delta x)$
$\Delta y=f(u_{0}+\Delta u)-f(u_{0})=f'(u_{0})\Delta u+o(\Delta u)$
となり、第1式を第2式に代入して
$\Delta y=f'(u_{0})\{ g'(x_{0})\Delta x+o(\Delta x) \} + o(\Delta u)$
$=f'(u_{0})g'(x_{0})\Delta x+f'(u_{0})o(\Delta x) + o(\Delta u)$
すなわち
$(f\circ g)(x_{0}+\Delta x)=(f\circ g)(x_{0}) + f'(u_{0})g'(x_{0})\Delta
x+f'(u_{0})o(\Delta x) + o(\Delta u)$
ここで
$\frac{f'(u_{0})o(\Delta x) + o(\Delta u)}{\Delta x} =f'(u_{0})\cdot
\frac{o(\Delta x)}{\Delta x} + \frac{o( \Delta u)}{\Delta x}$
が $\Delta x \rightarrow 0$ のとき ($\Delta u \rightarrow 0$ ともなる) どうなるかを考える。第1項は$\rightarrow
0$ で、第2項は常に $\Delta u=0$ なら $o(\Delta u)/\Delta x =0$ だし、そうでなければ $o(\Delta
u)/\Delta u \cdot \Delta u/\Delta x \rightarrow 0 \times g'(x_{0})=0$ だから全体として
$\frac{f'(u_{0})o(\Delta x) + o(\Delta u)}{\Delta x} \rightarrow 0$
である。よって、
$(f\circ g)(x_{0}+\Delta x)=(f\circ g)(x_{0}) + f'(u_{0})g'(x_{0})\Delta
x+o(\Delta x)$ ……(4)
これを微分係数の定義式=(3)と比較すれば、
$(f\circ g)(x_{0}) =f'(u_{0})g'(x_{0})$
これでチェーンルールが証明できた。■
[婆茶留高校数学科☆HP] Top pageに戻る このページを閉じる |