[婆茶留高校数学科☆HP] Top pageに戻る このページを閉じる

チェーン・ルール(合成関数鎖律)とは
Copyright (C) virtual_high_school, 2018

§1. 言葉の由来

関数$y=f(u)$に関数$u=g(x)$を代入すれば、合成関数$y=f(g(x))=(f \circ g)(x)$ができあがる。これを$x$で微分すると
   $\frac{dy}{dx} = \frac{dy}{du} \frac{du}{dx}$ ……(1)
これをチェーン・ルール chain rule と呼ぶ。日本語だと鎖率となる。なぜチェーンなのかというと、「形が似ているから」とある本に書かれていた。$f$が多変数関数で
   $y=f(u_{1},u_{2},\cdots,u_{n})$
で、独立変数たちが$u_{1}=g_{1}(x), u_{2}=g_{2}(x), \cdots, u_{n}=g_{n}(x)$なら
   $\frac{dy}{dx} = \frac{dy}{du_{1}}\frac{du_{1}}{dx} + \frac{dy}{du_{2}}\frac{du_{2}}{dx} +\cdots + \frac{dy}{du_{n}}\frac{du_{n}}{dx}$ ……(2)
となる。この式の形がチェーン(下の写真)に似ているのだろう。
    

§2. 間違った証明

ところで、(1)の証明が高校の数学Ⅲの教科書に書かれているが、たいがい間違っている。その点を調べてみよう。
某教科書には、まず
   
と書いている。ここまでは間違いはない。問題なのはこの次だ。
   
ここで、
   $\lim_{\Delta x \rightarrow 0} \frac{\Delta y}{\Delta u} = \lim_{\Delta u \rightarrow 0} \frac{\Delta y}{\Delta u} $
としている所が間違いだ。証明の前段で述べている、
   $\Delta x \rightarrow 0 \mbox{のとき} \Delta u \rightarrow 0$
の部分を少し詳しく考えてみよう。
   
関数$u=g(x)$の挙動が上図(左)のようであれば、$\Delta u$は0にはならず、0に限りなく近づく。ところが(右)だと$\Delta x=0$の近傍で$\Delta u=0$とズッと0のままの状態で居続けるのである。後者の場合、$\lim_{\Delta x \rightarrow 0} \frac{\Delta y}{\Delta u} $ を計算しようとしても、$\Delta u=0$の状態から脱することができないのだから、$\frac{\Delta y}{\Delta u} $の分母は常に0になり、値を持たず、当然極限値も持たない。
蛇足ながら、(左)の場合なら、分母は常に0にならずに0に近づくだけだから、分数は値を持ち、極限値も持つのである。

§3. →の2つの意味

前節で述べた教科書による証明の間違いの原因を調べよう。我々は
   $x \rightarrow a \mbox{のとき} f(x) \rightarrow b$
という言い方をするが、左の→と右の→は意味が違う。
左の独立変数の方は、「$a$にはならずに$a$に限りなく近づく」のであって、右の従属変数の→は「常に$b$であってもよいし、$b$に等しくならず$b$に限りなく近づくのであっても、どっちでもよい」のである。大学風に書くと
   $\forall \varepsilon >0 \exists \delta >0: 0<| x-a | <\delta \Rightarrow |f(x)-b|< \varepsilon$
となる。独立側には$0<$が付くのに従属側にはそれが付かない。

関数の連続性の定義は
   $x \rightarrow a \mbox{のとき} f(x) \rightarrow f(a)$
だが、$\varepsilon-\delta$で書くと
   $\forall \varepsilon >0 \exists \delta >0: | x-a | <\delta \Rightarrow |f(x)-f(a)|< \varepsilon$
である。今度は独立側にも$0<$が付かない。
なんとも→は難しい。

§4. 正しい証明法

教科書の間違いを修正して、チェーンルールの証明を完成させよう。分母が0になるところがネックなのだから、分母を払ってしまえばよい。
そもそも微分係数の定義は
   $\Delta x \rightarrow 0 \mbox{のとき} \frac{f(a+\Delta x)-f(a)}{\Delta x} \rightarrow f'(a)$
だが、これを書き直していく。
   $\frac{f(a+\Delta x)-f(a)}{\Delta x} =f'(a)+o(1),\mbox{ただし}\Delta x \rightarrow 0 \mbox{のとき}o(1) \rightarrow 0$
   $f(a+\Delta x)-f(a) =f'(a)\Delta x+o(1)\cdot \Delta x$
   $f(a+\Delta x)=f(a) +f'(a)\Delta x+o(\Delta x),$
     $\mbox{ただし}\Delta x \rightarrow 0 \mbox{のとき} \frac{o(\Delta x)}{\Delta x}\rightarrow 0$ ……(3)
この最後の表式を使ってチェーンルールを証明するのである。上に出てきた$o(\Delta x)$をランダウのオーとか、$\Delta x$より高位の無限小という。
$o(\Delta x)$という関数は$\Delta x \rightarrow 0 $のとき$o(\Delta x)/\Delta x\rightarrow 0$であり、(3)を常に成り立たせるために$o(0)=0$と約束する。また、当然のことながら$o(\Delta x)=o(\Delta x)/\Delta x \cdot \Delta x \rightarrow 0$である。

(チェーンルールの証明)
   $g(x_{0}+\Delta x)=g(x_{0}) +g'(x_{0})\Delta x+o(\Delta x)$

   $f(u_{0}+\Delta u)=f(u_{0}) +f'(u_{0})\Delta u+o(\Delta u)$
の2つから、
   $\Delta u=g(x_{0}+\Delta x)-g(x_{0})=g'(x_{0})\Delta x+o(\Delta x)$
   $\Delta y=f(u_{0}+\Delta u)-f(u_{0})=f'(u_{0})\Delta u+o(\Delta u)$
となり、第1式を第2式に代入して
   $\Delta y=f'(u_{0})\{ g'(x_{0})\Delta x+o(\Delta x) \} + o(\Delta u)$
   $=f'(u_{0})g'(x_{0})\Delta x+f'(u_{0})o(\Delta x) + o(\Delta u)$
すなわち
   $(f\circ g)(x_{0}+\Delta x)=(f\circ g)(x_{0}) + f'(u_{0})g'(x_{0})\Delta x+f'(u_{0})o(\Delta x) + o(\Delta u)$
ここで
   $\frac{f'(u_{0})o(\Delta x) + o(\Delta u)}{\Delta x} =f'(u_{0})\cdot \frac{o(\Delta x)}{\Delta x} + \frac{o( \Delta u)}{\Delta x}$
が$\Delta x \rightarrow 0$のとき($\Delta u \rightarrow 0$ともなる)どうなるかを考える。第1項は$\rightarrow 0$で、第2項は常に$\Delta u=0$なら$o(\Delta u)/\Delta x =0$だし、そうでなければ$o(\Delta u)/\Delta u \cdot \Delta u/\Delta x \rightarrow 0 \times g'(x_{0})=0$だから全体として
   $\frac{f'(u_{0})o(\Delta x) + o(\Delta u)}{\Delta x} \rightarrow 0$
である。よって、
   $(f\circ g)(x_{0}+\Delta x)=(f\circ g)(x_{0}) + f'(u_{0})g'(x_{0})\Delta x+o(\Delta x)$ ……(4)
これを微分係数の定義式=(3)と比較すれば、
   $(f\circ g)(x_{0}) =f'(u_{0})g'(x_{0})$
これでチェーンルールが証明できた。■


★「婆茶留高校」は架空の存在であり、実在の人物、団体とは関係ありません。
<-- クリックして婆茶留高校へメール送信 mailto: virtual_h_s@yahoo.co.jp 
婆茶留高校数学科HP http://www.virtual-hs.com/ Powered by   Copyright(c) virtual_high_school, 2001-2022