EMANの物理学 過去ログ No.7410 〜

 ● 解析力学のラグランジュの運動方程式

  投稿者:じーつー - 2009/08/13(Thu) 22:05  No.7410 
解析力学のラグランジュの運動方程式に関する質問・・・のつもりですが、ほとんど数学の初歩の質問です。
まだ自分でもちゃんと検証したわけでもないのでモヤモヤした質問ですが・・・。

位置<tex>x</tex>、速度<tex>v</tex>、ラグランジアンを<tex>L(x,\dot x)</tex>としたとき、ラグランジュの運動方程式は

<tex>{d \over dt } \left( { \partial L \over \partial v } \right)- { \partial L \over \partial x }=0</tex>

です。そして、適当なラグランジアンが与えられ

<tex>x=f(t)</tex>

という軌跡が求められたとします。また、当然

<tex>v &= {dx \over dt} \\&= f'(t) \equiv g(t)</tex>

も成り立ちます。しかし、このときいろいろな条件はありますが

<tex>t = f^{-1}(x)</tex>

なので、次のようになってしまうと思います。

<tex>v &= g(t) \\ &= g(f^{-1}(x)) \equiv h(x)</tex>

つまり、速度<tex>v</tex>を位置<tex>x</tex>で置き換えられます。しかし、置き換えてしまうと
いろいろ変なことが起こってしまいます。

例えば、ラグランジアンは位置<tex>x</tex>のみの関数<tex>L(x,v)=L_1(x)</tex>になるので、必ず

<tex>{ \partial L \over \partial v }=0</tex>

となります。そのため、ラグランジュの運動方程式は

<tex>{ \partial L \over \partial x }=0</tex>

となり、ラグランジアンは速度<tex>v</tex>のみの任意の関数<tex>L(x,v)=L_2(v)</tex>になります。位置<tex>x</tex>のみの関数だったのに、
いつのまにか速度<tex>v</tex>のみの関数に変わっています。おそらく、

<tex>L_2(v)=L_1(h^{-1}(v))</tex>

です。また、部分的に速度<tex>v</tex>を位置<tex>x</tex>に置き換えれば

<tex>L_2(v)=L(x,v)</tex>

と復元できると思われます。


ちょっとわき道に逸れてしまいましたが、私が一番疑問に思うことは、
「ラグランジュの運動方程式の段階では位置と速度が独立だったが、解が求まったとたんに独立でなくなるのはおかしいのではないか」
ということです。変分の辺りに答えがある気もしますが、よくわかりません。
なぜ、位置と速度を独立に扱うのでしょうか。

  投稿者:hirota - 2009/08/14(Fri) 09:50  No.7419 
位置と速度は独立じゃありません。
位置関数 x(t) が決まれば速度関数 v(t)=dx(t)/dt は一意に決まります。
ラグランジアン L( t, x(t), dx(t)/dt ) による作用積分は位置関数 x(t) だけの汎関数です。
汎関数 ( x(t) 全体の関数 ) なので、ラグランジアンの段階で関数値だけを見て代入置換するのは無意味です。
関数値だけの代入置換に意味があるのは、解を1つに確定した後だけです。(運動方程式の段階でも無数の解がある)

  投稿者:yuya - 2009/08/14(Fri) 21:59  No.7423  <Home>
初めて解析力学を学んだとき、私もものすごーく気になりました。

 $x(t)$ さえ決まれば $v(t)$ は決まるのに、あたかも独立なもののごとく扱って
問題が生じてしまわないのか?

よくよく考えてみると、これは解析力学の理解というより、
偏微分という数学の理解に原因があるのではないでしょうか。

例えば、 $f(x, t) = 2x + t^2$ という関数を考えます。
ところが実は $x$ と $t$ は独立でなく、 $x(t) = t^2$ だったとします。
このとき、 $\partial f / \partial x$ はどうなるでしょうか?
2?3?

  投稿者:じーつー - 2009/08/15(Sat) 01:57  No.7426 
>hirotaさん
4行目について解説していただけると助かります。
なぜ、汎関数だとラグランジアンの段階で代入置換することは無意味なのでしょうか。

>yuyaさん
オイラー微分とラグランジュ微分の話でしょうか?ネットだと

http://www2.nict.go.jp/y/y222/SMILES/MACS/9/note/rikigaku.html

くらいしか見つけられませんでした。私は、実はこの辺りの話も把握できていません。
<tex>f(x,t)=2x+t^2</tex>に対しては、<tex>x</tex>での偏微分は

<tex>{\partial f \over \partial x}= 2 </tex>

ですが、全微分は

<tex>{d f \over d x} &= {d \over dx}(2x) + {d \over dx}(t^2) \\                &= 2 + {d \over dx}(x) \\                &= 2 + 1 \\                &= 3 \\</tex>

・・・となると思うんですが、やっぱり偏り微分は代入の具合で変わってくるように思うんです。
例えば <tex>t \geq 0</tex> と仮定すると <tex>x(t)=t^2</tex>より、<tex>t=\sqrt{x(t)}</tex> となります。
これも使って、新たに以下の2通りの置き換えで<tex>x</tex>での偏微分をやってみます。

<tex>f(x,t) &= 3t^2 &(1) \\     f(x,t) &= 2x + t \sqrt{x} &(2)</tex>

結果は、(1)は0で、(2)は
<tex>2 + {t \over 2 \sqrt{x}} &= 2 + {\sqrt{x} \over 2 \sqrt{x}} \\&= {3 \over 2} </tex>
です。こうなるともう何がなんだかわかりません。
全微分はすべて同じだと思うのですが、偏微分は"置き換え具合"で結果が変わってしまいます。
これがこのあたりの一番の疑問点です。

  投稿者:yuya - 2009/08/15(Sat) 19:56  No.7434  <Home>
そういうふうに混乱するのが、当然の反応だと思います。
原始的には偏微分というのは2つ以上の【独立】変数をもつ関数に対して考え出されたものですから、
 $f(x, t)$ の $x$ と $t$ が独立でない場合には、
それこそ「置き換え具合」によって結果が変わってしまうように思えますよね。

こういう場合にも偏微分を便利に運用(というか流用)するには、どう決めておけばよいでしょうか。

例えば、全微分は

<tex>\D f = \frac{\partial f}{\partial x} \D x + \frac{\partial f}{\partial t} \D t</tex>

ですが、この両辺を $\D t$ で割ると

<tex>\frac{\D f}{\D t} = \frac{\partial f}{\partial x} \frac{\D x}{\D t} + \frac{\partial f}{\partial t}</tex>

となります。前の例( $f = 2x + t^2$ 、 $x = t^2$ )では
<tex>\frac{\D f}{\D t} = \frac{\D}{\D t}(3t^2) = 6t</tex>

<tex>\frac{\D x}{\D t} = \frac{\D}{\D t}(t^2) = 2t</tex>
ですから(ここは意見が分かれないはず)、これらを用いて逆に考えると

<tex>6t = \frac{\partial f}{\partial x} \cdot 2t + \frac{\partial f}{\partial t}</tex>   ……(*)

が成り立っていると便利です。

いま、 $x$ と $t$ が独立でないことを、なぁ〜んにも考えない人が、「アハハ〜」とか言いながら

<tex>\frac{\partial f}{\partial x} = \frac{\partial}{\partial x}{(2x + t^2)} = 2</tex>

<tex>\frac{\partial f}{\partial t} = \frac{\partial}{\partial t}{(t^2 + 2x)} = 2t</tex>

と計算したとします。これを(*)に入れてみると、ちゃんと

<tex>6t = 2 \cdot 2t + 2t</tex>

となっています。つまり、これでいいわけです。

これを見ると、偏微分の際に、独立でないことを考慮してわざわざ置き換えたりする気が失せますよね。

というわけで、はじめは独立変数について編み出された偏微分ですが、
独立でない場合でも、書かれているとおりに(独立な場合と同じように)偏微分する(と約束しておく)のが、
いちばん偏微分の「資産」を有効活用できるわけです。

とりあえず解析力学の勉強を進めるに際しては、
「 $x(t), v(t)$ についての方程式」と「 $v(t) = \dot x (t)$ 」という
【連立方程式】を解いている、と考えればよいのではないでしょうか。

  投稿者:murak - 2009/08/16(Sun) 08:08  No.7446 
まずはyuyaさんの持ち出した例

   2変数関数 <tex> f(x,t)=2x + t^2 </tex> において <tex>x</tex><tex>t</tex> の間に <tex> x(t)=t^2 </tex> という関係がある場合の偏微分と全微分

の問題から。

最初にことわっておくと、2変数関数 <tex>f(x,t)</tex> そのものに対して、偏導関数 <tex>\partial f/\partial x</tex><tex>\partial f/\partial t</tex> には意味があるが、<tex>df/dx</tex> には(数学概念としては)意味がない。では全微分とは何かと云うと、ある一次元のパラメータ <tex>s</tex> から <tex>(x,t)</tex> 平面への写像 <tex>(x(s),t(s))</tex> が与えられた場合の(合成関数としての)微分

     <tex>\frac{df(x(s),t(s))}{ds}=\frac{\partial f(x,t)}{\partial x}\frac{d x(s)}{ds}+\frac{\partial f(x,t)}{\partial t}\frac{d t(s)}{ds}</tex>

のことで、 これを略して

     <tex>df=\frac{\partial f}{\partial x}dx+\frac{\partial f}{\partial t}dt</tex>

と書くのである。従って、<tex>df/dx</tex> というものに何等かの意味を(どうしても)見出したいのなら、上の <tex>df/ds</tex> の標式において、<tex>x(s)=s</tex> となる特別の場合を考えて、その結果において変数 <tex>s</tex><tex>x</tex> に置き換えたものだと解釈せねばならない。 (なので、2変数関数 <tex>f</tex><tex>df/dx</tex> を求めるのに、上の <tex>df</tex> の(省略された)標式において、「その両辺を <tex>dx</tex> で割って・・・」とするのは、作法としては本当は正しくない。合成関数の微分の式で <tex>dx(s)/ds=1</tex> となるので、<tex>s</tex><tex>x</tex> で置き換えた際に、結果として正しく見えるだけである。)

つまり2変数関数 <tex>f(x,t)=2x+t^2</tex> に関する <tex>\partial f/\partial x</tex> とは、<tex>x, t</tex> の間に従属関係があろうがなかろうが、常に <tex>2</tex> なのであり、従属関係がある場合は、その従属関係から決まる <tex>x(s), t(s)</tex> を用いて(合成関数の微分により) <tex>df/ds</tex> を計算すれば(全微分について)いつでも正しい結果が得られる事になっている。(というかそれが正式の作法であり、その正しさを保証するためにも、偏微分 <tex>\partial f/\partial x</tex> は(この場合)いつでも <tex>2</tex> であると考えなくてはならない。)

以上のことをふまえると、解析力学に現れるラグランジュ関数の微分 <tex>\partial L/\partial v</tex> も、それは単に2変数関数 <tex>L(\cdot,\cdot)</tex> の偏導関数という意味しか持っておらず、<tex>x, v</tex> に従属関係があろうが無かろうが、機械的に偏微分の計算を実行するだけで良いことになる。(ちなみに、解析力学が扱うのは運動方程式を解く事ではなく、<tex>x</tex><tex>v</tex> の関係としての運動方程式を求める(見出す)ことである。)

  投稿者:yuya - 2009/08/16(Sun) 10:04  No.7450  <Home>
murakさん、ありがとうございます。

自分の説明の問題点がよく分かりました。

まず全微分を省略せずに

<tex>\frac{\D f}{\D t} = \frac{\partial f}{\partial x} \frac{\D x}{\D t} + \frac{\partial f}{\partial y} \frac{\D y}{\D t}</tex>

と書いて、しかるのち、 $f(x(t), y(t))$ という関数の【ひとつ】である $f(x(t), t)$ というものを考えると、(すなわち $y(t) = t$ )、

【たまたま】<tex>\frac{\D y}{\D t} = 1</tex>となるので、

<tex>\frac{\D f}{\D t} = \frac{\partial f}{\partial x} \frac{\D x}{\D t} + \frac{\partial f}{\partial y}</tex>

が得られる、というのが正しい作法ですね。

……とまぁ、こういうふうに、生徒(私)が生徒(じーつーさん)に教えているのを見て、
まずいところがあると、さらに上の先生(murakさん)が指摘してくださる。(これぞ寺子屋!?)
一番トクをするのはたいてい真ん中の人間(つまり私)なんですよねー(笑)。
ここで頻繁に質問している人も、思い切って答える側に回ってみると、すごくトクをしますよ。

  投稿者:じーつー - 2009/08/16(Sun) 16:09  No.7458 
みなさんどうもありがとうございます。
管理人のEMANさんも、誤投稿を消してくれてありがとうございました。

みなさんの書き込みをもとに、自分でも少し考えてみました。

まず、例えば単振動に対して、私の考えを具体化してみます。
ラグランジュの運動方程式が解けたときの解として、今回はもっともらしく三角関数のものを仮定します。

<tex>&L(x,v)={1 \over 2}mv^2 - {1 \over 2}m \omega^2 x^2 \\&x = A \sin (\omega t + \alpha) \\&v = A \omega \cos (\omega t + \alpha)</tex>

において、<tex>t = {1 \over \omega} \left\{\sin^{-1} \left( {x \over A} \right) - \alpha  \right\}</tex> より

<tex>v = A \omega \cos \left\{ \sin^{-1} \left( {x \over A} \right) \right\} </tex>

となります。今回は小細工を使うために <tex>v \geq 0 </tex> のときを考えます。すると

<tex>v &= A \omega \sqrt{ 1 - \left[ \sin \left\{ \sin^{-1} \left( {x \over A} \right) \right\} \right]^2 } \\&= \omega \sqrt{ A^2 - x^2 } </tex>

となります。結果ラグランジアンは"置き換え"が起こって

<tex>L(x,v) &= {1 \over 2}m \omega^2 \left( A^2 - x^2 \right) - {1 \over 2}m \omega^2 x^2 \\&= - m \omega^2 x^2 + {1 \over 2}m \omega^2 A^2 \\&\equiv L_1(x)</tex>

となります。また、当然<tex>v = \omega \sqrt{ A^2 - x^2 } </tex>より、<tex>v</tex>のときのように<tex>x \geq 0 </tex>のときを考えると

<tex>x = \sqrt{ A^2 - \left( v \over \omega \right)^2 } </tex>

なので、ラグランジアンの"置き換え"を再び行うと

<tex>L(x,v) &= L_1(x) \\&= {1 \over 2}m \omega^2 A^2 - m \omega^2 x^2 \\&= {1 \over 2}m \omega^2 A^2 - m \omega^2 \left\{ A^2 - \left( v \over \omega \right)^2 \right\} \\&= mv^2 - {1 \over 2}m \omega^2 A^2 \\&\equiv L_2(v)</tex>

となります。ということは、<tex>x</tex><tex>v</tex>の、パラメータ<tex>t</tex>を通じての従属関係があると仮定すると
ラグランジアンの見た目の形(<tex>x</tex><tex>v</tex>の入り方)が一意には決まらない、ということになります。
なのに、解は求めることができる。これが不思議です。
(しかし、ラグランジュの運動方程式を解かなくては<tex>x</tex><tex>v</tex>の従属関係、さらにはそれぞれの
パラメータ<tex>t</tex>との従属関係も求まることはありません。解く前に従属関係を仮定して進めることは
未知関数を増やすだけなので、逆効果です。)


そして、これは突き詰めれば"1変数関数の偏微分"とでもいうものになります。関数<tex>f(x,t)</tex>に対して全微分は
<tex>df = {\partial f \over \partial x}dx + {\partial f \over \partial t}dt</tex>
となります。しかし、これに対して<tex>x</tex>を部分的に<tex>x = x(t)</tex>で、<tex>t</tex>の関数に置き換えた新たな関数
<tex>f(x,t) = g(x,t)</tex>に対して全微分をすると
<tex>dg = {\partial g \over \partial x}dx + {\partial g \over \partial t}dt</tex>
になります。<tex>df=dg</tex>も明らかです。
これは、もとの関数は同じなのに、偏微分の部分に変更が加えられたことになります(<tex>f(x,t)=2x + t^2</tex>の私の計算のように)。
yuyaさんの言うとおり、全微分は変わりません。しかし、偏微分は変わります。しかし、これはmurakさんの
<tex>\partial f / \partial x</tex>は、常に2」に矛盾します。
同じ関数なのに置き換え具合で偏微分が変わるのは、何も問題はないのでしょうか。偏微分が物理量を表すことはよくありますが。
その辺りの"補正"が、<tex>dx / ds</tex><tex>dt</tex>の項で行われているのでしょうか。

  投稿者:murak - 2009/08/17(Mon) 00:49  No.7463 
> 「<tex>\partial f / \partial x</tex>は、常に2」に矛盾します。

どうやら、言いたい事が上手く伝わらなかったようです。

再度  $f(x, t) = 2x + t^2$  という関数で考えてみましょう。
私が言いたかったのは、一度  $f(x,t)$  を上の様に決めたなら、その後で  $x, t$  に何等かの従属関係をおくつもりがあるか無いかにかかわらず、 $\partial f / \partial x$  はいつでも $2$ であり、 $\partial f / \partial t$  は  $2t$  であって、全微分の関係式

     <tex> df = 2 dx + 2t dt </tex>

が成り立っているという事です。ここでもし  $x, t$  に  $x(t)=t^2$  という関係式が成り立っていると考えるなら、その関係を上の全微分の式に代入する事で  $df=3dx$  すなわち  $df/dx=3$  という結論が得られますが、この結果は  $f(x,t)=2x+t^2$  に  $x(t)=t^2$  という関係式(を逆に解いたもの)を最初から代入して得られる  $f(x,t(x))$  という関数を $x$ で常微分したもの $df(x,t(x))/dx=3$ と一致します。これはまさしく、yuyaさんやじーつーさん自身が「全微分は全て同じ」と述べている事に他なりませんが、もう少し注意喚起しておくと、この計算は、 $x,t$ の間の関数関係として全く別のものを持ち込んでも同様に遂行できますが、その場合でも $\partial f/ \partial x$ としては同じ $2$ が使われます。私が「<tex>\partial f / \partial x</tex>は、常に2」と書いたのはそのような意味です。


(ちょっと中途半端ですが、時間の関係で以下後日)

  投稿者:yuya - 2009/08/17(Mon) 09:37  No.7466  <Home>
2つの関数 $2x + t^2$ と $x + t^2$ に対して、
それぞれ背景に $x = t^2$ という従属関係がある場合と、
 $x = 2t^2$ という従属関係がある場合とを考えます。

・ $2x + t^2$ について
(ア)  $x = t^2$ のとき
<tex>\frac{\partial}{\partial x}(2x + t^2) = 2</tex>
(イ)  $x = 2t^2$ のとき
やっぱり、
<tex>\frac{\partial}{\partial x}(2x + t^2) = 2</tex>

・ $x + t^2$ について
(ウ)  $x = t^2$ のとき
<tex>\frac{\partial}{\partial x}(x + t^2) = 1</tex>
(エ)  $x = 2t^2$ のとき
やっぱり、
<tex>\frac{\partial}{\partial x}(x + t^2) = 1</tex>

(ア)と(イ)は $t$ で書くと異なるのに、偏微分の結果は同じ。((ウ)と(エ)も同様)。
(ア)と(エ)は $t$ で書くとどちらも $3t^2$ になるのに、偏微分の結果は異なる。

これらがとても不思議に感じる、ということですよね。

汎関数というのは、大雑把に言えば「関数の形によって値が定まる」ような関数ですから、
どんな従属関係が潜んでいようとも、それは汎関数についての方程式を解いた【後】の話であって、
偏微分する前に勝手に書き換えてはいけないわけです。

(うーむ、そういう意味では「連立方程式を解いていると考えればいい」という前の私の説明は良くないか。)

ピンと来ないようなら、以下のような説明はどうでしょうか。

汎関数ではない、普通の関数の微分を考えます。
例えば $f(x) = x^2$ なら、 $f'(x) = 2x$ です。
さらに $x = 3$ における微分係数が欲しければ、この $f'(x)$ の $x$ に $3$ を放り込んで
 $f'(3) = 6$ となります。

このとき、たまたま事情により $x = 3$ のときの様子しか興味がないとします。
だからといって、 $f(x) = f(3) = 9$ としてから微分してしまうと
<tex>\frac{\D}{\D x}(9) = 0</tex>となって意味をなさなくなります。

汎関数では、これを一段上に拡張したレベルで、同様の話が成り立っているのです。
偏微分する前に従属関係を反映するというのは、上記の「微分する前に値を代入する」という行為に対応します。

>同じ関数なのに置き換え具合で偏微分が変わるのは、何も問題はないのでしょうか。
>偏微分が物理量を表すことはよくありますが。

おそらく、最大の疑問はここにあるのでしょう。
私もよく知らないのですが、ラグランジアンのようのような汎関数で勝手な置き換えが許されない場合か、
あるいは変数が独立な場合か、どちらかになるんでしょうかね。
もし、どちらでもない具体例があったら教えてください。それに対して説明できるかどうか分からないけれど……。

  投稿者:kafuka - 2009/08/17(Mon) 21:06  No.7469 
>yuyaさん

一知半解で恐縮ですが、
d/dx (9)=0 は、f(x)=9という全く別の関数(X-Y平面で書けばy=9)を微分している
ことになりませんか?
例の f(x) = x^2 の場合、微分の定義に戻って書くと、
d/dx (9)=LimΔx→0{(3+Δx)^2−(3)^2}/Δx
=LimΔx→0(9+6Δx+Δx^2 - 9)/Δx
=6
と思います。
たぶん、d/dx (9)とした時点で、f(x)の形は、消去されているという意味だと
思いますが、
それなら、f(x)=9という関数に限定できる根拠もなくなり、
f(3)=9となる関数なら、どれでもいいわけで、
で、僕が思うに、記述を、
d/dx (9)   ただし、9= x^2
と書けば、無意味ではなくなると思います。

  投稿者:kafuka - 2009/08/17(Mon) 22:02  No.7470 
僕は、つい数ヶ月前、解析力学を習いましたが、
同様に、
>ラグランジュの運動方程式の段階では位置と速度が独立だったが、
>解が求まったとたんに独立でなくなるのはおかしいのではないか
と思いました。

僕なりの答え(当てになりませんが)
ラグランジュの運動方程式の段階では位置と速度を独立とした式と、
束縛条件 を立てる
(全体を考えれば、すでに独立ではない)
で、ラグランジュの運動方程式を、束縛条件を入れて解くので、
解は、位置と速度は、独立ではない。
というものです。

yuyaさん
>思い切って答える側に回って
みました。
否定して頂くだけでも、勉強になると思いますので、、、

  投稿者:yuya - 2009/08/18(Tue) 09:15  No.7473  <Home>
>d/dx (9)=0 は、f(x)=9という全く別の関数(X-Y平面で書けばy=9)を微分している
>ことになりませんか?
(中略)
>f(3)=9となる関数なら、どれでもいいわけで、

その通りです(その後の部分はよく分からないのですが)。
要するに $f'(3)$ と $\{f(3)\}'$ では大違いなわけで、
別にパラドックスがあるわけではなくて、
普通に微分係数を求めるときにこんなやり方をしたら、
単に「間違っている」というのは誰の目にも明らかですよね。

微分方程式を解く前に初期条件を入れちゃうようなものかな?

>>思い切って答える側に回って
>みました。

ありがとうございます。
[7470]のような理解でおおむね間違ってはいないと思います。
ただ、私自身が人の説明の問題点を指摘できることはほとんどないんですけどね(^^;)
まぁがんばりましょう。

  投稿者:murak - 2009/08/18(Tue) 19:39  No.7477 
じーつーさんやkafukaさんの疑問と同じかどうかわかりませんが、私も解析力学を学び始めた頃、yuyaさんと同様に、「 $x(t)$  が決まれば  $v(t)$  も自動的に決まるのに、ラグランジュの運動方程式を考える際に、それらをあたかも独立なもののごとく扱って」ラグランジュ関数  $L(x,v)$  を偏微分するのがどうも馴染めませんでした。というより私の場合、しばしば使われる

     <tex>\frac{\partial L(x,\frac{dx}{dt})}{\partial \frac{dx}{dt}}</tex>

という書き方に面食らい、「関数を変数とする関数を、その導関数で(偏)微分するとは一体どういう事だ」という疑問で思考停止になってしまって、その先には一歩も進めないという状況でした。この疑問が私の中で本当に解消したのは解析力学の理論を微分幾何を使って展開する方法を学んでからでしたが、今から思えば初心者が陥りやすいこの種の疑問を解消する鍵はそれ程大袈裟な事ではなく、物理と数学での関数概念や変数の使われ方の違い(くせ)にあるのかなと感じたりもしています。それで、じーつーさんの疑問の解消に結びつくかどうかはわかりませんが、思うところを少し書いてみます。

まず数学においては、関数とはある変数と変数の対応関係を与える規則(あるいは機能)の事です。従って関数の微分とは当然その機能の微分のことであり、例えば $f(x,y)=x^2-xy+3y^2$ という関数の微分(導関数)も、 $g(p,q)=p^2-pq+3q^2$ という関数の微分も本質的には同じものだと考える傾向があります。つまり、この場合の例だと $z=f(x,y)$ という関数によって対応づけられる $x,y,z$ の関係と、 $r=g(p,q)$ という関数によって対応づけられる $p,q,r$ の関係は全く同じであり、両者は関数としては同じものを与えていると考え、当然その(偏)導関数も同じものだと考える訳です(もう少し厳密に述べるには定義域の問題をはっきりさせる必要がありますが、今はそこまで立ち入らない事にします)。そして、こういう話をする場合の $x,y,z$ や $p,q,r$ は単に変数を区別する為の名前(記号)にすぎず、それらは(対応関係さえはっきりしていれば)状況に応じて自由に置き換え可能なものです。

しかしながら、物理(に限らず数学以外の多くの学問)では、変数は個々の具体的な物理量と結びついていることが多く、それらの名前(記号)は一般には置き換え可能ではありません。そして微分を考える際も、関数というよりは個々の具体的な物理量の微分や偏微分を考える分けです。その際、関係してくる物理量同士の関数関係は既知の場合もあるでしょうし未知の場合もあるでしょう。つまりある物理量と別の物理量の間に、具体的な関数形はわからないけれど、物理的考察から何らかの関数関係があるはずだと考えて、片方で他方を微分したりするわけです。この場合の微分は数学的な意味での「関数の微分」(機能の微分)というよりはむしろ「変数の微分」とでも呼ぶべきものになっているように思われます。そして「変数の微分」では(「機能の微分」とは違って)、変数の名前は他のものと取り替え可能なものではありません。(言い換えると、変数の間の関数関係は、それらが表す具体的な物理量により先天的に決まっていると考える訳です。)

この、関数概念と変数の使われ方の違い(くせ)は、数学と物理の学問としての性格の違いに起因するものなので、同じ一人の人間でも、数学をやっているか、物理をやっているかで、自然と両者の使い分けをやっていたりするものなのですが、解析力学という分野(特にその伝統的な記述方式)では、こうした両者のくせがある意味渾然一体として使われているようなところがあるように思われます。これが今回のじーつーさんの書き込みをみていて漠然と感じた事の一つです。

この事とともある程度関係しますが、もう少し別の話として私が述べておきたいと思っているのは、#7446の最後で少し触れた「解析力学が扱うのは運動方程式を解く事ではなく、 $x$  と  $v$  の関係としての運動方程式を求める(見出す)ことである。」という事ですが、時間の関係で一旦ここで話を切ります。


  投稿者:じーつー - 2009/08/19(Wed) 01:40  No.7484 
皆さん答えてくれてありがとうございます。
そのなか大変申し訳ないのですが、1週間くらいネット環境の無いところに行ってしまうので
しばらく掲示板に現れなくなります。すみません。

勝手ながらその間も議論を展開していただけると助かります。
この汎関数や偏微分のところはよくわからないので、みなさんの考え方が理解の上で助けになるからです。
よろしくお願いします。

  投稿者:hirota - 2009/08/19(Wed) 09:47  No.7485 
>同じ関数なのに置き換え具合で偏微分が変わる
置き換えたら関数は変わるじゃありませんか。
たとえば、 z=f(t,x,y) に y=g(t,x) を代入すれば
 z=f(t,x,g(t,x))=h(t,x)
となって関数は f から h に変わってます。
変数 z は変わってないから、変数と関数をごっちゃにすれば分からなくなるだけでしょう。
ここで偏微分 ∂z/∂t などを考えるとき、z が f で表されてるのか h で表されてるのかを決めとかないと意味不明になります。
偏微分はあくまで関数表現に対して行うものであり、変数が独立だろうと他の関数によって従属してようと関係ありません。

  投稿者:kafuka - 2009/08/23(Sun) 16:02  No.7538 
>murakさん
そう言えば、物理の先生は、1/2 mv^2 をvで微分してmv とか板書していました。
これは、1/2 m(dx/dt)^2 を(dx/dt)で微分するというスゴイことなんですね。

関数の変数に(その関数の定義域の1つの)値を代入しても、(関数を写像と見ると)何も変わらない
しかし、
関数に関数を代入すると、(合成写像になるから)、別の関数になる
と思います。
しかし、当然ながら、
上の例「1/2 mv^2 をvで微分してmv」は、vに別の関数fを代入して形が変わって1/2 mf^2となったものでも、
v全体で微分すれば、mfdf/dv=mf =mv
で、同じです。
じーつーさん、この辺を前提に全微分を考えてみられては、どうでしょう。

  投稿者:murak - 2009/08/24(Mon) 01:34  No.7539 
質問者は帰省か何かでおられないようですが、一応続きを書いておきます。

前回は「関数の微分」(あるいは「機能の微分」)と「変数の微分」という事について書きました(これは必ずしも一般的な用語ではなく以下での説明の都合上導入したこの場だけでの用語です)。具体的には例えば、ある質点の位置を表す変数を $x$ 、時刻を表す変数を $t$ で表し、変数 $x$ と変数 $t$ の間に

     <tex> x=\varphi(t) </tex>

という関数関係があるとすれば

     <tex> \frac{d x}{d t} = \varphi'(t) </tex>

となりますが、この左辺 $dx/dt$ が「変数の微分」で右辺 $\varphi'(t)$ が「関数の微分」です。

もう少し複雑な例を考えて、2次元 $x,y$ 表面上の地形が関数 $f(x,y)$ で与えられ、この地形に沿って登山する人の運動が上から見て $(x,t)=(\varphi(t),\psi(t))$ という関数で書けたとします。この人の時刻 $t$ における高度 $h$ は

     <tex> h = f(\varphi(t), \psi(t)) </tex>

で、その鉛直速度は

     <tex> \frac{dh}{dt} &=\frac{\partial f}{\partial x}\frac{dx}{dt} + \frac{\partial f}{\partial y}\frac{dy}{dt} \\&= \left. \frac{\partial f(x,v)}{\partial x}\right|_{x=\varphi(t), y=\psi(t)}\varphi'(t) + \left. \frac{\partial f(x,y)}{\partial y}\right|_{x=\varphi(t), y=\psi(t)}\psi'(t) \\&= \frac{\partial f(\varphi(t),\psi(t))}{\partial x}\varphi'(t) + \frac{\partial f(\varphi(t),\psi(t))}{\partial y}\psi'(t) </tex>

と表されます。この右辺の $dh/dt$ は「変数の微分」で、右辺二段目以降「関数の微分」を意識した書き方になっています(右辺三段目の $\partial f(\varphi(t),\psi(t))/\partial x$ は $f$ の関数形を $x$ で偏微分し、その結果に $\varphi(t),\psi(t)$ を代入したことを意味している)。

さて、ここで、登山者がその登山コースを色々変える場合を想像しましょう。登山者のコースは、ここでは関数 $(x,y)=(\varphi(t),\psi(t))$ によって表されいますから、これを例えば別のもの $(\varphi_2(t),\psi_2(t))$ に変えるわけです(これは $x, y$ の間の従属関係を変えるという事でもある)。このとき登山者の鉛直速度は

     <tex> \frac{dh_2}{dt} &= \frac{\partial f(\varphi_2(t),\psi_2(t))}{\partial x}\varphi_2'(t) + \frac{\partial f(\varphi_2(t),\psi_2(t))}{\partial y}\psi_2'(t) </tex>

となり、 $dx/dt$ の部分は $\phi$ の関数形に応じて変りますが、 $\partial f/\partial x$  の関数形は変らない。これは登山者がコースを変えても、山の地形から決まる勾配ベクトル場 $(\partial f/\partial x, \partial f/\partial y)$ は変らないという事に他なりません。ただし登山者が時刻 $t$ にいる高度 $h(t)$ や、その鉛直速度 $dh/dt$ はコースに応じて変ります。実際 $t$ と $h$ の対応関係は $h_2=f(\varphi_2(t),\psi_2(t))$ という別の関数に変化しているので、その時間微分である鉛直速度の関数形も変ってくるわけです。言い換えると、 $x$ と $y$ の従属関係を変えても、偏微分 $\partial f/\partial x, \partial f/\partial y$ は変らない。しかし全微分 $dh/dt$ は変ってきます。


一方、#7426でじーつーさんが行っている計算は、上の例でいえば、 $x$ と $y$ の間の従属関係( $\varphi(t),\psi(t)$ の関数形)を固定したまま $f(x,y)$ の変数 $x,y$ を部分的に置き換え(その結果を $g(x,y)$ としておく)、その結果を用いて $dh/dt$ を計算するというものです。この場合、 $f(x,y)$ を使おうか $g(x,y)$ を使おうが、変数 $x,y$ の関数 $\varphi,\psi$ への置き換えを完全に遂行した結果については

     <tex> h(t)=f(\varphi(t),\psi(t)) = g(\varphi(t), \psi(t)) </tex>

が成り立っている筈ですから、鉛直速度の計算に $f$ を用いた表現を使おうが $g$ を用いた表現を使おうが結果は同じで、それは $h(t)$ の表現から直接計算したものと一致します。しかし、 $f$ と $g$ は(もはや)関数形が違ってしまっていますから、それらの偏導関数の関数形も違ってきます。つまりこの場合(しーつーさんが言うように)「偏微分は変るけれど、全微分 $dh/dt$ は変らない」という事になります。しかし、この場合は、上の場合とは、やっている事が全く異なっており、元々の $f$ は $x,y$ 平面での地形(を表す関数)という意味を持っていたのに、 $g$ の方は $x,y$ 平面での地形という意味を失っています。従ってその偏導関数 $(\partial g/\partial x, \partial f/\partial y)$ にも、山(地形)の勾配ベクトルという意味は失われています。

  投稿者:murak - 2009/08/24(Mon) 01:35  No.7540 
今回はいよいよラグランジュの運動方程式

<tex>{d \over dt } \left( { \partial L \over \partial v } \right)- { \partial L \over \partial x }=0</tex>

そのものを扱う事にします。

この式をみる上で注意しておくべき第一の点は、この方程式に現れるラグランジュ関数 $L$ の偏微分 $\partial L/\partial x$ は、 $L$ という変数を変数 $x$ で(偏)微分しているのではなく、その関数形を微分している(関数の微分)のだということ、そしてその際の $\partial x$ や $\partial v$ における $x$ や $v$ は、ラグランジュ関数の何番目の変数でそれを(偏)微分しているのかを示すという意味以上のものを持っていないという事です。注意しておくべき二番目の点は、この方程式に現れるラグランジュ関数 $L(x,v)$ は、運動方程式を求める(確定させる)為だけに必要なのであって、一旦運動方程式としての微分方程式が決まってしまうと、それは方程式の形からは消えてしまって、運動方程式を解く際には何の影響ももたらさないという事です。実際、個々の具体的問題を解く際には、与えられた問題の物理的状況から、まずラグランジュ関数 $L$ をの具体形を求め(この段階でラグランジュ関数 $L$ は既知関数)、それを $x$ 及び $v$ で偏微分して $\partial L/\partial x, \partial L/\partial v$ を求めます。そしてそれら(正確にはそれらに、 $x$ 及び $dx/dt$ を代入したもの)をラグランジュ方程式の一般形に入れ、そこに現れる時間微分 $d/dt$ を遂行することで運動方程式を確定させます(この段階ではむしろ「変数の微分」が行われる)。この最終段階で、通常 $x(t)$ の二階常微分方程式として運動方程式が求まりますが、そこからはラグランジュ関数の具体的な形はもう見えなくなっており、その後の運動方程式を解くという行為はニュートン力学の場合と全く変らなくなります。つまりラグランジュ関数は、与えられた系の物理的状況から運動方程式を確定させるまでの間でのみ必要とされる概念であるという訳です。


以上の注意の下に改めてじーつーさんの問題提起

「ラグランジュの運動方程式の段階では位置と速度が独立だったが、解が求まったとたんに独立でなくなるのはおかしいのではないか」

を考えてみます。確かに、上で述べた手順だけを見れば、物理的状況からラグランジュ関数をつくりそれを用いて運動方程式を確定させるまでの間は、位置と速度をあたかも独立なものであるかのように扱っているように見えるかもしれません。しかし(hirotaさんも既に述べているように)位置と速度はラグランジュの運動方程式の段階で既に独立ではなく、後者は前者の時間微分であるという明確な従属関係を持っています(解が求まった途端に独立でなくなる訳ではない)。このことは作用積分の変分問題としてラグランジュの運動方程式(の一般形)が導出される過程をを具体的に追ってみると良くわかるでしょう。大抵の教科書に書かれている事ではありますが、ここでは「関数の微分」という事を明確に意識した形でそれを行ってみましょう。

まず、運動方程式の解が時刻 $t$ の関数として $x=\varphi(t)$ という形で与えられると仮定しておきます。このとき速度 $v$ は、明らかに $v=\varphi'(t)$ で与えられます。これらを用いて関数 $\varphi$ を変関数とする汎関数 $I[\varphi]$ を

     <tex> I[\varphi]=\int_{t_a}^{t_b}L(\varphi(t),\varphi'(t))dt </tex>

により定義します。これがいわゆる作用積分と呼ばれるものですが、数学的には、関数 $\varphi$ の形に依存して $I[\varphi]$ の値が決まる「汎関数」です。つまり、関数 $\varphi(t)$ の形が少し変ればそれに依存して $I[\varphi]$ の値も少し変ってくるわけですが、ここでは次のような方法でその変化の割合を見積もってやりましょう。まず勝手な関数 $\eta(t)$ と(絶対値の小さな)任意の実数 $\varepsilon$ を用いて $\varphi(t)+\varepsilon\eta(t)$ という形の関数を考えてやります。この新たな関数に対する汎関数 $I$ の値は

     <tex> I[\varphi+\varepsilon\eta]=\int_{t_a}^{t_b}L(\varphi(t)+\varepsilon\eta(t),\varphi'(t)+\varepsilon\eta'(t))dt </tex>

により与えられます。ここで $L$ の二番目の変数が $\varphi'(t)+\varepsilon\eta'(t)$ になっているのは、それが第一番目の関数 $\varphi+\varepsilon\eta$ を時間で微分したものであるからです。つまり $v(t)$ は必ず $x(t)$ の時間微分であるという関係を保ちながらそれらを変化させているわけです。次に両者の差をとり

     <tex> I[\varphi+\varepsilon\eta] - I[\varphi] = \int_{t_a}^{t_b}\left\{ L(\varphi(t)+\varepsilon\eta(t),\varphi'(t)+\varepsilon\eta'(t))-L(\varphi(t),\varphi'(t)) \right\}dt </tex>

を計算しますが、被積分部分が

     <tex> \left\{ L(\varphi+\varepsilon\eta,\varphi'+\varepsilon\eta')-L(\varphi,\varphi'+\varepsilon\eta') \right\}+ \left\{ L(\varphi,\varphi'+\varepsilon\eta')-L(\varphi,\varphi') \right\} </tex>

と書ける事に注意して両辺を $\varepsilon$ で割り、 $\varepsilon\to 0$ の極限をとってやると

     <tex> & \lim_{\varepsilon\to 0}\frac{I[\varphi+\varepsilon\eta] - I[\varphi]}{\varepsilon}  \\&=\lim_{\varepsilon\to 0}\int_{t_a}^{t_b}\left\{ \frac{L(\varphi+\varepsilon\eta,\varphi'+\varepsilon\eta')-L(\varphi,\varphi'+\varepsilon\eta)}{\varepsilon} \right\}dt+\lim_{\varepsilon\to 0}\int_{t_a}^{t_b}\left\{ \frac{L(\varphi,\varphi'+\varepsilon\eta')-L(\varphi,\varphi')}{\varepsilon} \right\}dt \\& =\int_{t_a}^{t_b}\frac{\partial L(\varphi(t),\varphi'(t))}{\partial x}\eta(t) dt+ \int_{t_a}^{t_b}\frac{\partial L(\varphi(t),\varphi'(t))}{\partial v}\eta'(t) dt</tex>

となり、自然に $L$ の偏導関数が出てきます。つまり $\varphi$ と $\varphi'$ は、後者は前者の時間微分という関係があるにもかかわらず、この部分は $L$ の偏導関数を用いて書くしか表現のしようが無い部分です。しかし、前回見たように、多変数関数の全微分を偏導関数を用いて書くやり方は、(偏微分を行う)変数の間に従属関係があろうが無かろうがいつでも正しい結果を与えたので、この部分の計算はこれで(いつでも)正しい事になります。ここまでくれば後は最後の式の第二項を(時間積分に関して)部分積分し

     <tex> & =\int_{t_a}^{t_b}\frac{\partial L(\varphi(t),\varphi'(t))}{\partial x}\eta(t) dt+ \left[ \frac{\partial L(\varphi(t),\varphi'(t))}{\partial v}\eta(t) \right]_{t_a}^{t_b}-\int_{t_a}^{t_b}\left\{ \frac{d}{dt}\frac{\partial L(\varphi(t),\varphi'(t))}{\partial v}\right\} \eta(t) dt</tex>

 $\eta$ に関する境界条件として $\eta(t_a)=\eta(t_b)=0$ を与えておくと

     <tex> & =\int_{t_a}^{t_b}\left\{ \frac{\partial L(\varphi(t),\varphi'(t))}{\partial x}-\left( \frac{d}{dt}\frac{\partial L(\varphi(t),\varphi'(t))}{\partial v}\right)\right\} \eta(t) dt</tex>

が得られます。この最後の式は中括弧でくくられる部分と任意関数である $\eta(t)$ の積の積分となっており、これが $\eta$ の如何によらず常にゼロを与えるという条件から中括弧の中がゼロ、すなわちラグランジュの運動方程式

     <tex> \frac{\partial L(\varphi(t),\varphi'(t))}{\partial x}-\left( \frac{d}{dt}\frac{\partial L(\varphi(t),\varphi'(t))}{\partial v}\right) = 0 </tex>

が得られます。

この導出過程から明らかなようにラグランジュの運動方程式においては、位置と速度は最初から従属関係にあるとして、その方程式の形が導かれているのです。たただその計算の過程でどうしても $L$ の偏導関数を使わないと表せない部分が出てくるので、(しばしば誤解の源となるが)仕方なくこのような書き方を用いているのだという事です。

  投稿者:じーつー - 2009/08/28(Fri) 13:19  No.7574 
ご無沙汰してます。
みなさんどうもありがとうございます。murakさんの書き込みのおかげで当初の疑問
「位置と運動量が独立なのはなぜ?」
は解決されました。変分の説明もとても丁寧ですんなり理解できました。
しかし、偏微分の"変数の置き換え"はまだよくわかりません。

murakさんの #7539 の書き込みを参考にするなら、
<tex>f</tex>と、変数を置き換えた<tex>g</tex>は山の形は違うけど
(その置き換えを行うために時間を計りながら2つの山を上った)人が登る速度は同じ」
という解釈でよろしいでしょうか。違う山だけど、なぜか鉛直方向の登る速さは同じ
という直感的には奇妙なことが起こってしまっていますが。
ラグランジアンに当てはめるなら、
「全ての時刻でラグランジアンの値は等しいが、異なる運動状態を表す」
ということが起こってしまいますが、そんなことはありえるのでしょうか。
自分でも何を言っているのかよくわからなくなってきました・・・。

  投稿者:murak - 2009/08/29(Sat) 10:18  No.7578 
> 「<tex>f</tex>と、変数を置き換えた<tex>g</tex>は山の形は違うけど(その置き換えを行うために時間を計りながら2つの山を上った)人が登る速度は同じ」

山の形は違うけれど、(時間の関数としての3次元的な)登山コースは同じ。言い換えると、 $f(x,y)$ として与えられた山の地形を、(3次元的な)登山コースだけは同じになるようにして、地形をつくり変えたものが $g(x,y)$ 。なので必然的に鉛直速度は同じ。(奇妙ではない。しかしそのような置き換えをする意味が私には良くわからない。)

> ラグランジアンに当てはめるなら、
> 「全ての時刻でラグランジアンの値は等しいが、異なる運動状態を表す」

同じ事をラグランジアンで考えるのはなおさら無意味。前にも言ったが、ラグランジアンは、その値ではなく形(関数形)が重要(言い換えると、ラグランジアンは力学「変数」ではない)。それは系の物理的状況によりその形が決まるので、ラグランジアンの形が異なれば、普通それは系の物理的状況が全く異なることを意味する。そして何より重要なのは、新しいラグランジアンから得られるラグランジュの運動方程式を解いて得られる解(運動)はもはや元のラグランジアンに対応する解には(普通は)ならないという事。

  投稿者:じーつー - 2009/09/04(Fri) 18:27  No.7611 
ご無沙汰しています。
完全に、何に迷っていたのかわからなくなってしまいました。
自分の主張の意味すら汲み取れなくなってしまいました。

なので、この問題は、一旦お蔵入りにさせていただきたいと思います。
いつの日か理解できたら、その結論を投稿するかも知れませんが、そのときはまたよろしくお願いします。

みなさん本当にありがとうございました。