富の理論の数学的原理に関する戯言

数学とその応用分野(主に経済学)を細々とやっているものです。

クールノー学習 (1)基本のクールノー競争モデル

経済学部時代、私が一番面白いと思った内容はクールノー競争というものです。

 

 

どこが面白いか

一般的にクールノー競争では企業が2社だけ存在し(ここの企業数を任意の数nに拡張することもできる)、それぞれ財の供給量をコントロールして利潤を最大化するという状況を考えます。

また、設定としてこの2社の技術や供給している財が同質なのか、それとも異質なのかといったバリエーションを持たせることができます。

ここでは企業はそれぞれ技術的に異質(財を追加的に生産するときの限界費用が異なる)で、供給している財は同質(同じ市場で同様に評価され、同一の価格が付く)と仮定します。

2社の企業をそれぞれ企業1、企業2とすると、企業1の利潤は

\pi_1 = p(y_1+y_2)y_1-tc(y_1)

というふうに書けます。(利潤関数がこの形になる理由が分からない方はこちら)

y_1y_2はそれぞれ企業1と2の供給量

p(y_1+y_2)は両企業の供給量に対する市場価格(逆需要関数)

tc(y_1)は企業1の生産に対するコスト(費用関数)です。

供給量を動かして利潤を最大化するということは、利潤の関数を自社の財の供給量y_1偏微分し、その偏導関数が0になる点を求めればよいので(極値を持つかどうかの話は一旦置く)

\frac{\partial \pi_1}{\partial y_1} = p(y_1+y_2)+\frac{\partial p(y_1+y_2)}{\partial y_1}y_1-\frac{dtc(y_1)}{dy_1} = 0

p(y_1+y_2)+\frac{\partial p(y_1+y_2)}{\partial y_1}y_1 = \frac{dtc(y_1)}{dy_1}

という条件を導けます。

(費用関数の項を右辺に移項して)この式をよく眺めてみると

左辺第1項は市場価格そのものを表しており、追加的に財を1つ売ったときの追加的な収入を表しています。

左辺第2項は既存の売った数に自分が供給を増やしたことによる市場価格の変化をかけたものになっています。

つまり左辺は全体で供給量を変えたことによる売上の変化を表しており、これを経済学では限界収入といったりします。

 一方の右辺は、生産量を(ほんの少し)変化させたときの費用の変化を表しており、同じく経済学で限界費用と呼ばれるものです。

つまり追加的に供給を増やす場合に追加的な収入と費用が等しくなるまで供給することが利潤を最大化する行動であることがわかります。

この話は独占(企業が1つしかない場合)で習ったという方がほとんどだと思います。複占になろうがこの考え方自体は変わりません。

しかし、複占と独占ではある重要な点が異なります。

複占では限界収入が相手の企業の供給量y_2にも依存してしまっている点です。

このように相手の行動に応じて自分の最適な行動が変化したり、その逆が起こってしまうような状況のことを戦略的状況といいます。

伝統的なミクロ経済学では、企業が無数に存在するという仮定を置いて企業間の影響を十分無視できるとしたり、企業が1社しかいないという仮定を置いたりしてこの戦略的状況をうまいこと回避しています。

この戦略的状況を専門に扱う学問分野のことをゲーム理論と呼びます。

複占は重要な経済学イシューでありながら、ゲーム理論的状況を想定しているという点で完全競争や独占とは少し異質でそこが私が面白いと感じたところです。

クールノーナッシュ均衡

ゲーム理論それ自体を開発したのは火星人ジョン・フォン・ノイマンオスカー・モルゲンシュテルンです。

その後ジョン・ナッシュが戦略の均衡概念であるナッシュ均衡を提唱し、このクールノー競争もナッシュ均衡解を持つことがわかっています。

ナッシュ均衡は(かなり噛み砕いてしまうと)、互いに最適な戦略を取り合っていればいいということです。どちらかが戦略を変えることで利得(ゲーム理論流の言い方。ここでいう利潤)を上げることができるとそれはナッシュ均衡ではないです。

頭を使って考えると複雑そうですが、こういった場合は数式や図に頼るのが効果的です。

クールノー競争でいえば、最適反応関数というものを作ってしまえばいいのです。

今回のプレイヤー達が戦略として操作できるのは財の供給量なので、相手の供給量に対して自分がいくつ供給すれば利潤が最大化するのかを返してくれる関数を作ればうまくいきそうですよね。

 y^*_1 = r(y_2)

ここで、 y^*_1は企業1の最適反応供給量とします。

それがともかく y_2の関数で表せれば目標の最適反応関数と呼ぶにふさわしそうであることがわかります。

いい感じに y_2とその y_2の値に対応する利潤最大化供給量 y^*_1の関係式を作れないかと考えると、企業1の利潤最大化の条件式が使えそうであることに気づきます。

企業1の利潤最大化の条件式を満たす y_1は間違いなく利潤最大化している ( y^*_1)といえるし、限界収入が y_2にも依存するので願ってもないほどぴったりです。

とりあえずここでは、見通しをよくするために需要関数と費用関数に適当な関数形を与えてしまいます。(その代わり一般性は多少犠牲になります。この世は常にトレードオフ)

今回は以下のような線形の逆需要関数を想定します。

 p(y_1+y_2) = A - (y_1+y_2) 

企業1の財も2の財も供給が1つ増えれば価格が1下がるというもっとも単純な逆需要関数です。

例えばAが100でy_1=y_2=20ならば、市場価格は60となります。

可変費用は1つあたりc_1だけコストがかかるものとします。

また、固定費用は0とします。(0でなくてもいいが、後で微分で消えるので一緒)

すると費用関数は以下のようになります。

 tc(y_1) = c_1y_1

限界費用はこの微分なので、そのままc_1になることがわかります。

(ここで、 c_1とせずに単に cとすれば技術的に同質な企業を仮定していることになります。)

 企業1の利潤最大化条件にこれらの関数を代入すると、

p(y_1+y_2)+\frac{\partial p(y_1+y_2)}{\partial y_1}y_1 = \frac{dtc(y_1)}{dy_1}

 A-y_1-y_2+(-1)×y_1= c_1

 y^*_1 = r_1(y_2) = -\frac{1}{2}y_2 + \frac{1}{2}(A-c_1)

こうして最適反応関数が導けました。

もちろん企業2に対しても同様に 

 y^*_2 = r_2(y_1) = -\frac{1}{2}y_1 + \frac{1}{2}(A-c_2)

という最適反応関数が導けます。

ナッシュ均衡はお互いが最適反応を取っている状態のことをいうので、それぞれの反応関数の右辺にある y_1 y_2も最適反応であればよさそうです。すると、以下のような2元1次の簡単な連立方程式を解く問題に帰着できます。

 y^*_1 = r_1(y^*_2) = -\frac{1}{2}y^*_2 + \frac{1}{2}(A-c_1)

 y^*_2 = r_2(y^*_1) = -\frac{1}{2}y^*_1 + \frac{1}{2}(A-c_2)

結局、この解は

 (y^*_1,y^*_2) = (\frac{A-2c_1+c_2}{3},\frac{A-2c_2+c_1}{3})

 となり、この解はクールノーナッシュ均衡です。

発展的な話

 こうして2社の企業が数量を操作して競争した場合の均衡を求めることができました(ただし、均衡の安定性については未議論)。この均衡解の式から色々比較静学してみたり(例えばc_1が増えた時にy^*_2はどうなるか)、独占のケースや完全競争のケースと市場供給量や価格を比較したり、余剰分析したりするのも味わい深いですね。2社が共謀するケースでは2社とも利潤がクールノー均衡よりも大きくなるので、クールノー均衡はパレート効率ではなかったなんて話をすれば、戦略空間が連続である場合の囚人のジレンマのアナロジーとしてクールノー均衡が捉えられるのでは等々面白い話はいくらでもありそうです。

しかし、学部で初めてクールノー競争を習った私はある違和感を抱きました。というのも、こんな計算は現実には不可能ではないか?ということです。

違和感

経済学では静学(statics)と動学(dynamics)といった分析方法の分類があります。前者はモデルの時間的な広がりをあえて取捨することで均衡における変数間の関係を取り扱う手法です。実は経済学ではしばしば現実は均衡状態にあると考えるため、均衡における経済変数の関係を考察できれば十分である場合も多いのです。先ほどの例でいうと、企業1の限界費用の低下(技術の向上と言い換えてもいい)は企業2の供給量にどう影響を与えるか?といった疑問は静学モデルで十分分析ができます。

一方で、均衡に到達するまでのプロセスを記述したければ時間的な広がりを持つ動学モデルである必要がでてきます。

私が抱いた疑問はこの時間的な広がりについてです。

先のクールノー競争モデルの利潤最大化の計算では企業1の利潤関数に企業2の供給量を直接代入していました。しかし、利潤最大化の計算を行っている段階にあるということは、企業1の供給量はこの段階でまだ決定されていないはずです。そして、企業1の供給量が不確定であるということは同様に企業1の供給量を考慮して供給量を決定する企業2もまだ供給量が決まっていないはずなのです。

つまり、企業1がある期(以降t期とする)に考慮する企業2の供給量はt期のものであるはずがないのです。なぜならt期の企業2の正確な供給量はまだ決定されていないからです。

では、t期の企業1は何を参照して今期の最適供給量を考えるでしょうか?それは企業2の過去の供給量のデータからt期の供給量を予測する信念(belief)です。

以上のややこしい話を数式に落とし込んでみましょう。

t期の企業1の利潤は

 \pi_{1,t}(y_{1,t},E_1(y_{2,t})) = p(y_{1,t}+E_1(y_{2,t}))y_{1,t}-c(y_{1,t})

と書けます。

ここで、E_1(y_{2,t})はt期における企業2の供給量を企業1が予測した値です。統計学でいうところの期待値ではないので注意。

添え字が増えてしまってややこしくなったものの、変わってしまったのは時間の添え字と企業2の生産量が予測値になったことだけです。ゆえに、静学モデルと同様の計算で以下の連立方程式が導けることがわかります。

 y^*_{1,t} = r_1(E_1(y_{2,t})) = -\frac{1}{2}E_1(y_{2,t}) + \frac{1}{2}(A-c_1)

 y^*_{2,t} = r_2(E_2(y_{1,t})) = -\frac{1}{2}E_2(y_{1,t}) + \frac{1}{2}(A-c_2)

一見静学モデルと大して変わらないように見えますが、それぞれの最適供給量と予測値が一致する等の仮定を置かなければこの連立方程式計算できないでしょう

 y^*_{1,t} = E_2(y_{1,t})

 y^*_{2,t} = E_1(y_{2,t}) 

t期の企業1の最適生産量と企業2の予想は等しい?

t期の企業2の最適生産量と企業1の予想は等しい?

 

次回は学習理論の話を少しだけ導入して、このモデルの均衡への収束過程を描いてみたいと思います。