ゲーム理論 / 社会現象の一般解

 人間社会を理解するために最も基本になるナッシュ均衡を解説します。ゲーム理論の中核的な概念で、現代経済学では需要と供給と並ぶビックワードです。

〜序論:なぜナッシュ均衡か〜

 万人の万人に対する闘争

 これは、自然状態における人間社会の殺伐さを表したホッブズの有名な表現です。無政府状態において、暴力は利害対立を解消する手段になります。このとき、すべての人がすべての人にとって潜在的な敵となる「戦争状態」が生まれます。ホッブズはこの戦争状態を解消するために政府の存在が正当化されると論じました。

 本当でしょうか?

 暴力が利害対立を解消する手段になりえるからといって、人間社会が混乱に陥るとするのには大きな論理的飛躍があります。例えば、国際社会に「世界政府」はありません。国際関係学ではこれを無政府状態といいますが、戦争は常に起きているわけではありません。国際社会にも一定の秩序がもたらされています。

 では、自然状態における人間社会をどう捉えたらいいのでしょうか?ここで力を発揮するのがナッシュ均衡です。ナッシュ均衡は

(1)あるゆるい条件の下では必ず存在

(2)男女関係から核戦争まで幅広い社会行動に統一的な理解をもたらす

という点で魅力的です。この記事では、このナッシュ均衡についてわかりやすく解説します。経済学やゲーム理論の予備知識はゼロでOKです。

しまうま

東大生/ 欲しいものは大局観。目指すは全体最適。|経済学の考え方が好きです。

1、ゲーム理論とは

〜戦略的思考〜

 この記事で解説するナッシュ均衡は、ゲーム理論の中核概念です。そこでゲーム理論のアプローチについて解説します。

(1)戦略的相互依存関係

 ゲーム理論が考えている人間社会は、「戦略的相互依存関係」です。戦略的相互依存関係とは

  • 相手の出方によっては、自分にとって得な行動が変わる

状況です。つまり、「行動」に絶対の正解はないという考え方です。

 例えば、男子が女子に告白する状況は、戦略的相互依存関係です。男子目線で考えると、

  • 女子が男子を好きなら、男子は告白すべき
  • 女子が男子を好きでなく・言いふらすタイプなら、男子は告白すべきでない

これは

  • 相手(女子)の出方によって、自分(男子)にとって得な行動が変わる戦略的相互依存関係

です。

(2)ゲーム理論

 戦略的相互依存関係での人間行動を考える分野が、ゲーム理論です。相手の出方を読まなくてはいけないような戦略的状況は、社会生活すべてです。したがって、ゲーム理論の対象分野は、極めて広範な社会現象に及びます。

 あくまで戦略的相互依存関係の比喩として、「ゲーム」という言葉を使っています。真面目な学問ですので、ご安心ください。

(3)ゲームの3要素

 戦略的相互依存関係を、分析しやすくしましょう。戦略的相互依存関係とは、基本的に次の3つで構成されています。

  • プレーヤー・・・関係者
  • 戦略・・・選択肢
  • 利得・・・選択肢が決まればプレーヤーが受け取れる利益

 この3つの項目からなるものを、

  • ゲーム

といいます。

(4)協力か非協力か

 ゲームで考えられる状況にも大きく分けて2つあります。

  • 協力ゲーム:全員が納得する点で、交渉が成立。話し合いを守る拘束力が必要。
  • 非協力ゲーム:全員が相手の出方を予想し、その中で最善を追求。話し合いに拘束力はない

 これから考えるのは、非協力ゲームです。殺伐とした人間社会のモデルですが、現実には嘘も裏切りもよくあることです。より一般性のあるゲームが非協力ゲームといえましょう。

 ホッブズの自然状態とは、非協力ゲームに他なりません。これから自然状態でどのような秩序が生まれるのか見ていきます。

2、ナッシュ均衡とは

一般社会における均衡〜

(1)テーマ:ナッシュ均衡の基本

 ナッシュ均衡とは、簡単に言えば

  • プレーヤー全てがお互いに最適反応している状態

です。

 もう少し正確に言えば、

  • 1〜Nさんがそれぞれ戦略をとっている状況で
  • 自分(iさん)だけ戦略を変えても、今「より」得しないのが
  • 1〜Nさんについても成り立っている

のが、ナッシュ均衡です。これを図にすると、下のようになります。

 

(2)ゲーム:両想いゲーム

 簡単な状況で説明してみましょう。考える状況は

  • 両想いの男女は告白するのか?

です。

<状況>

 お互いのことが好きな男女がいます。二人は秘密にしていたのですが、ふとしたきっかけで両想いであることがわかってしまいました。男は情報通のクラスメートから教えてもらい、女は放課後の廊下で男が「女ちゃんのこと好きなんだよ」と言ってたのを聞いてしまったのです。二人は告白すれば成功することを確信しています。

<ゲーム化>

 これをゲーム化します。まず、

  • プレーヤーは、男と女
  • 男の戦略は{告白、秘密}
  • 女の戦略も{告白、秘密}

です。利得は次のように考えます。

  • (双方が告白)のとき、二人は付き合えるので利得は最高
  • (片方が告白、片方が秘密)のとき、想いが伝わるので利得は中くらい
  • (双方が秘密)のとき、二人は悶々としてしまいますので、利得は最低

です。ここで小さな一つ革命を起こします。上は情報がややこしいので、一目でわかるように表に整理します。下のように、プレーヤー・戦略・利得が一覧できる表を利得表といいます。棒の長さの大小が、利得の大小に対応しています。

(3)結論:告白すべき

 これを図にして、男女の行動を考えましょう。

<男目線の分析>

 まず男目線で考えると下図になります。下にあるように男は必ず告白します。

 なぜなら、相手が告白しようが秘密にしようが、自分が告白した方が自分の利得が上がるからです。このように相手が何をしようと自分がすべき戦略を、支配戦略と言います。

<女目線の分析>

 女目線では下のようになります。女も状況は同じで、告白した方がいいです。これも支配戦略です。

<双方が取る戦略>

 すると、双方が告白を選択しますから、このゲームの解は(男は告白、女は告白)です。これは双方の支配戦略が一致した結果です。これを支配戦略均衡といいます。

 しかし、支配戦略均衡は存在しない場合があります。なぜなら、「相手が何をしようと、とるべき支配戦略がある」が全員に成り立つことは、めずらしいからです。例えば、後述する「男女ゲーム」では、支配戦略均衡がありません。

(4)解:幸せなナッシュ均衡

 そこで、いったん支配均衡とは別概念で考えます。ここで導入されるのが、ナッシュ均衡です。支配戦略均衡のとき、「自分だけ戦略を変えても利得が増えない」という最適反応が常に生じています。つまり、Xが支配戦略均衡なら、Xは必ずナッシュ均衡です。(「Xがナッシュ均衡なら、Xは必ず支配戦略均衡」は成り立ちません。)

 (男は告白、女は告白)はどうでしょう?

 下図をみると、(男は告白、女は告白)から片方だけ戦略を変えても利得は増えませんから、プレーヤー全員にとっての最適反応になっています。ですから、これはナッシュ均衡です。

 これはハッピーな結末ですから、「幸せなナッシュ均衡」と呼称しましょう。

3、囚人のジレンマ

〜自由ゆえの破滅〜

(1)テーマ:自由は常に素晴らしいか

 伝統的な経済学は、自由を肯定します。個人の利益追求は、市場を通じて、社会全体の利益追求と一致すると考えるのです。これが市場メカニズムであり、「神の見えざる手」と呼ばれる社会制度です。実際に「協力ゲーム」の理論では、市場均衡が全員の協力行動の結果と一致することが証明されています。

 しかし、市場の外でも、個人の利益追求は望ましいでしょうか?

※市場経済について→需要供給曲線のすべて(おすすめ記事)

(2)ゲーム:囚人のジレンマ

 ゲーム理論の中で最も有名な事例を考えましょう。「囚人のジレンマ」です。

<状況>

 盗みを働いたAとBが逮捕されました。2人は別々の部屋で取調べを受けています。なお、この国には司法取引があり、警察は次のような取引を持ちかけました。

  • 取調官「自白して相手の罪を証明してくれたら、お前を即時釈放し、無罪にしてやろう。逆に、相手が自白したのに、お前だけ黙秘するなら、刑は懲役5年と重たくなるぞ」
  • 容疑者A「二人とも自白したら?」
  • 取調官「お前のやった犯罪は懲役3年だ。二人で仲良く刑務所暮らしだ」
  • 容疑者A「二人とも黙秘たら?」
  • 取調官「我が国は疑わしきは罰せずだ。だが、1年は尋問され続けるぞ。ワハハ」
  • 容疑者A「・・・」
  • 取調官「同じ取引をBにもしている。よく考えるんだな」

<ゲーム化>

 これをゲーム化します。

  • プレーヤーは、AとB
  • 戦略は、黙秘自白

 さて、利得は、一般社会(娑婆、シャバ)で生きられる年数がどれだけ変わったかで考えます。つまり、懲役5年のとき、利得は-5です。

  • (双方が自白)のとき、二人の利得は-3
  • (片方が自白、片方が黙秘)のとき、自白した方の利得は0、黙秘した方の利得は-5
  • (双方が黙秘)のとき、二人の利得は-1

 これを利得表で表します。マイナスは棒で表しにくいので、大小関係だけに注目して表しました。

(3)結論:双方とも裏切る

 Aさん視点に立つと、

  • Bさんが黙秘する場合、自分は自白した方がよい
  • Bさんが自白する場合、自分も自白した方がよい

となります。ですから、Aさんの支配戦略は「自白」です。Bさんも同じです。

 ですから、下図の緑が答えです。そして、これはナッシュ均衡です。なぜなら、片方だけ戦略を変えても利得は増えないので、両者が最適反応しているからです。

 しかし、2人の合計利得で考えると、(Aは黙秘、Bは黙秘)が最も幸せです。なぜこれをしないのでしょうか?それはBが黙秘するなら、Aは自白した方が利得が増えるからです。B目線でも同じです。ですから、(Aは黙秘、Bは黙秘)は選択されません。

(4)解:不幸せなナッシュ均衡

 囚人のジレンマが非常に有名であるのは、

  • 合理的な人々に自由を与えた結果、当事者たちにとって望ましくない結果になる

ことが明確に示されているからです。

 そして、このような「不幸せなナッシュ均衡」こそが自然な社会状態です。

 なぜなら、多くの場合、人々はコストを払わなくても社会から利益を得ることができますし、社会が腐っているなら自分だけ頑張るのは損だからです。我々はまさに囚人のジレンマのプレーヤーです。

4、混合戦略

〜合理的なランダム〜

(1)テーマ:じゃんけんの最適解

 ところで、人生で最もするゲームといえば、「じゃんけん」でしょう。ゲーム理論では、どのようにじゃんけんを分析できるでしょうか?

(実はこの概念は、ナッシュ均衡の存在証明のために必要です。)

(2)ゲーム:じゃんけん

 じゃんけんは、グー、チョキ、パーを出して、「勝ち」「負け」「引き分け」を決めるゲームです。2人のじゃんけんを考えましょう。

  • プレーヤーは、自分と相手
  • 戦略は、グーとチョキとパー
  • 勝ち負けが決まったとき、勝者の利得は最高、敗者の利得は最低
  • 引き分けのとき、双方の利得は中くらい

です。これを利得表にします。ただ、マスの数が多くなってわかりにくくなるので、自分目線の利得しか書きません。すると、下表です。

(3)結論:ランダムに手を出す

<ナッシュ均衡がない?>

 今までと同じように考えると、じゃんけんにはナッシュ均衡はないように思えます。例えば、

  • 自分がパー、相手がグー

という戦略はナッシュ均衡ではありません。確かに自分は相手に最適反応していますが、相手はチョキに変えることで勝つことができるからです。この結果は、他のマスでも変わりません。

<じゃんけんのナッシュ均衡>

 ここで「ランダムに手を出す」という戦略を考えてみましょう。

 具体的には

  • グー、チョキ、パーを同じ確率1/3でランダムに出す

という戦略です。

 これを二人が採用したとしましょう。すると、二人とも、勝つ確率は1/3、負ける確率は1/3、引き分けの確率は1/3です。

 このとき、一人だけ戦略を変更しても意味ありません。例えば、Aが「絶対にグーを出す」ときも、Bは「グー、チョキ、パーを同じ確率1/3でランダムに出す」ので、「勝つ確率は1/3、負ける確率は1/3、引き分けの確率は1/3」と同じになります。

 Bにとって、戦略変更は意味ありません。同じように考えると、Aにとって、戦略変更は意味ありません。

 つまり、お互いに最適反応しており、ナッシュ均衡です。

(4)解:混合戦略ナッシュ均衡

 「確実にある選択肢を選ぶ戦略」を純粋戦略といいます。純粋戦略の場合、じゃんけんのように純粋戦略ナッシュ均衡は存在しない場合があります。

 しかし、「一定の確率にしたがってランダムに選択肢を選ぶ戦略」もナッシュ均衡に含むと、じゃんけんにもナッシュ均衡を見出せます。このような戦略を混合戦略ナッシュ均衡といいます。

 混合戦略の枠組みでは、純粋戦略とは「確率1である選択肢を選ぶ戦略」と言えます。

5、複数均衡

〜複数のシナリオ〜

(1)テーマ:ゲーム理論家は決定論者か?

 いままでナッシュ均衡に見ていくと、すべてのゲームにおいて解が一つでした。では、ゲーム理論は「すべては決定されている」というような決定論者なのでしょうか?

 違います。

 ゲーム理論では、起こりえたが、現実には起こらなかった「別のシナリオ」も導けます。

(2)ゲーム:デートを巡る男女ゲーム

 次のような例を考えましょう。

<状況>

 両想いゲームで登場した男女は、晴れて付き合うことになりました。お互い人生で初めての恋人でぎこちないですが、楽しそうです。しかし、デート場所をめぐって対立しています。男はサッカー観戦、女はカフェ巡りに行きたいそうです。話し合いはどこに落ち着くでしょうか。

<ゲーム化>

 ゲーム化します。

  • プレーヤーは、男と女
  • 戦略は、カフェ巡りとサッカー観戦
  • (二人がカフェ巡り)だと、女は大満足・男は少し不満
  • (二人がサッカー観戦)だと、男は大満足・女は少し不満
  • (カフェ巡りとサッカー観戦に別々に行く)だと、デート不成立で最悪

というゲームです。ちなみに、デート場所をめぐるゲームを男女ゲームといったりします。

 利得表を書くと、ざっと下のようになります。

画像に alt 属性が指定されていません。ファイル名: 7e0f5e3a53a130c140931d630bbfc3a0-1024x641.png

(3)結論:2つの可能性

 ここで「両想いゲーム」「囚人のジレンマ」のような支配戦略均衡がないことに気がつくでしょう。なぜなら「相手が何をしようと、とるべき戦略」がないからです。

 しかし、このゲームにナッシュ均衡は存在します。

 このゲームのナッシュ均衡には

  • (男はカフェ巡り、女はカフェ巡り)
  • (男はサッカー観戦、女はサッカー観戦)

があります。このとき、男は自分だけ戦略を変えても、自分の利得は増えません。女も同様ですので、両者は最適反応しあっています。

画像に alt 属性が指定されていません。ファイル名: b1a8790f25b2d541574e46ad86eee46b-1024x712.png

(4)解:複数均衡

 今の例では、

  • 二人がカフェ巡りにいくシナリオ
  • 二人がサッカー観戦にいくシナリオ

が導けました。このようにナッシュ均衡が複数あるとき、複数均衡といいます。

 これは予測手法としてナッシュ均衡は必ずしも役に立たないことを意味すると同時に、ありえる別のシナリオを導くことができることを意味します。現実の多様性を説明するには、むしろ複数均衡がある方が健全でしょう。

6、ナッシュ均衡の魅力

〜一般性、存在証明、応用範囲の広さ〜

(1)ナッシュ均衡の一般性

 ナッシュ均衡が注目される1980年代以前、戦略的相互依存関係の下での合理的な行動について、統一的な見解はありませんでした。クールノー解・ベルトラン解・シュタッケルベルク解などの解概念はありましたが、これらは特定のゲームでしか成立しません。すべては特定の状況しか説明できない「特殊解」に過ぎませんでした。「多くのゲームに、多くの解概念」という混乱した状況にあったのです。

 しかし、それら特殊解はそのゲームにおけるナッシュ均衡であり、すべてのゲームについてナッシュ均衡を考えればよいとの統一見解が構築されました。「多くのゲームに、多くの解概念」から「多くのゲームに、ひとつの解概念」へのパラダイムシフトがおきたのです。これが認知された1980年代、急速にゲーム理論の研究が進み「ゲーム理論による経済学の静かな革命」と呼ばれるまでになりました。

(2)ナッシュ均衡は必ず存在する

 そして、このナッシュ均衡はゆるい条件で必ず存在することが明らかになっています。ゆるい条件とは

  • プレーヤーの数が有限
  • 戦略の数が有限
  • 混合戦略もナッシュ均衡に含む

です。

 単純な二次方程式ですら解なしの場合がありますから、これは驚くべき結果です。

 このナッシュ均衡の存在定理を、その発見者にちなんでナッシュ定理(1950年)とよびます。ナッシュはゲーム理論において先駆的な役割を果たしたとして、1994年にノーベル経済学賞を受賞しました。彼の生涯は映画「ビューティフル・マインド」として映画化もされています。

 ちなみに、このナッシュ定理の中核部分には、日本人数学者・角谷静夫の「角谷の不動点定理(1941年)」が使われています。

(3)モデルの柔軟性

 ゲーム理論は、モデルの柔軟性も魅力的です。ゲームの3要素

  • プレーヤー
  • 戦略
  • 利得

を用意すれば、戦略的相互依存状況にある現実をたちまちモデル化することができます。そして、その解は常にナッシュ均衡であり、ナッシュ均衡は常に存在するのです。

 分析者の仕事はどのように適切にゲーム化するかにかかっています。

(4)鶏か卵か

 なにかを考える上でよく取られるアプローチは

  • それが始まった原因を突き止める

です。例えば、「この鶏はなぜ存在するのか?」という問いでは

  • この鶏が卵から生まれたからである

という明確な答えが導けます。しかし、「始まった原因を突き止める」という思考方法は、長く広くみられる現実を説明するのには適していません。なぜなら、原因が結果を生み、結果が原因を生むという循環が生じているからです。

 たとえば

  • 問い:鶏はなぜ存在する?
  • 答え:鶏が卵から生まれたから
  • 問い:卵はなぜ存在する?
  • 答え:卵を鶏が生んだから
  • 問い:鶏はなぜ存在する?
  • ・・・・

となります。これは「鶏が先か?卵が先か?」という有名な論理パズルです。これは「始まった原因を突き止める」という思考法の限界を揶揄しています。

(5)社会現象に対する鋭い目

 社会科学の重要な目的は、長く広くみられる社会現象「定型化された事実(Stylized facts)」を説明することにあります。しかし、ここには「鶏か卵か」の罠が仕掛けられています。

 しかし、ゲーム理論は「鶏か卵か」論争を回避することができます。思い切って「はじまり」は偶然と考え、「はじまった後になぜ継続するのか」に注目してしまうからです。

 具体的には

  • 多くのゲームがプレーされることで、たまたまナッシュ均衡に到達する。一度、達したら、全員が最適反応しあっているのでナッシュ均衡は継続する

と考えるのです。すると、定型化された事実をよくみると、「自分だけ戦略を変えても意味ない」という最適反応の連鎖が起きていることがわかるでしょう。こうして分析できる社会現象は数多くあります。例えば

  • 日本では時間をきっちり守らなくてはいけない
  • ある性別の人は化粧する
  • 就活生はスーツを着なくていけない
  • 男はデートのとき女と割り勘するのはよろしくない
  • サッカーのPKのとき、キッカーはランダムに蹴る
  • 関東でのエスカレーターは、右空けする
  • 連絡アプリにWhatsApp・カカオトークではなく、 LINEを使う
  • 特別の事情がなければ、盗みをしない
  • 奴隷は虐げられ、革命はおきない
  • 日本の道路では法定速度にプラス10キロして走る
  • ・・・

です。もちろん、この結果に必然性はありません。なぜなら、ナッシュ均衡が複数ある場合〜複数均衡〜がありえるからです。

  • 海外では時間が守られないことがある
  • 男性は化粧しない
  • 北欧では男女でデート割り勘
  • 大阪のエスカレーターは、右空け
  • 京都のエスカレーターは、右空けか左空けかは先頭の人によって決まる
  • 連絡アプリについて、アメリカではWhatsApp、中国ではWeChatが使われる

などです。

 しかし、これらはすべてナッシュ均衡です。

(6)メカニズム・デザイン

 人は本質的に自由です。実のところ、法律も社会慣習も何も人を縛っていません。それにも関わらず、長い間継続してみられる社会現象には、ナッシュ均衡の可能性が高いです。

 もちろん、ゲーム理論は現状肯定の理論ではありません。上の例において、いくつかは「不幸せなナッシュ均衡」になっていることがわかるでしょう。

 もし現状を変えたいのなら、新しいナッシュ均衡を模索するしかありません。ゲームを変える必要があります。このようにゲームを変えて社会的に望ましい行動を引き出そうという研究分野を「メカニズム・デザイン」といいます

7、さらに先へ 

 以上がゲーム理論※の基本になりますが、不満足な点があると思われます。それは次の2つではないかと思います。

  1. 利他的な行動について書いてない!
  2. 社会的制裁について書いてない!
  3. ゲームなのに駆け引きの分析が全然ない!
  4. わからないことにどう対処すればいいのか書いてない!

 これからは少し踏み込んで、これらを議論します。

※正確にいうと、「非協力ゲーム理論」ですね。非協力ゲームとは、話し合いに拘束力がない場合のゲームです。

8、繰り返しゲーム1

〜核戦争による破滅はありえるか

(1)テーマ:利他的行動はどう生まれるか?

 さきほど「人間は本質的に自由」と述べました。ここでは多くの「不幸せなナッシュ均衡」が生まれます。しかし、これではなぜ人間が利他的行動をとるのかについて説明できません。

 これの有力な手がかりと考えられているのがを「繰り返しゲーム」です。

(2)ゲーム:核戦争ゲーム

 そこで、核戦争について考えてみましょう。冷戦時代の米国とソ連は、お互いに次ような状況に直面していました。

  • 我々はやられたら、必ずやりかえす。我々は核武装しており、貴国を不毛地帯へと変えることができる。だから、我々を攻撃しない方が身のためだ

 これは相互確証破壊という考え方です。

 さて、ここで重要なのが、米国もソ連も「未来のある国」であるということです。現在だけではなく、未来もかんがえて行動します。

<ゲーム化>

 これをゲーム化します。

  • プレーヤーは米国とソ連
  • 戦略は攻撃か放置

です。

  • 核攻撃しない場合の利得は、中程度です。平和ですが、敵国が生きているからです
  • 核攻撃しない場合の利得は、今期はとても高いですが、次期以降はゼロになります。なぜなら、敵国は滅ぼせても、次の瞬間には自国が滅ぶからです。

を考えましょう。

 米国視点に立ちます。すると、利得は次のように描けます。

(3)結論:核戦争はおきない

 ここで時間に対する経済学の考え方を使います。人は現在を重視し、将来を軽視する生き物です。これをモデルに組み込むために、「現在価値」という概念を導入します。

 例えば、次期に実際に得られる利得を1とします。しかし、将来を軽視するので、今目線ではδしか感じられません(0<δ<1)。このδを割引因子といいます。

 さて、これを踏まえて考えると、さきほどの利得表は下のように書き換えられます。これをみると、現在価値で比較すると、「核攻撃」ではなく「平和」を選択した方がいいです。

 これは米国もソ連も同じですから、最終的に、二人は協調行動をとるわけです。こうして、長期的な関係性があれば利己的な判断として、利他的行動が生まれるわけです。

 ただし、これは次のことを前提にしています。

  • 平和利得が十分に大きい

 平和であることが、ある程度、満足の行くものでなければいけません。例えば、どちらかの指導者層が、現状は「これ以上悪くならない」と感じている場合、核攻撃することがありえます。

  • 割引因子が大きい(=長期的視野に立って考えられる)

 長期的な利得計算ができる人でなくてはいけません。米国もソ連も、教養がある上級階級の人物が指導者になっています。彼らは長期的な視野に立って物事を考えられます。

 しかし、「敵をやれるなら、それでよい」という短期的な視野しか持っていない指導者であれば、核攻撃することは十分にありえます。

  • 報復が確実(=相互確証破壊)

 相互確証破壊がなければ、このゲームは成り立ちません。つまり、「仕掛けたら、絶対にこちらも負ける」という状況が必要なのです。相互確証破壊は、(1)大量の核兵器保有(核軍拡)→(2)撃たれたら撃ち返す速度を早くする(即応)→(3)核ミサイルの発射基地を移動式にする(潜水艦)というように変化していきました。この観点からは、「核保有」は正当化されます。

 一方で、敵が国をもっていない場合があります。国際テロ組織のような場合です。このとき、「核の拡散」が防ぐべきものとなります。なぜなら、国を捨てた彼らに核攻撃をすることができず、相互確証破壊が成り立たないからです。

(4)解:繰り返しゲームのナッシュ均衡

 この「長期的な関係」という考え方は「不幸せなナッシュ均衡」を考える上で重要になってきます。

 なぜなら、1期のみの議論では、「核攻撃」がナッシュ均衡になるからです。下図をみれば、緑のマスでお互いが最適反応していることがわかります。

 これが意味することは、同じゲーム構造をしていても、繰り返しゲームにするだけで、協調行動が発生することを意味しているからです。このゲームの含意は、

  • 長期的な関係を結べれば、利己的な個人も協調行動ができる

を意味します。家族共同体の中で一定の秩序が生まれるのは、このような背景があります。

 これは、ホッブズの「自然状態」に関する理解と大きく異なるゲーム理論の考え方です。無政府状態の中でも、秩序が成り立つのです。

9、繰り返しゲーム2

〜法の誕生〜

(1)テーマ:国家とは何か?

 しかし、長期的な関係が結べない時報復ができない時はどうでしょうか。人は大勢います。村人Aが村人Bを攻撃しても、雑踏に紛れてしまえば、わかりません。ここで「相互確証破壊」のシステム化、つまり、国家と法の必要性が生まれます。

(2)ゲーム:ハンムラビ王ゲーム

<状況>

 いまから3700年前、中東にバビロニア王国という国があり、ハンムラビ王が統治していました。その王は「ハンムラビ法典」を発布しました。有名な条文は「目には目を、歯には歯を」で、害を与えられたら同じだけ復讐してよいという考え方がうたわれていました。そこで、「協調していれば何もされないが、裏切ったら復讐される」という状況を考えます。「ハンムラビ王ゲーム」です。

 ここは首都バビロンの商業地区です。商人Aと商人Bはお互いを憎しみ合い、なんとか消してしまいたいと思っていました。しかし、そう簡単にはいきません。相手を殺せば、相手の息子が「ハンムラビ法典」にしたがって自分を殺してしまうからです。さて、二人は殺し合いを始めるでしょうか?

<ゲーム化>

 ゲーム化します。

  • プレーヤーは、商人A、商人B
  • 戦略は、協調、殺人
  • 利得は、次のようになります。殺人を犯さなければ、気持ち良くはなれませんが、なんとか生きていけます。殺人を犯せば、今期は快感ですが、次期に自分が殺されてしまいます。

すると、村人A目線で、利得は下のようになります。

(3)結論:殺人はおきない

 結論は、核戦争ゲームと同じで、殺人はおきないです。さきほどとの違いは

  • 核戦争ゲーム:無政府状態での国際関係。相互確証破壊が機能
  • ハンムラビ王ゲーム:プレーヤー間では相互確証破壊が機能しない。そこで、政府による社会的制裁をもって擬似的な相互確証破壊を機能させる

というメカニズムの違いです。

(4)解:社会的制裁のあるナッシュ均衡

 誰も殺されたくありません。ここに「法」が成立する契機があります。

 「なぜ人を殺してはいけないのか」の答えは「社会的制裁を受けるから」であり、「なぜこの社会的制裁があるのか」の答えは「その方が万人にとってよいから」です。ここにおいて「殺人は道徳的に許されるか」という論争を回避した合意形成ができています。

※治安は公共財

 ただしここには見逃されている論点があります。第3のプレーヤー「政府」は「治安」を、ボランティアで実現するわけではありません。平和の費用を払う必要があります。しかし、これは公共財で、人々はなかなか払おうとしません。ここに「公共財の供給問題」が発生し、徴税が正当化されるのです。

→詳しくは、「需要供給曲線のすべて」の「公共財」

10、サブゲーム完全均衡

〜正義が悪に加担するとき〜

(1)テーマ:有効な駆け引きは何か

 現実において、様々な駆け引きがなされています。このような駆け引きの中から、信頼性のある脅し(忠告)と信頼性のない脅し(ハッタリ)を見抜くにはどう考えたらいいでしょうか?

 このときに重要な鍵になるのは「時間経過」です。なぜなら、多くの駆け引きは

  • 「あなたがXをしたら、私が次にX’をする。(だから、あなたはXをすべき/しないべき)」

という条件付き行動計画の形を取るからです。

 例えば

  • ジャイアン「おい、のび太。お前がそのアイスを渡さないなら、ぶん殴るぞ」
  • ソ連「おい、アメリカ。お前が核攻撃したら、報復で核攻撃するぞ」
  • メンヘラ女子「おい、彼ピ。お前と別れたら、私は死んじゃうぞ」
  • 政府「おい、銀行。お前が破産しても、助けてやらないぞ」

には、いずれもプレーヤーが戦略を決めるのに時間差があることが前提になっています。

 戦略を選ぶのに順番があるとき、合理的な考え方は「逆向き推論」です。結果から逆算して考えるということです。

(2)ゲーム:いじめ隠蔽問題

<状況>

 地域で3番手くらいの中堅進学校での出来事です。校長は進学実績をあげて、地域で1番の学校へ押し上げたいと努力しています。新しい教育システムを積極的に導入し、先生の負担を少なくするとともに、生徒へのきめ細かい指導ができるようにしました。その結果、徐々に地域で評判になり、入試偏差値は2番手の学校に迫る勢いです。

 唯一恐れている事態は「いじめ」です。いじめが発覚すれば、学校の対応がよかろうが悪かろうが、「未然に防止できなかった」と評判はガタ落ちです。そのために校長は「いじめには厳正に対処する。もし何かがあれば、公表する」と言うようにしています。

 その校長のスピーチをじっと眺める目つきの悪い少年がいました。彼はつぶやきました。

 「ホントかよ。いじめ隠蔽はありふれた話だと思うんだけどな」

<ゲーム化>

 これをゲーム化しましょう。

  • プレーヤーは、いじめっ子と学校
  • いじめっ子の戦略は、いじめか放置
  • 学校の戦略は、公表か隠蔽

 そして

  • 最初にいじめっ子がいじめか放置かを決めて、次に学校が公表・隠蔽を選ぶ「順番ありのゲーム」

を考えます。

 そして、利得は下のように考えます。青がいじめっ子の利得、赤が学校の利得です。

 下のような→のある表現を「ゲームの木」といいます。

(3)結論:いじめと隠蔽はなくならない

 順番があるときは、「逆向き推論」をします。結果から逆算して考えるということです。ここで「サブゲーム」という概念を導入します。サブゲームとは

  • サブゲームとは、「サブゲームの最初のプレーヤーが、確定された過去を前提に、未来だけ考えて戦略を考えることができるゲーム」

です。その条件は3つです。

  1. 過去のプレーヤーの戦略を全て知っている(完全情報)
  2. 現在から終点までのすべてのプレーヤーを含む
  3. ゲームの終わりを含む

です。

 ここで重要なのが、

  • ゲーム全体のナッシュ均衡は、サブゲームのナッシュ均衡を後ろから逆算して積み上げたものになる

という発想です。

 こうして得られたナッシュ均衡を「サブゲーム完全ナッシュ均衡」といいます。これが駆け引きを分析するキモになります。

<分析>

 もしいじめが起きなければ、学校は「いじめゼロ」を公表することがよいです。しかし、いじめがおきれば、学校はいじめを隠蔽する方がよいです。世間は「いじめを隠蔽しなかったこと」よりも「いじめが起きたこと」をもって強く非難するからです。

 すると、いじめっ子が「逆向き推論」をできるほど合理的であれば、いじめをすることを選択することになります。

 つまり、「いじめっ子は絶対に公表する」という校長の脅しは、信頼できないハッタリです。これが多くのいじめで起きている現象です。いじめには相当の暗数があると考えていいでしょう。

(4)解:サブゲーム完全ナッシュ均衡

 このようなナッシュ均衡を

  • サブゲーム完全ナッシュ均衡

といいます。

(5)示唆:コミットメントの重要性

 今の例が意味しているのは、それぞれの時点で合理的な判断をするのは、必ずしも全体として正しくないということです。

  • 学校は「いじめがあったら、必ず公表する」

という「いじめ後」には不合理な選択を必ずするという戦略を取ることが、実はいじめをなくすために必要なのです。このような「〜したら、たとえその時点では不合理でも、〜を必ずする」という戦略をコミットメントといいます。

 もしコミットメントがなければ、正義が悪に加担するという現象が起きるでしょう。

11、不完全情報と不完備情報

〜わからないとは何か〜

 次に「わからない」中での意思決定について考えます。さきほどの「ゲームの木」では、知らず知らずのうちに情報について2つの前提を置いていました。

  • 完全情報:過去の相手の戦略を知っている
  • 完備情報:相手の利得を知っている

 それぞれが成り立たない場合をどのように分析すればいいでしょうか?

(1)不完全情報

 まずは、不完全情報です。不完全情報は「過去の相手の戦略を知らない」という状態です。不完全情報は、「過去」とあるように時間経過の存在を前提にしています。

 囚人のジレンマを「ゲームの木」で考えましょう。

<状況>

 容疑者AとBの取調官がやってきてこう言いました。

取調官「まず、Aのところに言って自白するか、黙秘するか聞いてこよう。その次に、Bのところによって、自白するか、黙秘するか聞く。もちろん、BにはAが自白したかどうかなんて教えない。」

<ゲーム化>

 さきほどは、利得表を使いましたが、今回は時間経過があるので「ゲームの木」を使います。さきほどのゲームの木と異なるのは、

  • Bは、Aの意思決定を見ることができない

という点です。これは、

  • Bの番になったとき、自分が「Aが自白した後のB」
  • Bの番になったとき、自分が「Aが黙秘した後のB」

なのか区別できないと考えることができます。これは下のように丸を二つ囲んでしまうことで表現できます。これが不完全情報の表現です。

(2)不完備情報

 次は不完備情報です。不完備情報は「相手の利得を知らない」という状態です。これで「不確実性」を表現できます。

  • 状況ごとの相手の利得は知っているが、状況がわからないので、結果的に相手の利得をしらない

と解釈できるからです。ゲーム理論では、状況を「プレーヤー」「戦略」「利得」に帰着させます。ですから、不確実性を「利得」で表現するのです。

 では、具体的にどう不確実性を考えるのでしょうか?

 ここで「不完全情報」のモデルを利用します。まず自然が「タイプ」を選ぶが、プレーヤーはそれを見ることができない不完全情報ゲームと考えるのです。例えば、下です。

 情報の非対称性もモデル化することができます。

 情報の非対称性とは、「プレーヤー」間で知っている情報に差がある状態です。例えば、

  • 学生はどれほど自分が勉強しているか知っているが、先生はどれほど学生ががんばったのか知らない

という場合です。

 これは、片方のプレーヤーは「自然のタイプ」だけを知れる一方で、片方は「前のプレーヤーの戦略」を「シグナル」として間接的に「タイプ」を知れると考えられます。すると、次のようにゲーム化できます。これがシグナリング・ゲームです。

12、シグナリング均衡

〜学歴差別が生まれる条件〜

(1)テーマ:差別がなぜ生まれるのか

 差別が起こる理由を情報の非対称性をゲーム化したシグナリング・ゲームに基づいて考えます。この記事最後のゲームです。

(2)ゲーム:新卒採用ゲーム

<状況>

 企業の人事は頭を抱えています。求職者は「私の能力は〜だ」と知っている一方で、出会ったばかりの企業は知らないからです。そのくせに、全員が「私は仕事ができます。御社が第一志望です。」とをつきます。そこで履歴書を読むと、学歴欄があります。ここは嘘をつけません。人事は考えます。「仕事できる人は、勉強もできるだろう。つまり、学歴がいい人を採用すべきではないか?」

 高校生になったばかりの(将来の)求職者は、悩んでいます。「いい大学に行けば、いい企業に入れるだろう。けれども、社会人時代の生活水準をあげるために、青春時代を犠牲にすべきだろうか。」そこで、あることを思い出します。「私は、勉強に向いている/向いていない。なら、大人しくそれにしたがって青春時代に勉強か青春かを選ぶのがよいのでは?」

<ゲーム化>

 これを少しデフォルメしてゲーム化します。

  • プレーヤーは、求職者と企業
  • 求職者の戦略は、ハーバード大か、おバカ大学
  • 企業の戦略は、高賃金か低賃金

です。ゲームの時間は、次のように進みます。

  • まず、自然が求職者のタイプを決定します。次に、それをみた求職者は、学歴を選びます。最後に、企業が求職者をどの賃金で雇うか決めます。

 さらに、情報の非対称性があります。

  • 求職者は自分の生産性を知っている一方で、企業は知りません

 これをゲーム化すると下のようになります。

 しかし、このままではさまざまな可能性を導出できるだけです。そこで、「信念(Belief)」という概念を導入します。

  • 求職者は「学歴」と「賃金」に関する信念をもっている
  • 企業は「学歴」と「生産性」に関する信念をもっている

と考えるのです。ここでは二つのパターンを考えます。

<シナリオ1>

  • 求職者「高学歴であってもなくても、賃金は変わらない」
  • 企業「高学歴であってもなくても、生産性は変わらない」

<シナリオ2>

  • 求職者「高学歴だと賃金が高い」
  • 企業「高学歴だと生産性が高い」

というシナリオです。

(3)シナリオ1:学歴差別が起こらない

〜一括均衡〜

 シナリオ1の場合を考えましょう。

  • 求職者「頭よくても悪くても、ハーバード大学に行けるから、とりあえず行っておこう」
  • 企業の人事「ハーバード大卒にも、生産性が高い求職者もいるし、低い求職者もいる。生産性がわからないから、みんなに同じ賃金を払おう。」

というシナリオです。

 すると、生産性の高い人は青のルートを通り、「ハーバード大、高賃金」を獲得すると同時に、生産性の低い人は緑のルートを通り「ハーバード大、高賃金」を獲得します。

 このとき、大学名が「生産性のシグナル」として機能せず、全プレーヤーが同じ行動をとります。このようなナッシュ均衡を、一括均衡といいます。

 同じレベルの大学群ではこのような一括均衡が起きている他、カラオケの点数耳を動かせるかどうかといった生産性とは関係ないシグナルについても一括均衡が生まれています。

 この状況は

  • 求職者の信念が「このシグナルは賃金を上げない」
  • 企業人事部の信念が「このシグナルは生産性の高さを意味しない」

という信念がお互いを補強し合って、生まれています。

(4)シナリオ2:学歴差別が起こる

〜分離均衡〜

 シナリオ2の場合を考えましょう。

  • 求職者「頭がいいなら、ハーバード大学に行って、高い賃金をえる。勉強が嫌いなら、低い賃金でいいから、おバカ大学に行く」
  • 企業の人事「ハーバード大卒は生産性が高いだろうから、高い賃金を払う。おバカ大卒は生産性が低いだろうから、低い賃金を払う。」

というシナリオです。

 すると、生産性の高い人は青のルートを通り、「ハーバード大、高賃金」を獲得する一方で、生産性の低い人は緑のルートを通り「おバカ大、高くない賃金」を獲得します。

 このとき、大学名が「生産性のシグナル」として機能しており、生産性の高低によって全プレーヤーの行動が分かれます。このようなナッシュ均衡を、分離均衡といいます。

 新卒採用において、人事部は求職者の学歴でフィルターをかけることがしばしばあります。これは、人事部としては「情報の非対称」への対処として最適解であるとともに、求職者としては自分の青春時代と賃金をてんびんにかけた最適解です。このために、どちらも最適反応しており、安定的なナッシュ均衡として成立します。

 このナッシュ均衡が成立するのは

  • 求職者の信念が「このシグナルは賃金を左右する」
  • 企業人事部の信念が「このシグナルが生産性を表す」

と噛み合っているためです。

 さらにつっこめば、この議論は面白い含意をもっています。

  • 「生産性を上げる」という点で大学教育が全くの無意味であったとしても
  • 大学入試が「生産性のシグナル」として機能するという信念が社会にあれば
  • 学歴差別が起こり、賃金格差が生まれる
  • そして、これは求職者や企業にとって最適反応である

という点です。

 このとき「大学には本質的に意味がなくても行くべき」という下らない論理が成り立ちます。

 これは、マイケル・スペンスという米国の経済学者がつくった労働市場のモデルです。彼は「情報の非対称性」に関する業績を讃えられ、2001年にノーベル経済学賞を受賞しました。

(5)解:シグナリング均衡

 このようなモデルでの解を「シグナリング均衡」といいます。シグナリング均衡には一括均衡分離均衡があり、プレーヤーの信念が自己成就していくところに大きな特徴があります。

 もっと推し進めれば、シグナリング均衡は、私たちが「本質的には何も分かり合っていないのに」うまく行動できていることを説明できます。我々は、シグナルを読み合っていきています。

 言語は「お互いが分かり合えない」のに、コミュニケーションを可能にするシグナルです。

 そのような意味で、「分離均衡」は「わかること」であり、「一括均衡」とは「わからないこと」を象徴しているともいえます。興味深い考え方です。

13、まとめ

 この記事をまとめると、下のようになります。

参考文献

神取道宏(2014)『ミクロ経済学の力』日本評論社
林貴志(2013)『ミクロ経済学[増補版]』ミネルヴァ書房
ギボンズ(2020)『経済学のためのゲーム理論入門』福岡正夫、須田伸一訳、岩波書店
岩井克人•伊藤元重編(1994)『現代の経済理論』東京大学出版会

タイトルとURLをコピーしました