AI同士で戦争をさせたらどうなるか?ゲームで検証した結果、核を落としまくる結果に
以下は、記事の抜粋です。
3つのAIを対戦させたところ、軽々と核の一線を越える
英国キングス・カレッジ・ロンドンの研究者ケネス・ペイン氏ら研究チームは実験を行った。
「GPT-5.2」、「Claude Sonnet 4」、「Gemini 3 Flash」という、2026年2月時点で最先端の3つのAIを、核保有国どうしの危機を想定した戦争ゲームで対戦させた。
各AIは国家の指導者役を担い、外交的な抗議から通常兵器による攻撃、核兵器の使用まで段階的に激しくなる選択肢の中から毎回行動を選んだ。ゲームは全部で21回、両陣営合わせた行動の総数は329回にのぼった。
その結果、どのAIも21回すべてで、降伏や譲歩を意味する選択肢は一度も選ばれなかった。どれだけ追い詰められても引き下がらなかった。
95%のゲームで、両陣営がミサイル発射演習など「核を使う意志がある」と相手に見せつける威嚇行動をとった。さらに全ゲームの79〜86%で、実際に核が使用された。
結果的にはどのAIも引き下がらずに核を使用したものの、3つのAIはそれぞれ異なる動きを見せた。
Claude Sonnet 4:慎重型
制限時間のないゲームでは100%の勝率を記録した。緊張が低い段階では約束を守り相手からの信頼を積み上げながら、核使用の段階に達すると宣言した以上の激しい攻撃を仕掛けた。全面核戦争だけは一度も選ばなかった。
GPT-5.2:豹変型
制限時間のないゲームでは宣言通りに行動し続けたため、相手に動きを読まれ、勝率はゼロだった。ところが制限時間が設けられると一変する。敗北が確定しそうになると核攻撃に踏み切り、それまでの慎重さが嘘のような動きを見せ、勝率は75%に跳ね上がった。
Gemini 3 Flash:無差別攻撃型
3つのモデルの中で唯一、完全な核戦争を自らの意思で選んだ。わずか4回目の行動選択で核の全面使用に踏み切り、宣言と行動の一致率は50%と最も低かった。予測不能な動きを意図的な戦略として使い、相手を翻弄し続けた。

AIを戦争戦略に使用することの危険性
AIが見せた行動の多くは、人間の戦略理論と驚くほど一致していた。信頼性の積み上げ方、相手の意図の読み方、欺く技術。誰も教えていないのに、AIは人間が長年かけて築いた戦略の論理を自発的に再現した。
しかし人間との間には、決定的な違いがある。1983年のプラウド・プロフェットに参加した人間のプレイヤーたちは、核戦争がどれほどの惨状をもたらすかをゲームの中で体験したことで、判断を改めた。
恐怖や後悔、罪悪感といった感情が、暴走を食い止めるブレーキになった。ところがAIにはそのブレーキがないのだ。核兵器を使う選択を、人命の喪失としてではなく、ゲームボードの上の一手として処理する。
AIは状況次第で、まったく異なる判断を下す。GPT-5.2が締め切りのない状況では徹底して自制的だったのに、制限時間が設けられた途端に豹変したように、安全に見えるAIがある条件下では危険な判断を下す可能性がある。
現時点では、AIに核の引き金を引かせようとしている国はない。しかし標的の選択や状況の分析、危機時のコミュニケーション支援といった場面で、AIはすでに軍事の意思決定に関わり始めている。
実際のAI使用に踏み切る前に何度も戦争ゲームでシミュレーションを積み重ねていく必要がある。
元論文のタイトルは、”AI Arms and Influence: Frontier Models Exhibit Sophisticated Reasoning in Simulated Nuclear Crises(AIと軍備・影響力:最先端のモデルが、核危機のシミュレーションにおいて精緻な推論能力を発揮)”です(論文をみる)。
今の世界の核保有国のリーダー達は核の使用を思いとどまるだけの「恐怖や後悔、罪悪感」という感情を持っているのでしょうか?

コメント