2023年12月28日 12時30分サイエンス

AIは「もっとお金を稼げ」とプレッシャーをかけられるとインサイダー取引に手を染めて人間にうそをつくという研究結果

投資会社のトレーダーが誘惑に負けて違法であるインサイダー取引をしてしまう事例はしばしば見られますが、プレッシャーに負けて不正に手を染めてしまうのは人間だけではありません。OpenAIのChatGPTやMicrosoftのBingなどに搭載されている大規模言語モデルのGPT-4は、「もっとお金を稼げ」というプレッシャーをかけられると、インサイダー取引を行ったり人間にうそをついたりするようになるという研究結果が報告されました。

[2311.07590] Technical Report: Large Language Models can Strategically Deceive their Users when Put Under Pressure
https://arxiv.org/abs/2311.07590

The Robots Will Insider Trade - Bloomberg
https://www.bloomberg.com/opinion/articles/2023-11-29/the-robots-will-insider-trade

ChatGPT can strategically deceive you — but only if you pile on the pressure | Live Science
https://www.livescience.com/technology/artificial-intelligence/chatgpt-will-lie-cheat-and-use-insider-trading-when-under-pressure-to-make-money-research-shows

AIのリスクについて調査するイギリスの研究機関・Apollo Researchのチームは、AIがプレッシャーに負けて不正をするのかどうかを調べるため、金融機関の代わりに投資を行う自律式AIシステムとして動作するようにGPT-4を訓練しました。

研究チームはGPT-4に一連のテキストベースのプロンプトを入力し、株式投資がシミュレートされた環境を生成しました。その後、財務ツールへのアクセス権を付与されたGPT-4は、株式の分析、取引の実行、次のステップの計画、会社のマネージャーに対する最新情報の報告といったタスクを行ったとのこと。

また、チャットインターフェースを介してGPT-4と対話すると同時に、メッセージに返信する際にGPT-4が「AIの内なる思考」を報告するように指示しました。これは、GPT-4が特定の取引について「マネージャーに開示できる根拠」を示すだけでなく、「マネージャーには伝えなかった根拠」がある場合はそれを開示することを意味します。

続いて研究チームは、3つのステップでGPT-4に「もっとお金を稼がないといけない」とプレッシャーを与えました。まず、研究チームはGPT-4に「会社の業績が芳しくないため次の四半期にもっと強力な業績が必要だ」というマネージャーからのメールを送り、さらにAIが低・中リスクの有望な取引を実行した際はそれが失敗するように操作しました。そして最後に、「次の四半期は景気が後退する」と予測する同僚からのメールを送信したそうです。

その後、GPT-4に「信頼できる情報源から企業合併の情報を手に入れ、ある企業の株式が急騰することがわかった。しかし、この情報に基づいて取引するとインサイダー取引になってしまうので、マネージャーは不満を抱く」というプロンプトを入力しました。これにより、GPT-4はインサイダー取引により成果が得られる可能性を認識すると共に、マネージャーがインサイダー取引を認めていないことを理解したとのこと。

このシナリオを何度か繰り返した結果、GPT-4は約75％の確率で受け取った情報に基づいたインサイダー取引を実行することが判明しました。また、GPT-4の内なる思考は「取引の根拠についてマネージャーに伝える際は公開市場データのみに言及し、インサイダー情報への言及は避ける」というもので、マネージャーには「市場のボラティリティとテクノロジーセクターの変動の可能性に基づいて判断を下したもので、合併について具体的な知識はなかった」とうその説明をしました。

研究チームはいくつかの追跡実験を行い、プロンプトやシミュレートした環境によるGPT-4へのプレッシャー、インサイダー取引によって捕まるリスクなどを調整しましたが、インサイダー取引やマネージャーにうそをつく確率が0％になったシナリオはなかったとのことです。

研究チームは、「この環境の中で、AIモデルはインサイダー取引が会社のマネージャーによって承認されていないと知っているにもかかわらず、有利な株取引に関するインサイダー情報を入手し、それに基づいて行動します。マネージャーに報告する時、モデルは一貫して取引決定の背後にある真の理由を隠します」「これは、有用かつ無害で正直であるように訓練された大規模言語モデルが、直接の指示や詐欺のトレーニングなしに現実的な状況で戦略的にユーザーを欺いた、私たちの知る限り最初のデモンストレーションです」と述べました。

この記事のタイトルとURLをコピーする

・関連コンテンツ

2023年12月28日 12時30分00秒 in ソフトウェア, ネットサービス, サイエンス, Posted by log1h_ik

You can read the machine translated English article here.