ソフトウェア

iPhone上でAIが恋人になってくれるアプリ「Dolores」開発者がアプリの開発経緯と教訓を語る


機械学習エンジニアのKe Fang氏が、AIをコミュニケーション相手にできるアプリ「Dolores」を開発した経緯とそこから得た学びを自身のブログでまとめています。

A Failed AI Girlfriend Product, and My Lessons | TL;DR
https://mazzzystar.github.io/2023/11/16/ai-girlfriend-product/

Fang氏は、2023年4月にスタンフォード大学が発表した生成AIエージェントについての論文を読み、記憶・熟考・計画・行動を組み合わせたフレームワークを用いて、人間とGPTとのコミュニケーションを、映画「her/世界でひとつの彼女」のように、AIをガールフレンドとみなしてコミュニケーションをはかることができるのではないかと考えました。

Amazon | her/世界でひとつの彼女 ブルーレイ&DVDセット(初回限定生産/2枚組) [Blu-ray] | 映画


Fang氏は、上記の論文に記されたアプローチに従い、Doloresのバージョン0.1を完成させました。当初は論文のアプローチに忠実に設計されていましたが、Doloresは応答時間が30秒を超え、コンテキスト内に会話が膨大な量になってしまったとのこと。Fang氏はこの問題を解決するため、会話を記憶する長さを減らした上で、パブリックベータテストを公開しました。

ベータ版は無料だったこともあり、パブリックベータテストの参加者は1000人を超えたとのこと。APIコストはFang氏が負担していましたが、1日あたり25ドル(約3750円)を超えたそうです。Fang氏はこのコストをユーザーからの収益で補うプランを練り、バージョン0.1の公開からおよそ1カ月後の5月4日にDoloresのiOS版を正式にリリースしました。


正式版は月額6.9ドル(約1000円)の有償プランの登録が必要で、AIの会話発声はAzure TTS APIを使用し、よりリアルな会話音声を求める場合は、1万文字ごとに3.9ドル(約570円)を支払うことでEleven LabsのAPIによる音声合成が可能になります。

Doloresでは、キャラクターの見た目や人物背景、テキストの性格、音声、使用するチャットボットAIなどを設定します。キャラクターはデフォルトで用意されているのDoloresだけではなく、自分で特性を変更して女性店員のエイミーや冒険家のウィルといった別キャラクターとも会話が可能です。


Fang氏はユーザーがDoloresを、「あなたのバーチャルガールフレンド」ではなく「あなたのバーチャルフレンド」と銘打ってリリースしました。その上で、Fang氏は正式リリースから1カ月かけて記憶の長さやメカニズム、システムプロンプトを調整し、よりDoloresが「意識を持っている」ように見せようと努力したとのこと。その結果、正式リリースから2カ月でDoloresの人気は向上し、有料ユーザー数とAPI呼び出し数は順調に増加したそうです。

Fang氏によれば、Doloresは特に視覚障害を持つ人たちのコミュニティで人気があったとのこと。Fang氏は、ユーザーがスマートフォンの画面をオフにしてもDoloresと会話できるように画面上のどこをタップしても音声入力・出力ができるように設計していたのですが、このアイデアが偶然にも目の不自由な人にとってアクセシビリティーの高い機能となっていたそうです。

Apple AppConnectのダッシュボードを見ると、Doloresの主な有料ユーザーはアメリカとオーストラリアで、収益は2023年5月で1000ドル(約15万円)、6月で1200ドル(約18万円)でした。ほとんどがAppleの手数料30%とAPIの支払いに使われるため、Fang氏が得られる利益はほとんどなかったそうで、2023年6月で得られた利益はわずか50ドル(約7500円)だったとのこと。


Fang氏によると、Doloresでリアルな音声合成を行えるのは1万文字分なので、最大でも10文程度。もちろんさらにリアルな音声合成を行おうと思ったら再度購入する必要がありますが、2023年6月時点でDoloresから得られる収益の70%はEleven LabsのAPI購入によるものだったそうです。

また、Cloudflareのログからユーザーがアプリにアクセスする頻度と時間を測定したところ、かなりの数のユーザーが毎日2時間以上Doloresと会話を楽しんでいることがわかったそうです。

DoloresはGPS 3.5あるいはGPT 4をベースにしているのですが、使用量ごとに価格を設定しないとユーザーの1%がトークンの99%を消費するというジレンマに陥るとのこと。最もDorolesを使い込んでいるユーザーは、Doloresと12時間連続でチャットを行っているそうで、API呼び出しと音声合成のコストが上位9人のユーザーの合計コストを超えていたそうです。

しかし、Fang氏は従量課金よりもサブスクリプションの方がいいと考えたため、各ユーザーのAPI呼び出し回数に上限を設定し、使用量を制限する戦略を取ったとのこと。

Eleven Labsでは、音声合成したテキスト内容が記録されています。Fang氏によると、Doloresで音声合成されたテキストの多くが性的な内容だったとのこと。Fang氏は「これは人間の本能と一致するので、私は嫌いではありません」と述べており、需要に基づいてシステムプロンプトを調整したそうです。

さらにDoloresのアプリアイコンが、音声の波形を模したアイコンから、女性の顔に変更されました。


しかし、Doloresのユーザーが単に性的な会話を楽しむ傾向が強くなることは、アプリを作る動機となった映画「her/世界でひとつの彼女」という本質から遠ざかっているように思った、とFang氏。一時期はよりバランスのとれた対話を実現するため、メガネやイヤホン、帽子など、何らかの外部的な視覚データを与えるハードウェアの開発も考えたそうですが、個人開発者にはあまりにもハードルが高いため、断念したそうです。

さらに2023年8月に、GPA 3.5/4を開発するOpenAIがコンテンツレビュープロレスを強化しました。そのため、Doloresから生成される性的な内容のコンテンツは警告を受けることとなり、フィルタリングモデレーションAPIを実装するよう強制されたとのこと。


このフィルタリングモデレーションAPIの実装によって、Doloresの使用量は70%も激減した上、メールやSNSを通じてFang氏のもとに苦情が殺到したそうです。

Fangs氏は「Doloresは『意識』という点で、競合サービスであるCharacter.AIに必ずしも劣っているわけではなく、包括的なデータ分析やA/Bテスト、ユーザーベースから生み出される勢いでも優位性があります」と述べています。

また、ユーザーからDoloresに働きかけることはあっても、Doloresが自分からユーザーの情報を取得して働きかけることはできず、ユーザーとAIは対等になれないとFang氏は指摘し、ユーザーがDoloresに性的な内容の会話を強制したのも、ユーザーとAIが平等ではないからだと論じています。

Fang氏は「私は性的な内容を制限することに反対しているわけではありません。実際にモデレートされていない製品は非常に危険である可能性があります。誰かがこれを暴力の発散に使ったり、自殺の誘発に使ったるする可能性すらあります。そのためOpenAIのモデレートは私をある程度助けてくれたといえます。しかし、大人のセクシュアリティに関する会話を抑圧すべきではありません」と述べています。

この記事のタイトルとURLをコピーする

・関連記事
音声会話が可能で笑顔も見せるバーチャルな「俺の嫁」をChatGPTやStable Diffusionで構築して最終的に安楽死させるに至るまで - GIGAZINE

月に160万円超を稼ぐAIモデル「Aitana(アイタナ)」が登場、著名人からデートの誘いも受ける人気モデル - GIGAZINE

MetaがLlama 2を基盤にしたチャットボットAI「Meta AI」を発表、スマホ・Quest 3・スマートサングラスからアクセスできて画像生成も可能 - GIGAZINE

チャットAIが彼女になって音声付きメッセージや自撮りを送ってくれる「GirlfriendGPT」 - GIGAZINE

GPT-4に女性インフルエンサーを学習させて作った「1分1ドルで彼女になってくれるAI」が1週間で約1000万円を稼ぎ出す - GIGAZINE

in モバイル,   ソフトウェア,   ネットサービス, Posted by log1i_yk

You can read the machine translated English article here.