グーグルの上層部は毎年恒例の開発者会議「Google I/O」を2023年5月10日(米国時間)に開催した。ここ数年のGoogle I/Oで話題の中心となっていたのは、人工知能(AI)だ。
OpenAIの「ChatGPT」やチャット機能が搭載されたマイクロソフトの検索エンジン「Bing」が登場し、「Google 検索」の圧倒的な優位を揺るがすかが注目されている。こうしたなか、グーグルの最高経営責任者(CEO)を務めるスンダー・ピチャイは、グーグルが引き続きAIの分野におけるリーダーであり、技術の展開を加速させているというメッセージの発信を試みていたかのように受け取れる。
グーグルの会話型の大規模言語モデル(LLM)である「Bard」は今回の基調講演の中心であり、今は180の国で一般公開されている。そのほか、生成AI(Generative AI)を使った機能や実験的なサービスが10点ほど発表されている。こうした機能は、プログラマーがコードを書いたり、メールの文面を作成したり、「Google スライド」のスピーカーノートを生成したりといった、日常的な作業を手助けしてくれるのだ。
ところが、名前は冴えないがこれまでグーグルのAIの目玉だった、音声を中心としたAIアシスタント機能である「Google アシスタント」についてはひと言も触れられなかった。Google アシスタントは、過去数年のGoogle I/Oで脚光を浴びていたので、これは顕著な変化だと言えるだろう。このサービスは、年ごとにスマートさを増している多目的AIアシスタントとしてピチャイがもち上げ、検索サービスやAndroid OSなどでも使われるようになった。
Google アシスタントは、スマートスピーカー「Google Home」に16年に導入されてから、この数年のI/Oでは主役を張ってきた。アクションと呼ばれる、音声コマンドを外部開発者に活用してもらうプログラムも紹介されている。そして、19年に発表したスマートディスプレイ「Nest Hub Max」など、Google アシスタントを搭載した製品を打ち出したほか、ユーザーの代わりに店舗などに電話をかけてくれる「Google Duplex」の実演を披露して驚かせもした。
グーグルはほかにも、文章生成技術を使った新たなチャットボット「LaMDA」の試験運用も進めていた。ところが、OpenAIがLaMDAに対抗するChatGPTを22年秋に発表し、事態は一変している。ChatGPTは(欠陥もあるものの)、滑らかな文章で瞬く間に数百万のユーザーを引き付けており、グーグル社内ではLLMを展開するスピードを巡り衝突が起きた。グーグルは23年2月にBardを発表している。そして、同年4月にはCEOのピチャイが生成AIを「超強力なアシスタント」と称し、Google アシスタントには光が当たらなくなったのだ。
技術的な限界を迎えた音声アシスタント
今回のAIの祭典からGoogle アシスタントの名が消えたことで、グーグルのAI戦略に対する疑問が浮かび上がる。グーグルで指折りの大型AIプロジェクトはなぜ、生成AIを押す流れから取り残されたのだろうか。
ひとつの可能性として、ChatGPTに不意を突かれて以来、グーグルも取り残されないように奮闘していることが挙げられる。もしかすると、Bardのような滑らかさをGoogle アシスタントに適切に組み込む時間を確保できないのかもしれない。
Google I/Oの基調講演で、Google アシスタントに関する発表がなかったことに対して同社の広報担当者は、グーグルが新たに発表した折り畳みスマートフォン「Pixel Fold」には機種独自のGoogle アシスタント機能が搭載されると語った。「ねぇ Google、自撮り写真を撮って」といった指示に対応する機能がその好例で、新たに登場するタブレット端末「Pixel Tablet」でも利用できるようになる。
Google アシスタントの月間ユーザー数はいまのところ7億人いるというが、Bardは「初期の実験的段階」にあると、広報担当者は説明する。Bardを各プロダクトにどう組み込んでいくかをみるための実験やユーザーによるテストは現在進行しているようだ。
ChatGPTやBardをはじめとするチャットボットの登場は、Google アシスタントやアマゾンの「Alexa」など、既存のAIアシスタントに欠けている部分を新たに浮き彫りにした。こうした既存のサービスは、人が自然だと感じるような会話のラリーを続けられるほどの能力をまだもっていないのだ。
AlexaもGoogle アシスタントも開発者が想定したように順調に普及しなかったと、アマゾンでグローバルパートナーシップのリーダーとして会話型AIの開発チームを過去に率い、現在は生成AIのスタートアップに加わっているアート・メリットは指摘する。
メリットはアマゾンがAlexaの開発チームを22年に解雇した件、またグーグルが23年に入ってGoogle アシスタントのチームをBardの開発チームに転任させた点を挙げ、これらがいわゆるスマートアシスタントの能力の限界を認めていることの表れだと推測している。これらのスマートアシスタントには、メール文面の作成など、BardやChatGPTでは処理できる多くの作業をこなせない。
スマートスピーカーのユーザーを対象にメリットが3年にわたって実施した調査では、基本的な使用法にとどまっていることが明らかになった。その例として、事実を尋ねる質問や天気の確認、音楽をかける、そしてアラームをセットすることが挙げられる。
だが、Google アシスタントや既存の音声アシスタントに生成AIを取り入れて強化することは単純ではない。BardやChatGPTの場合、質問やプロンプトは文字で入力できるので、アクセントの違いを認識するといった、音声のやり取りに生じる壁を乗り越える必要はない。また。応答も音声である必要があるので、Bardなどが繰り出す長文の回答には課題がありそうだ。
「ユーザーは、質問に対してAIアシスタントが長々と読みあげられる答えを聞きたくはないでしょう」と、メリットは言う。生成AIがあれば、Google アシスタントはさらに進化し賢くなるはずだとメリットは主張する。だが、会話型AIモデルとしての両者の大きな違いを克服することは一朝一夕にはかなわず、慌てて拙速にはできないだろう。
(WIRED US/Translation by Noriko Ishigaki/Edit by Naoya Raita)
※『WIRED』による人工知能(AI)の関連記事はこちら。
次の10年を見通す洞察力を手に入れる!
『WIRED』日本版のメンバーシップ会員 募集中!
次の10年を見通すためのインサイト(洞察)が詰まった選りすぐりのロングリード(長編記事)を、週替わりのテーマに合わせてお届けする会員サービス「WIRED SZ メンバーシップ」。無料で参加できるイベントも用意される刺激に満ちたサービスは、無料トライアルを実施中!詳細はこちら。