メタの大規模言語モデル「Llama 2」の登場で、生成AI競争の勢力図が変わるかもしれない

OpenAIの「GPT-4」が急速に広く浸透していくなか、メタは無料で利用できる大規模言語モデル「Llama 2」をオープンソースとして発表した。起業家たちが強力なAIシステムを容易に構築できるようになったことで、生成AI競争はさらに激化しそうだ。
Half pixellated Llama peeks out of a loop that resembles the Meta logo.
PHOTO-ILLUSTRATION: WIRED STAFF; GETTY IMAGES

グーグルの研究員によって書かれたとみられる匿名のメモが流出したのは5月のことだった。それはグーグルの未来を危惧した内容で、同社の上層部がOpenAIのテキスト生成AIがどれほどの脅威となるかについて議論するなか、オープンソースのソフトウェアが「静かにわたしたちを出し抜いている」と主張していた。

その証拠として、メモには「Llama」が例として挙げられていた。Llamaはメタ・プラットフォームズが開発した大規模言語モデル(LLM)で、当初は招待された研究者だけが使えるようになっていた。しかし、数日も経たないうちに4Chanにリークされたことで、プログラマーの間で人気となり、Llamaを使った開発が始まった。

リリースから数週間もすると、Llamaをもとにして、AlpacaやVicunaといった生成AIツールが登場した。これらはChatGPTとほぼ同等の性能を有しながら、ノートPC上でもカスタマイズできるほど軽い。

「コミュニティに与えた影響力は計り知れません」と流出したメモにはLlamaについて書かれていた。「いまでは誰もが実験に参加できるのです」

ChatGPTに匹敵する?

7月中旬、メタは同社の想定よりも人気になってしまったLlamaの第2バージョンをリリースした。その名も「Llama 2」だ。今回は初めからオープンソースソフトウェアとして公開されており、商用利用も可能だ。メタによると、Llama 2は初代に比べて40%多いデータを使って訓練されており、このモデルを使って会話型AIをつくれば、OpenAIのChatGPTにも匹敵するようなテキストを生成できるという。

ChatGPTやグーグルのBardをはじめとする最近のAIモデルと同じく、Llama 2の開発には何百万ドルというコストがかかっているはずだ。しかしそのなかでLlama 2だけがデベロッパーやスタートアップに無料で公開されており、誰もがLlama 2を独自にカスタマイズできる。

メタのLlama 2がコストのかからない選択肢となることにより、小さな企業や個人プログラマーでも簡単に新たなプロダクトやサービスを開発できるようになる。これにより、AIブームがさらに加速するかもしれない。

Llama 2を提供しているのはメタだけではない。メタは複数の企業とパートナー提携を結んでおり、AIスタートアップのHugging FaceやDatabricks、OctoMLといった企業のサービスがLlama 2に対応し、すでに顧客へLlama 2の提供を始めている。

マイクロソフトも、過去にOpenAIに100億ドル(約1.3兆円)の投資をしたにもかかわらず、デベロッパーに向けてLlama 2をクラウドやWindowsでダウンロード可能にしている。7月中旬、顧客向けのカンファレンスに登壇したマイクロソフトの最高経営責任者​​サティア・ナデラは、デベロッパーたちがChatGPTと並んでLlama 2を使えるようになることを嬉々として説明していた。アマゾンのクラウド事業であるAWSも、Llama 2へのアクセスを顧客に提供している。

メタの生成AI部門のバイスプレジデントであるアマド・アル=ダールは、初代LlamaがリークされたことがどのようにLlama 2の運営方針に影響しているのかについて、コメントを差し控えている。

「メタの歴史を振り返ってみれば、わたしたちがずっとオープンソースの支持者であったことがわかると思います」とアル=ダールは、PyTorchを例に挙げて語る。PyTorchは機械学習を扱うデベロッパーの間で人気のツールだ。「コミュニティづくりをしようと思った理由は、研究者以外にもAIモデルに触れて技術を改良したいと思っている人がたくさんいたからです」

アル=ダールによるとメタはすでにLlama 3の開発に取りかかっているというが、どのように変化するのかについては語らなかった。

ChatGPTの対抗馬

Llama 2のリリースにより、メタがオープンソースAIの先駆者と呼べる存在になったことは間違いないが、Llama 2にはあまりオープンとは言えない部分もある。Llama 2の訓練に使われたデータについて、リリース時の仕様書には「一般に公開されているオンラインのソース」を使用したと書かれているが、メタはそれ以上の情報を明かそうとはしないのだ。

月間アクティブユーザー数が7億人以上いる企業がLlama 2を使用する場合は、個別にメタに申請してライセンスの合意を取らなくてはならない。これについての理由は明らかではないが、大手テック企業がLlama 2を使用したい場合の障壁となっている。

このほかLlamaでは、当たり障りのない内容のユーザーポリシーも定められている。そこでは、悪意のあるプログラムの生成や、暴力の助長、犯罪行為、虐待、ハラスメントを可能にする行為が禁じられている。もしこれらのポリシーが破られた場合はどのような措置をとるのかメタに尋ねたが、回答は得られなかった。

シアトルにあるMandora Venturesの投資家であるジョン・トゥロウは、メタが初代Llamaの流通を制限しようとしていたところから方針転換し、Llama 2をオープンソース化したことで、LLMを使ったクリエイティブな活動が盛んになるだろうと予想する。「デベロッパーや起業家たちは機転が利くので、Llama 2を使ってどんな面白いことができるのか、今後たくさんの発見をしていくでしょう」

トゥロウはメタによるLlama 2のリリースを、グーグルが2007年にアップルのiOSに対抗してAndroidをリリースしたことと並べて評している。メタが安くて性能のよい選択肢を提供することで、OpenAIなどが占有するAIシステムの対抗馬になるかもしれない。そしてこれがイノベーションを喚起すれば、メタのプロダクトやサービスの品質を向上するためのアイデアが生まれることにもつながるだろう。

Hugging FaceのAIリサーチャーであるネイサン・ランバートは、広く一般にリリースされたAIモデルのなかで、ChatGPTと同等の性能をもつものはLlama 2が初めてであると語る。Hugging Faceは生成AIモデルを含むオープンソースの機械学習ソフトウェアを提供しているスタートアップだ。

ランバートは、メタがその開発過程を明かしていないことを理由に、Llama 2は完全なオープンソースではないと語る。それでも、ソーシャルメディア上にLlama 2を使った数々のプロジェクトが投稿されているのを見たときは感動したという。数あるプロジェクトのうちのひとつであるAIシステム、WizardLMの最新バージョンは、ChatGPTに似て複雑な要望にも応えることができる。

現在Hugging Face上で人気を博している10のAIモデルのうち、多くはLlama 2をもとにつくられている。そのなかには会話形式のテキストを生成できるAIも含まれている。

「ひょっとするとLlama 2は、AI業界における今年最大のイベントかもしれないと思っています」とランバートは語る。ランバートによると、現状は非公開のAIモデルのほうが優れているが、バージョンアップを重ねていくうちにLlamaはそれらに追いつくはずだと語る。そして、そう遠くないうちに人々がChatGPTを使って実行するタスクのほとんどは、Llamaでも可能になるだろうという。

大手AI企業の占有は変わらない

Llama 2はリリースされたものの、ランバートはいくつかの疑問点が残されていることも指摘する。その理由のひとつは、トレーニングデータについての詳細が明かされていないことだ。そして、メタやグーグル、マイクロソフトやOpenAIなど、一部の大企業だけが先進的なLLMをつくることができるコンピューター設備と人材を占有している現状が続くかぎり、これらの疑問点は解消されないだろう。

ランバートは、自社のシステムを非公開にしたまま成功を収めたOpenAIの例があるものの、これからのLLMは透明性が重視される時代に突入すると信じている。最近ではホワイトハウスと大手AI企業7社との間で努力義務の合意が結ばれ、これにより各社はAIモデルをリリースする前に、それらが差別的な振る舞いをしないかどうか、社会や国防に悪影響を及ぼさないかどうか自主的にテストをしなければならなくなった。

こうした流れは、AIシステムの法的責任への疑問の声や、オープンソースのAIモデルを悪用する人たちを懸念する政治家による規制の動きによって停滞する可能性がある。

現在グーグルのAI開発を率いる、DeepMindの共同創業者で最高経営責任者(CEO)のデミス・ハサビスと同じく、トゥロウはグーグルから流出したメモの内容に異論を唱えている。つまり、グーグルやほかの大手AI企業の存在がオープンソースAIによって脅かされることはないということだ。トゥロウによると、データや人材、大量のコンピューターへのアクセスを有している事実が、大手テック企業の地位を守り続けると考えている。とはいえ、これらの企業が無敵というわけではない。

トゥロウはいま、スタートアップや研究者たちがLlama 2を使ってどのようなツールを開発するのか注意深く見ているという。おそらくは、初代Llamaのときと同じように、急速に改善が施されていくだろう。これにより、スタートアップはもちろん、AI業界全体の可能性が広がるはずだと、トゥロウは語る。「オープンソースは日に日に改善されていきます。そのうち勢力図が変わり、現在のリーダーたちが驚くような未来が訪れるかもしれません。何が起こるかは誰にもわからないのです」

WIRED US/Translation by Ryota Susaki/Edit by Mamiko Nakano)

※『WIRED』による人工知能(AI)の関連記事はこちら生成AIの関連記事はこちら


Related Articles
Collage of random letters, people racing on a track, and ribbons of color
メタのマーク・ザッカーバーグが新たなソーシャルメディア「Threads」をローンチした背景には、Xのデータが有料化で手に入りにくくなったタイミングで参入し、AI競争で巻き返しを図る思惑があるようだ。
Rumman Chowdhury with an AI-generated interpretation of her original portrait.
AIがわたしたちの生活や仕事のあり方を大きく変えようとしている。この物語の結末がハッピーエンドになるかディストピアになるかは、物語に関わる人々の手にかかっているのだ。AI業界の最前線に立って、AI技術がもつ倫理的・社会的影響を考える7人を紹介する。
article image
「ChatGPT」や「Bard」といった会話型AIが、わたしたちの日常に浸透してきた。それらの基盤となっている大規模言語モデル(LLM)の仕組みとは、どのようになっているのだろうか?

毎週のイベントに無料参加できる!
『WIRED』日本版のメンバーシップ会員 募集中!

次の10年を見通すためのインサイト(洞察)が詰まった選りすぐりのロングリード(長編記事)を、週替わりのテーマに合わせてお届けする会員サービス「WIRED SZ メンバーシップ」。毎週開催のイベントに無料で参加可能な刺激に満ちたサービス