AIが生成した文章は判別できる? ポイントは「言葉選びの意外性」にあり

「ChatGPT」などのジェネレーティブAIの登場で、AIが生成した文章が身近になりつつある。それでは人間が書いた文章とAIが生成した文章は、どうすれば見分けられるのだろうか? 研究者たちによると、識別のポイントは「言葉選びの意外性」にあるようだ。
Illustration: James Marshall

会話型AI「ChatGPT」のようなジェネレーティブAIが生成した文章が、日常生活に影響を及ぼし始めた。例えば、教師たちはこのツールを授業に取り入れる方法を探っている。マーケティング担当者は、これがインターンに代わる存在になることを望んでいる。ミームの投稿者は熱狂している

記事を書くライターの立場からすると、仕事を人工知能(AI)に奪われる可能性についてまったく心配していないと言ったら嘘になる(幸いなことにChatGPTは、まだZoomに参加して誰かにインタビューすることはできない)。

ジェネレーティブAIのツールが一般公開されたことで、インターネットを閲覧している際にAIが生成したコンテンツに遭遇する機会が増えるだろう。そうしたコンテンツには、オンラインメディアの「BuzzFeed」がAIで自動生成したクイズのように無害なものもある(「読者の政治的な信条に合う揚げ菓子はどれか?」「民主党ならベニエ、共和党ならゼッポレ」)。一方で、外国政府による巧妙なプロパガンダのキャンペーンのように、より不穏なものに出合う可能性もあるだろう。

こうしたなか学術研究者たちは、文章がChatGPTのようなプログラムによって生成されたものかどうかを検出する方法を調査している。あなたが読んでいる文章がAIの手を借りてつくられたものであるという決定的な指標は、現時点においてどのようなものだろうか。それは「意外性のなさ」だ。

AIが生成した文章を判別するツールも登場

自然な文章のパターンをまねる能力をもつアルゴリズムは、あなたが思っているより何年も前から存在している。ハーバード大学とマサチューセッツ工科大学(MIT)、IBMの共同研究機関である「MIT–IBM Watson AIラボ」が実験的なツールを開発し、文章をスキャンしてランダム性の度合いに基づいて単語を強調できるようにしたのは2019年のことだ。

この技術が、どのように役に立つのだろうか。AIで文章を生成するツールは、基本的にパターンを検出する神秘的なマシンである。まねることには長けているが、変化球を投げることは苦手なのだ。確かに上司にメールを送るときや、友人たちの参加するグループにメッセージを送るときの口調や調子は予測可能なものに感じるかもしれない。だが、人間のコミュニケーションには気まぐれな性質が備わっている。

プリンストン大学の学生であるエドワード・ティアンが教育者向けに「GPTZero」という同様の実験的なツールを発表し、話題になったのは23年の初めのことだ。「GPTZero」は、あるコンテンツがChatGPTによって生成された可能性を文章の「perplexity(意外性)」(ランダム性とも言える)と「burstiness(集中性)」(ばらつきとも言える)に基づいて測定するツールである。

ChatGPTの開発元であるOpenAIも、1,000文字以上の文章をスキャンすることで、それが生成された文章かどうか判定する別のツールを公開している。同社は誤検知や英語以外の言語での効果の限度など、このツールの限界についても率直に説明している。AIによる文章生成ツールの開発者が英語のデータを優先することが多いように、AIが生成した文章の検出ツールの大部分も、いまのところ英語を話す人に最も有用なものになっているのだ。

それでは、あるニュース記事が少なくとも部分的にAIによって生成されたものかどうかを判別することはできるのだろうか。「AIが生成した文章は、あなたのジャーナリストとしての仕事の精度には決して及びません」と、プリンストン大学のティアンは言う。優しい配慮に満ちた発言である。

テック系ニュースサイトの「CNET」は、アルゴリズムが書いた文章を人間が完成させるかたちで作成した複数の記事を掲載している。いまのところChatGPTの文章は、ある種の厚かましさに欠けており、“幻覚”を見ることがあるので、正確性が求められる報道で使用するには問題があるだろう。有能なジャーナリストはサイケデリックな感覚になるものは勤務時間外まで“お預け”にしていることを、誰もが知っている。

自然言語処理が進化すれば判別が困難に?

こうした検出ツールはいまのところ役に立っているものの、自然言語処理が洗練されるにつれ将来的には効果が薄れることになると、メリーランド大学の情報科学の教授であるトム・ゴールドスタインは考えている。

「この種の検出ツールは、人間の文章と機械の文章には系統的な違いがあるという点に依存しています」と、ゴールドスタインは指摘する。「しかし、こうしたツールの提供企業の目標は、機械の生成する文章をできる限り人間の書いた文章に近づけることにあります」

これが機械が生成したコンテンツの検出において、すべての希望が失われたことを意味するかというと、そうではない。AIの文章生成ツールの元になっている大規模な言語モデルに電子透かしを組み込む方法について、このほど公開された論文の研究にゴールドスタインは携わっている。これは絶対に確実な方法ではないものの、魅力的な手法だ。

ChatGPTは文章で次に出てきそうな単語を予測し、その過程で複数の選択肢を比較することをご存じだろうか。そこに電子透かしを加えることで、AIの文章生成ツールで特定の単語のパターンを使用できなくすることができる。そしてある文章をスキャンし、電子透かしのルールが何度も破られているなら、その“名作”の作者は人間である可能性が高いと判断できるというわけだ。

この電子透かしによる手法が実際に意図通りに機能するかどうかについて、ジョージタウン大学の安全保障・先端技術研究センター(CSET)のリサーチアナリストであるミカ・ムッサーは、懐疑的な見方を示している。悪用者は、電子透かしの組み込まれていないAIの文章生成ツールを手に入れて使おうとするのではないだろうか。

ムッサーは、AIによるプロパガンダに対抗するための緩和策について論文で示された研究に携わっている。この研究には、OpenAIとスタンフォード大学インターネット観測所も参加し、悪用される潜在的な方法と検出の機会における主要な例を挙げている。

機械が生成した文章の検出に関するこの論文の中核的なアイデアのひとつは、メタ・プラットフォームズが20年に実施したAIによる生成画像の検出に関する調査に基づいている。その方法は、担当者によるモデルの変更に頼るのではなく、開発者やコンテンツのパブリッシャーがオンラインのデータに数滴の“毒”を混ぜ込み、AIモデルが訓練する巨大なデータセットの一部として集められるまで待つというものだ。そしてモデルの出力から、学習に使われた“毒”入りのコンテンツの痕跡を探し出すのである。

悪用を避ける最善の方法は、そもそもそのような大規模な言語モデルをつくらないことであると、この調査結果は認めている。しかし、それでもそのような手法をとる場合、AIが生成した文章の検出には特有の問題があるとして、次のように指摘している。

「放射性[編註:X線検査で使う放射性マーカーのようにモデルの精度に影響を与えずに追跡できるようにするという意味で名付けられた]の学習データを用いても、機械が生成した文章の検出は、機械が生成した画像や動画コンテンツの検出よりはるかに困難なままである可能性が高いだろう」

つまり、 “放射性データ”を用いる手法は、画像の組み合わせから単語の組み合わせに転用することが難しいのだ。画像は大量のピクセルで構成されているが、ツイートにはたった5つの単語しか含まれていないかもしれない。

それでは人間が書いた文章には、どのような固有の特徴が残っているのだろうか。言語モデルは英語を流暢に話しているように見えても意図に欠けていることを、ワシントン大学教授でアレン人工知能研究所のNPL研究員であるノア・スミスは指摘する。

「これは人々を混乱させるものだと思います」と、スミスは言う。「ほかの要素なしに流暢に話すということがどういうことなのか、これまで考えてきませんでした。しかし、いまそれがどういうことなのかわかったのです」

将来的には、あるコンテンツが「生成されたもの」であるかどうかを判断する際に、新しいツールに頼らなければならなくなるかもしれない。しかし、ロボットのように書かないためのアドバイスは変わらない。定型的な表現をやめ、意外性のあるものにすることだ。

WIRED US/Translation by Nozomi Okuma)

※『WIRED』によるChatGPTの関連記事はこちら


Related Articles
String and push pins forming a speech bubble shape
会話型AI「ChatGPT」を生み出したOpenAIは、ジェネレーティブAIの新モデル「GPT-4」を2023年3月14日(米国時間)に発表した。テキスト入力のほかにも画像入力に対応するなど大きく進化したが、いまだに偏りのある情報が生成される可能性があるなど信頼できるレベルには達していない。
Two nearly identical cube prisms on a red background except one cube has a bright blue lens flare beaming off of it; spot the difference concept
ジェネレーティブAIを用いた画像生成が広がるなか、その倫理的な利用法についてはクリエイターの間でも意見が分かれている。ひとつだけはっきりしていることは、AIが生成したアートの識別は今後さらに難しくなるということだ。
3D render of pastel colored Mechanical Keyboard
マーケティング用コンテンツの見出しや本文をウェブ用に作成する際に、文章を自動生成するAIツールを利用する動きが出始めた。滑らかな文章を生成できるのみならず、Googleの検索結果で上位に表示されるよう内容が最適化される点も支持されているが、その乱用を危惧する声も上がっている。

次の10年を見通す洞察力を手に入れる!
『WIRED』日本版のメンバーシップ会員 募集中!

次の10年を見通すためのインサイト(洞察)が詰まった選りすぐりのロングリード(長編記事)を、週替わりのテーマに合わせてお届けする会員サービス「WIRED SZ メンバーシップ」。無料で参加できるイベントも用意される刺激に満ちたサービスは、無料トライアルを実施中!詳細はこちら