2025 年 6月 25日 (水)
ホーム経済IT/メタバースAI偽コメントを98.5%の精度で検出する「XDAC」…世論操作に立ち向かう韓国の新技術

AI偽コメントを98.5%の精度で検出する「XDAC」…世論操作に立ち向かう韓国の新技術

コメント検出技術を開発した(左から)KAISTのキム・ヨンデ教授、国家保安研究所のコ・ウヨン主任研究員、成均館大学のキム・ヒョンシク教授、KAISTのオ・ヘヨン教授(c)KOREA WAVE

韓国・国家保安研究所(国保研)とKAIST電気電子工学部のキム・ヨンデ教授の研究チームは23日、韓国語のAI生成コメントを検出するプラットフォーム「XDAC」を開発したと明らかにした。生成型人工知能(AI)を悪用した「偽コメント」を98.5%の精度で検出する技術で、こうしたAIコメントを作成した大規模言語モデル(LLM)まで特定可能だ。悪質なコメント投稿者に対する警告となりそうだ。

これまで生成型AI技術を悪用したオンライン世論操作が社会的な懸念となっていた。AI生成文の検出技術は公開されていたが、その多くは英語の長文かつ定型的な文章を基にしている。平均51文字と短く、口語表現の多い韓国語のニュースコメントに適用するには限界があった。

特に生成型AIは、最近ではニュース記事の文脈に合わせて感情や論調まで調整し、わずか数時間で数十万件のコメントを自動生成する水準に達しており、世論操作など社会的な懸念が大きかった。

◇OpenAIならコメント20万件作成に20万ウォン

実際、OpenAIのGPT-4o APIを基準とすると、コメント1件の生成コストは約1ウォン(約0.1円)だ。韓国の主要ニュースプラットフォームでの1日平均コメント数である20万件を生成するのに、わずか20万ウォン(約2万円)で済む。

国家保安研究所のコ・ウヨン研究員は「公開されたLLMは、自前のGPUインフラさえ整えれば、事実上無料でも大量のコメント生成が可能だ」と説明する。

研究チームはまず、AI生成コメントと人間が書いたコメントを、人が区別できるかどうか実験した。合計210件のコメントを評価した結果、AI生成コメントの67%を人間が書いたものと誤認した。実際の人間のコメントについても、73%しか正確に区別できなかった。

コ・ウヨン研究員は「今や人間でさえAI生成コメントを正確に見分けるのが難しいレベルに達している。AI生成コメントは、人間のコメントと比較して記事の文脈との関連性(95% vs 87%)、文章の流暢さ(71% vs 45%)、バイアス認識(33% vs 50%)の点で、むしろより高い評価を受けた」と補足した。

また、従来のAI生成文検出技術は、ほとんどが英語の長文で定型化された文章を基に開発されており、韓国語の短いコメントには適用が困難という欠点がある。

短いコメントは統計的特徴が不十分であり、絵文字・俗語・繰り返し文字など非定型の口語表現が多いため、従来の検出モデルは効果的に機能しない。

さらに、現実的な韓国語AI生成コメントのデータセットが不足しており、従来の単純なプロンプト方式では多様で実用的なコメント生成に限界があると研究チームは指摘した。

研究チームは、14種の多様なLLM活用、自然さの強化、細やかな感情制御、参考資料を通じた拡張生成の4つの戦略を適用したAIコメント生成フレームワーク「XDAC」を開発した。

また、ユーザースタイルを模倣した韓国語AI生成コメントのデータセットを構築し、その一部をベンチマークデータセットとして公開した。さらに説明可能なAI(XAI)技術を適用して言語表現を精密に分析した結果、AI生成コメントには人間とは異なる独自の話し方パターンがあることが確認された。

たとえば、AIは「~のようだ」「~について」など形式的な表現と、接続詞の使用率が高い傾向がある。一方で、人間は繰り返し文字、感情表現、改行、特殊記号など自由な口語表現を好んで使用する。

特殊文字の使用でも、AIは世界的に通用する標準化された絵文字を主に使うのに対し、人間は韓国語の子音や特殊記号といった文化的特性を含む多様な文字を活用する。

特に、フォーマット文字(改行や複数スペースなど)の使用では、人間のコメントの26%がこれを含んでいたが、AI生成コメントではわずか1%にとどまった。繰り返し文字の使用率も、人間のコメントは52%で、AI生成コメント(12%)よりはるかに高かった。

コ・ウヨン主任研究員は「今回開発した『XDAC』は、こうした違いを精密に反映して検出性能を高めた。改行や空白といったフォーマット文字を変換し、繰り返し文字パターンを機械が理解できるようにする方式が適用された」と語った。

◇LLM特有の話し方の特徴を把握

コ・ウヨン主任研究員はまた、「14種の各LLMに固有の話し方の特徴を把握することで、どのAIモデルがコメントを生成したのかも識別できるように設計されている」と指摘した。

研究チームはこのような設計により、AI生成コメントの検出では98.5%という精度を達成し、従来の研究と比較して性能が68%向上した。コメントを生成したLLMの識別においては84.3%の性能を記録した。

研究チームは「XDAC」の検出技術は単なる判別を超え、心理的抑止装置としても機能する可能性があると補足した。飲酒検問、薬物検査、防犯カメラの設置などが犯罪抑止効果を発揮するように、精密な検出技術の存在そのものがAIの悪用を試みる動機を減らすことが期待される。

(c)KOREA WAVE

RELATED ARTICLES

Most Popular