「人工知能(AI)で合成・変造された声を本当の声と区分するのは本当に難しいのか?」。こう問われた韓国最高検察庁のキム・ギョンファ音声分析室長(鑑定官・言語学博士)は次のように回答した。
「ディープフェイク・ボイス詐欺の電話が来たら……。検察職員ですら『いったん電話を切るしか方法がない』と言っていた」
キム室長は、2000年から最高検察庁音声分析室で勤務してきた音声分析の代表的専門家だ。音声分析室は、主に電話の声が実際の容疑者の声と同じなのか、録音ファイルが操作されたものなのかを調べるのが仕事だ。
「『国際音声信号処理学会』では、毎年、熟練度の高い専門の鑑定官が合成音探知チャレンジに参加する。でも、真偽の判別率はどんどん落ちている」
キム室長はこう危機感を示す。AI音声合成・変造技術が経歴20年以上の有名な専門家でも、素の耳では真偽をなかなか把握しにくい――これほど技術が発展しているというのだ。
◇数秒の音声と映像で偽の音声・映像
AI音声技術の発展自体が悪いわけではない。
韓国ネット大手ネイバーは、昨年、亡くなった両親の声で文を読む「お母さんの声をお願い」というキャンペーンを展開し、高い評判を得た。しかし、実際の声と区分が難しいAIの声が犯罪に悪用された場合は、社会に与える悪影響が大きい。
海外では、カネを狙ったディープフェイク・ボイス一味が、企業のCEO(最高経営責任者)の声を真似して巨額を横取りしたというニュースがたびたび報道された。韓国でもボイスフィッシング電話に出たという人は多く、いずれも息子や娘の声で電話が来たという経験談を語る。
検察によると、振り込め詐欺の被害額は昨年だけで5438億ウォン(1ウォン=約0.1円)に達している。まだ、ボイスフィッシング犯罪の音声はぎこちないが、今後「私がよく知っている人」の声に完全に変わってしまえば、どれだけ大きな被害が出るだろうか……。
キム室長は「政治家や芸能人の声を合成して、全く話していないことを実際に話したように流し、大衆を欺いた場合、社会的に大きな混乱が生じかねない」と警戒する。昨年は、AIが製作したウクライナのゼレンスキー大統領の「降伏宣言」映像が、ユーチューブ上で話題になった。
SNS上での数分、数秒分量の音声と映像を抜き出しても偽の音声と映像を作ることができる。有名人ではなく一般市民もディープフェイク・ボイス音声合成・変造によって、名誉毀損・虚偽事実流布のような事件で被害者になる可能性が高い――キム室長は危機感をあらわにする。
◇ディープフェイク規制に乗り出した中国
ディープフェイク技術の犯罪への悪用は今や世界的な問題だ。中国では主要国では初めて規制に乗り出した。
AFPなどによると、中国国家インターネット情報弁公室(CAC)は最近、「インターネット情報サービスディープ合成管理規定」を施行した。人工知能(AI)技術を利用して写真や映像、オーディオを合成するディープフェイク技術を利用し、虚偽情報を広めたり、犯罪に利用したりすることを防ぐのが狙いだ。
米紙ウォールストリート・ジャーナルによると、この規定は人工知能が作り出したコンテンツの使用を制限するものだ。ディープフェイク技術を利用してコンテンツを作る際には、技術を利用した事実を明示することを義務づけており、加工前の原本を追跡できるような表示を入れるようにした。
ディープフェイク技術で誰かのイメージや声を合成して編集しようとする際には、当事者の同意を得ることも必要だ。メディア報道で、ディープフェイク技術を使用する時は、政府が承認した原本だけを活用できるようにした。
米国や西欧からは「中国の今回の規制は多分に政治的な意図が反映された措置だ」との見方も出ている。AFPは「中国政府は、自国の潜在的脅威と見なされる技術をこれまでも速かに規制してきたし、今回の措置もその一環だ」と指摘した。
米国では、ディープフェイク規制が言論の自由を侵害しかねないという懸念があり、なかなか規制の動きは進んでいない。業者側も警戒を強めている。アマゾン、マイクロソフト、IBMは、個人情報保護を理由に2020年に開発したAI顔認識技術の米警察当局への提供を中断または撤回すると発表した。
欧州連合(EU)では、プラットフォーム企業に対し、ディープフェイク技術を利用した虚偽情報拡散に対処するよう勧告した。ただ、技術自体を禁止しているわけではない。
(つづく)
(c)MONEYTODAY