
韓国IT大手ネイバーが、自社AIモデルに搭載して物議を醸していた中国製ビジョンエンコーダーを完全に排除する方針を固めた。今後は自社開発のビジョンエンコーダーをAIモデル全般に適用する。
今回の独自エンコーダー開発により、これまで指摘されてきた「フロムスクラッチ(独自開発)」を巡る論争の沈静化を図るとともに、韓国語と韓国文化への理解を強化したAIモデルを構築し、「ソブリンAI」戦略を加速させる狙いとみられる。
IT業界によると、ネイバークラウドは3月初めに独自ビジョンエンコーダーの開発を完了した。今後のマルチモーダルモデル全般への適用に向け、現在は内製化作業を進めている。
ビジョンエンコーダーは、画像や映像をAIが理解可能なデータに変換するモジュールで、テキストや音声とともに処理するマルチモーダルモデルにおいて、視覚認識の中核を担う技術だ。
新たに開発されたエンコーダーは、既存の自社技術「VUClip」より大幅に性能が向上したとされる。オープンソースで広く使われる中国の「Qwen(キューウェン)」など、世界的モデルと同水準の性能を持つと評価されている。
ネイバークラウドは2026年初め、政府主導のAI基盤モデル事業に参加した際、自社のオムニモーダルモデル「ハイパークローバXシード32Bシンク」に、中国アリババが開発した「Qwen 2.5」のビジョンエンコーダーをファインチューニングして搭載し、音声エンコーダーの重みもほぼそのまま使用していたとして批判を受けた。
このため、モデル開発を初期段階から独自技術で構築するという同事業の原則に反するとの指摘が出ていた。
ただし、すでにオープンソースとして公開されている「ハイパークローバXシード32Bシンク」に今回の独自エンコーダーを適用するかどうかは、現時点で決まっていない。
新エンコーダーは学習段階から韓国語ベースで訓練されており、翻訳を介さずに画像と韓国語を直接結び付けられる点が特徴だ。韓国の文化や文脈も的確に理解し、情報のゆがみを最小限に抑えるとしている。
(c)news1