韓国の大手IT企業ネイバーは27日、会話型AIサービス「ClovaX」のアップデートで、画像解析・推論機能を追加した。ClovaXは写真やグラフの解釈、数学問題の解決など、従来のテキストベースの回答機能を超えた多様な機能を持つようになった。
これにより、ClovaXは単なるテキストの処理を超えて、ユーザーがアップロードした画像から情報を読み取り、詩を作成するなどの高度な創作活動も可能となった。また、日常的な写真の解析から、複雑なデータやチャートの分析まで、多岐にわたる視覚的処理能力を持つことになる。
例えば、子どもが羊に餌を与えている写真を投稿すると、ClovaXは「子どもが羊に餌を与えています。青い背景に動物の絵が描かれた服を着て、縞模様の帽子をかぶっています」といった詳細な説明を生成する。また、食材の写真を投稿すると、その材料を使った料理のレシピを提案する機能も備えている。
ネイバーはClovaXの新機能について、Googleの「Gemini」やOpenAIの「GPT-4o」、Anthropicの「Claude 3.5 Sonnet」など、他のグローバル大手のAIチャットボットに匹敵する性能を備えていると強調している。これらの企業もすでに画像や音声、テキストを同時に処理するマルチモーダルAIを展開しているが、ネイバーはその技術力に自信を示している。
特に、ClovaXが国内の検定試験において、問題を画像形式で入力して解答させた結果、約84%の正答率を記録したと発表しており、これはOpenAIの「GPT-4o」を上回る成績だとしている。ネイバーはこれにより、ClovaXが今後さらに個人の生産性向上ツールとしての利用範囲が拡大し、論理的な文章作成やコード作成、翻訳などの分野でも積極的に活用されると期待している。
(c)NEWSIS