2024 年 7月 12日 (金)
ホーム経済IT/メタバースAIと会話しながら絵、映像まで作る…GPT-4.0どこまで

AIと会話しながら絵、映像まで作る…GPT-4.0どこまで

ビジュアルチャットGPTの使用例(写真=Microsoft Research Asiaギットハブキャプチャー)(c)MONEYTODAY

米オープンAI社が近く超巨大AI言語モデルGPTの次のシリーズであるGPT-4.0を公開する。マイクロソフト(MS)ドイツ法人最高技術責任者(CTO)アンドレアス・ブラウンは10日、GPT-4発売が迫っていると明らかにした。MSはまだ公式の立場を示していないが、ブラウンCTOの発言を訂正してもいない状態だ。

GPT-4.0は一つのモデルが自然言語からイメージ・音声など多様な形態のコンテンツを入力・生産できるマルチモーダル(Multimodal)形態をとる。

これまで言語モデルはGPT、イメージモデルはダリ(Dall-e2)など、希望する結果によってAIモデルが違っていたが、これからは1カ所で一括処理できる。

マルチモーダル超巨大AIモデル(MLM)はAI産業のもう一つのターニングポイントになる。

フューチャープランニング研究所のキム・イェウン所長は「GPT-4.0は一つのモデルでテキストだけでなくイメージなどすべてのサービスができる」と説明した。

業界はマルチモーダルAIモデルが最近公開された「ビジュアルチャットGPT」と類似した方式だと見ている。

ビジュアルチャットGPTは「MSリサーチアジア」が公開したイメージ生成AIサービスで、AIと対話しながらイメージを生成・変更することが可能だ。画像を説明するテキストを抽出することもできる。

(c)MONEYTODAY

RELATED ARTICLES

Most Popular