「米画家アンディ・ウォーホル(Andy Warhol、1928~87)スタイルで、この絵をもう一度描いて」。こうした注文を理解する人工知能(AI)が登場した。
下の絵は順に、AIが文章の入力を受けて生成した▽本物の写真のようなスタイル▽アンディ・ウォーホルのスタイル▽宇宙飛行士が馬に乗った姿を鉛筆で描いたイメージ――だ。
米国のAI研究所「オープンAI(OpenAI)」はこのほど、「自然語処理イメージ生成人工知能システム」の「ダル-E2(DALL-E2)」を公式サイトで公開した。
オープンAIは、3000億個のデータ(トークン)と、内部演算に1750億個の媒介変数を利用したGPTー3を開発するなど、自然語処理人工知能分野の先頭グループを走っている。
「ダル-E2」は、人が絵を言語で描写すれば、それを分析して、適したイメージを生成する人工知能。「ダル-E2」は、絵の主体、行動、スタイル(画風)に従った絵を描くことができる。例えば「宇宙飛行士が馬に乗っている本物の写真のような絵」というと、上の絵のように、その指示に沿った絵を生成する。
また「ダル-E2」は、従来のイメージをもとに何かを合成する際、周辺の画風に合わせて新しいイメージを合成することも可能だ。例えば、下のように同じイメージでも、どこに合成するか、という指示によって、子犬の描き方をそれぞれ変化させて生成している。
以下は順に、元画像、文脈に合わせて1番、2番、3番の位置に、子犬を合成したものだ。
オープンAIは「ダル-E2はイメージと、イメージを説明するために使用されるテキストの関係を学習した。2021年に公開したダルに比べ、より正確で解像度の高いイメージを作り出す」と説明した。
©news1