思い描いた画像をAIに生成させるには?

「砂嵐」から生まれる画像の秘密
画像生成AIは、ランダムなノイズ画像を元に、少しずつ加工を加えながら目的の画像へと変化させています。例えば「猫の画像を作れ」と指示すると、AIはノイズ画像を猫の形に変えていくのです。同じAIに同じ指示をしても、出来上がる画像は毎回微妙に異なります。その理由は、最初に入力するノイズ画像がランダムに生成されるためです。同じ指示を出しても、異なるノイズが元になることで結果が変わるわけです。この特性があるため、完全に思い通りの画像を作るのは難しく、より自由にコントロールできる技術が求められています。
ユーザーの好みを学ぶ新たな方法
こうした課題を解決するために、ユーザーの好みに合わせた画像を生成させる方法が研究されています。従来の方法では、テキストで細かく指示を出す必要がありましたが、専門的な知識がないと扱いが難しく、理想の画像を作るには試行錯誤が必要でした。
そこで、ユーザーが「与えられた二つの画像のどちらが好みか」の評価を繰り返すだけで、AIが好みを学習し、より望ましい画像を作り出す仕組みが開発されました。これは「ブラックボックス最適化」と呼ばれる技術を応用したもので、AI自身に学習し直させるのではなく、画像生成の元となるノイズを調整することで、理想の画像に近づけるというものです。この手法を使えば、高性能な計算機を使わなくても、好みの画像を効率的に生成することが可能になります。
画像生成技術から広がる可能性
この技術は、画像だけでなく、音楽や音声の分野にも応用できると考えられています。実は、画像生成AIと音楽や音声を作るAIは、ほぼ同じ仕組みで動作しているからです。同じ技術を使うことで、音楽やナレーションをより好みに合ったものに調整したり、より自然で魅力的な声を作ったりもできるかもしれません。今後は、さらに多くのユーザーの評価を取り入れて、より高精度な生成技術へと発展していくことが期待されています。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。
先生情報 / 大学情報
