Stable Diffusionの仕組みとは?拡散モデルとは?

画像生成AI

2023.09.08

Stable Diffusionの仕組みとは?拡散モデルとは?について紹介します。

Stable Diffusionとは
拡散モデルとは
関連ページ

Stable Diffusionとは

Stable Diffusionは、2022年8月に公開された画像生成AI(画像を生成する学習済みモデル)です。
オープンソースで公開され、画像生成のレベルが高く、比較的軽量で、少ないメモリ量のGPUでも手軽に動かすことができます。
(勿論、ハイスペックなGPUの方が高速に画像生成できます)

また、オープンソースで開発されているため、様々なカスタマイズ等が可能であったりと、最も人気な画像生成AIとなっています。

拡散モデルとは

Stable Diffusionの重要な技術キーワードとして「拡散モデル」が挙げられます。
「拡散モデル」は「元画像にノイズを加え、ノイズ入りの画像からノイズを取り除く訓練」を繰り返すことで学習し、画像生成AI(学習済みモデル)を作成します。
これにより、画像生成AI(学習済みモデル)は全く無意味なノイズからでも、テキスト指示に従って「存在しない元画像」を推測できるようになります。

画像生成は「step(ステップ)」と呼ばれる段階を踏んで行われます。
無意味なノイズから「存在しない元画像」を推測する過程を１ステップ、２ステップと繰り返し、鮮明で高画質な画像を生成します。
Stable Diffusionでは、ステップ数を設定でき、ステップ数を増やすほどより鮮明で高画質な画像ができあがります(ステップ数が大きいほど時間もかかりますが)。