生成モデル

「仕組み」について具体的な記述ができていないので、後日対応します

1.VAE(Variational Autoencoder)

 ディープラーニングを活用した画像生成モデル
   AIの学習用データから特徴を学び取り、
   その特徴をもとに「学習用データと似ている新しいコンテンツ」を
   生成する

VAEモデル


 処理概要
   ユーザーが学習用のデータをAIに与える
   AIが与えられた学習用のデータから特徴を学ぶ
   AIが学習したデータの特徴から、全く新しいコンテンツを生成する
   生成したコンテンツをユーザーに提供する

 利用上の特徴
   特定の傾向を持つ複数の作品を学習し、その作風に近い作品を生み出す
     画家の作品を学ばせ、画家の特徴を持った新しい絵を生み出す

   複雑性の高い画像の特徴を捉え、構造が複雑な製品の異常検知

2.GAN(Generative Adversarial Networks)

 ディープラーニングを活用した画像生成モデル
   Generator(ランダムに作成されたデータ)
   Discriminator(学習用の正しいデータ)
   2つのネットワークを競わせながら学習し、精度の高い画像を生成する

GANモデル

 処理概要
   ランダムなノイズからGeneratorを生成する
   正しいデータである「Discriminator」を用意する
   GeneratorとDiscriminatorを比較して、Generatorが本物かどうか判定する
   1~3を繰り返し、Generatorの精度を高める
   十分に精度の高まった画像を出力する

 利用上の特徴
   解像度の低い画像から解像度の高い画像を生成する
   テキスト入力で全く新しい画像を生成する

3.拡散モデル

 学習用の画像にノイズを追加し、画像からノイズを除去し、元画像を復元する
   与えた画像にノイズを付加し、元の画像を復元することを繰り返す

   「Stable Diffusion」や「DALL-E2」などに採用されている

拡散モデル

 処理概要
    学習用の画像にノイズを付加する
    ノイズが付加された学習用の画像から、ノイズを除去する
    2を繰り返し、元の画像を復元する
    1~3の仕組みを繰り返して、高精度な画像を生成する

 利用上の特徴
   GANよりもさらに高解像度な画像を生成する

4.GPT-3

 OpenAIが開発した言語モデル
   約45TBもの膨大なテキストデータを学習し、
     ある単語の次に記述される別の単語の候補を高精度で予測する

GPTー3

 処理概要
   ユーザーがテキストボックスに質問を記述し、入力・送信する
   AIは質問の内容を解析して、最適な回答を導き出す
   AIは回答を出力し、ユーザーに伝える

 利用上の特徴
   長文の要約やリサーチ時間の短縮化
   新たなアイデアの創出