本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です
著者の岡野原大輔氏

 与えられたデータセットの分布に従ってデータを生成するように学習する生成モデルは、画像や音楽などデータを生成するためだけでなく、観測から現実の世界モデルを構築し、その上でエージェントが学習や計画を立てられるようにしたり、データの意味を捉えた特徴を教師なしで学習できるため、近年非常に注目を集めている。

 画像や音声など高次元データの生成モデルとしては大きく尤度ベースの手法と敵対的生成モデル(GAN:Generative Adversarial Network)を使った手法に分けられる。尤度ベースの手法はさらに、WaveNetなどの自己回帰モデル(Auto Regressive Model)、尤度の変分下限を最適化する変分自己符号化器(VAE:Variational AutoEncoder)、フローベースの生成モデルに分けられる。

この先は日経Robotics購読者限定です。