本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です
著者の岡野原大輔氏
著者の岡野原大輔氏

 深層学習は学習に時間がかかることで有名である。データやモデルにももちろんよるが、学習に数日、数カ月といった単位の期間が必要になることも稀ではない。この学習を高速化することは研究開発の競争力に直結する。

 新しいアイデアを試してその結果が出るのに1週間以上かかる場合と、それが1時間で終わる場合では、試行錯誤の回数や仕方が大きく変わってくる。また、高速化によって、より大きな学習データセット、大きなモデルを使えるようになる。

 深層学習の学習にどれだけ時間がかかるのか感覚を掴んでもらうために、いくつか例をみてみよう。深層学習のチュートリアルで最初に取り上げられるMNISTデータセットの画像分類の学習から始める。MNISTの学習データは5万枚の28×28の白黒画像の手書き文字からなる。これを3層から成る多層パーセプトロンを使って学習する場合を考える。中間層に100個のニューロンを使った場合、ネットワーク全体で10万弱のパラメータから成る。

この先は日経Robotics購読者限定です。