プリファード・ネットワークス(PFN)は、深層学習(Deep Learning)向けの専用SoC(System on Chip)「MN-Core」とそれを実装したアクセラレーターボードを開発し、開催中の半導体関連の展示会「SEMICON Japan 2018」に参考出展した(PFNの関連ページ)。2020年春ごろの実用化を想定する。

[画像のクリックで拡大表示]
MN-Coreに用いたダイとそのウエハー

演算性能はGoogleの1.5倍、Huaweiの2倍超

 MN-Coreは、深層学習向け行列演算器(MAU)1個とプロセッサーエレメント4個を1ブロック(Matrix Arithmetic Block:MAB)として、そのMABを512ブロック集積したダイを4個、ファンアウト型パッケージで1つのSoCにパッケージ化したもの。チップ1個は、台湾TSMCの12nm世代プロセスを採用しながら32.2mm×23.5mmと巨大。それを4個用いて作製したSoCは85mm角とさらに巨大である。

[画像のクリックで拡大表示]
MN-Coreのチップレイアウト
チップ1個には、行列演算器(MAU)1個とPE4個からなるブロック(MAB)を512個集積している。(図:PFNのWebページより)

[画像のクリックで拡大表示]
ダイを4個、1パッケージにしたSoC「MN-Core」
寸法は85mm×85mm。ダイに刻印されている「GRAPE」は、このチップの設計などを主導した神戸大学 教授の牧野淳一郎氏が手掛けてきた重力多体問題専用ICのシリーズ名

 演算性能は倍精度(64ビット)の浮動小数点演算で32.8TFLOPS、単精度(32ビット)では131TFLOPS、半精度(16ビット)では524TFLOPS。2018年5月に米グーグル(Google)が開発中であることを明らかにした同様な専用SoC「TPU version 3」が半精度で360TFLOPS、同年10月に中国ファーウエイテクノロジーズ(Huawei Technologies)が発表した専用SoCが、TSMC 7nm世代という最先端プロセスを使って半精度で256TFLOPSであることと比べても、演算性能の高さが目立つ。

独自ヒートシンクで500Wの熱に対処

 1W当たりの演算性能も半精度で約1TFLOPS/Wと、上記の競合メーカーと肩を並べる。ただ、演算性能自体が高いことで消費電力は500Wと小型電気ストーブ並みに大きい。この熱対策として、PFNはヒートシンクを独自開発し、アクセラレーターボードに実装した。ちなみに、GoogleはTPU version 3で液体冷却システムを採用する方針だ。

[画像のクリックで拡大表示]
MN-Coreを搭載したアクセラレーターボード「MN-Core Board」
MN-Coreの周囲にあるICは、DRAM。計32Gバイト分だという。

 PFNは2017年に、米エヌビディア(NVIDIA)のグラフィックス処理プロセッサー(GPU)をアクセラレーターとして用いた「プライベート・スーパーコンピューター『MN-1』」を開発。2017年11月のスーパーコンピューターのランキング「TOP 500」で、世界91位(国内13位、産業領域では世界12位)の性能を示した。次いで、その次世代版となるMN-2も開発中だとする。

この先は有料会員の登録が必要です。有料会員(月額プラン)は登録月無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関するFAQはこちら