NVIDIA、大規模データ分析およびマシンラーニング向けオープンソースGPUアクセラレーションプラットフォームのRAPIDSを公開

HPE、IBM、オラクル、オープンソースコミュニティ、スタートアップがRAPIDSを統合することにより、エンドツーエンドの予測データ分析のパフォーマンスを大幅に強化

 

 ドイツ、ミュンヘン——GTCヨーロッパ——2018年10月10日——NVIDIA は本日、データ分析およびマシンラーニング向けの GPU アクセラレーションプラットフォームを発表しました。業界をリードする企業に広く採用されることで、最大規模の企業でもかつてないスピードで大量のデータを分析し、正確なビジネス予測が可能になります。

 オープンソースソフトウェアの RAPIDS(TM)( http://www.rapids.ai/ )は、クレジットカード詐欺の予想や、小売り在庫の予測や顧客の購入行動を理解するなど、非常に複雑なビジネス課題に取り組むデータサイエンティストのパフォーマンスを大幅に向上させます。データ分析におけるGPUの重要性についての合意が進むのを反映して、DatabricksやAnacondaといったオープンソースコミュニティのパイオニアから、Hewlett Packard Enterprise や IBM( https://newsroom.ibm.com/2018-10-10-IBM-and-NVIDIA-Collaborate-to-Expand-Open-Source-Machine-Learning-Tools-for-Data-Scientists )、Oracle( https://www-sites.oracle.com/corporate/pressrelease/oracle-nvidia-bring-cloud-101018.html )などのテクノロジリーダー企業まで、多くの企業が RAPIDS を支持しています。

 データ分析やマシンラーニングのためにアナリストたちが 1 年間に 200 憶ドルをかけてサーバー市場を評価しています。これにより、科学的解析およびディープラーニングと合わせると、ハイパフォーマンスコンピューティング市場の価値はおよそ 360 憶ドルにまで押し上げられています。

 GPU テクノロジカンファレンスの基調講演で RAPIDS を紹介した NVIDIA の創業者/CEO の Jensen Huang(ジェンスン フアン)は次のように述べています。「データ分析およびマシンラーニングは、ハイパフォーマンスコンピューティング市場でこれまで加速されてこなかった最大の分野ですが、いま、その時がきています。世界中の巨大産業で、マシンラーニングによって書かれたアルゴリズムが膨大なサーバーの海で実行され、市場や環境の複雑なパターンを検知して、そこからはじき出される迅速かつ正確な予測は収益に直接的に影響しています」

 「CUDA およびそのグローバルエコシステム上に構築され、オープンソースコミュニティとの密な協働作業によって、RAPIDS の GPU アクセラレーションプラットフォームは生み出されました。世界で最も一般的なデータ分析ライブラリおよびワークフローとシームレスに統合することで、マシンラーニングをスピードアップします。これまでディープラーニングでやってきたように、マシンラーニングをターボチャージしています」

 RAPIDS は、GPU でアクセラレートした分析やマシンラーニングに、さらにデータ可視化にも、一連のオープンソースライブラリを提供します。NVIDIA のエンジニアが主要なオープンソース提供者としっかりと協力しあい、この 2 年間で開発してきました。

 サイエンティストが GPU 上でデータ分析パイプラインをすべて実行するために必要なツールとしては、これが初めてのものです。NVIDIA DGX-2(TM)システム( https://www.nvidia.com/ja-jp/data-center/dgx-2/#source=pr )でのトレーニング用に XGBoost マシンラーニングアルゴリズムを使用した初期の RAPIDS ベンチマークでは、CPU のみのシステムと比較して 50 倍もスピードアップしました。これにより、データサイエンティストはデータセットのサイズによって何日間もかかっていたトレーニング時間を数時間に、あるいは数時間を数分にまで、削減することができます。

 ※以下は添付リリースを参照

 

 

リリース本文中の「関連資料」は、こちらのURLからご覧ください。

添付リリース

http://release.nikkei.co.jp/attach_file/0492822_01.pdf