IBISMLメーリングリストの皆様
エヌビディアの永田と申します。
先日当社は、データ処理、分析、機械学習ワークロードをEnd-to-EndでGPUにより高速化する
新しいオープンプラットフォーム「RAPIDS」を発表しました。
このプラットフォームは、pandasやscikit-learnといった広く利用されているライブラリのI/Fに関する
互換性を極力保ちつつ、GPUによる高速化の恩恵を享受できるよう設計されています。
さらに、Apache Arrowに基づくデータ構造により、複数言語のツール間での相互運用を可能とする
ことも目指しています。

<RAPIDS主要ライブラリ>
「CuDF」
pandasの高速な代替として利用可能なデータのロード、フィルタリング、集計、操作などの処理
GPUで高速化するPython向けライブラリ
「CuML」
Scikit-learnの代替的に利用可能なGPUで高速化された機械学習ライブラリ。
現時点ではXGBoost, Kalman filter, K-means, kNN, DBSCAN, PCA, tSVDアルゴリズムが
実装されており、今後継続して実装を増やす計画。
<動作環境>
Pascalアーキテクチャ以上のGPU、CUDA Toolkit 9.2/10で動作。対応OSは
Ubuntu 16.04/18.04 LTS、対応DockerはDocker CE v18、nvidia-docker v2
※サンプルプロジェクトを含むDockerコンテナを公開しており、こちらから利用可能。
https://rapids.ai/documentation.html
<ベンチマーク>
XGBoostを利用したRAPIDSのベンチマークでは、NVIDIA DGX-2(16基のTesla V100 (32GB)搭載サーバ)で、
CPUのみのシステムと比較した場合に50倍の性能差が見られました(詳細は下記資料)
<追加情報>
RAPIDS概要資料はこちら(SNS等シェア歓迎)
日本語 https://www.slideshare.net/NVIDIAJapan/rapids-120510206
英語 https://www.slideshare.net/NVIDIAJapan/rapids-overview
当社のCEO ジェンスンファンがGTC EUのkeynoteの中でRAPIDSについて語っています(45分頃から)
よろしければ併せてご覧ください。
https://www.youtube.com/watch?v=G1kx_7NJJGA
<ご意見・ご要望・ご質問をお待ちしています>
RAPIDSをより活用していただくため、皆様からのご意見・ご質問・ご要望をいただけたら幸いです。
下記担当までお気軽にご連絡ください。
永田 聡美
エヌビディア合同会社 エンタープライズ事業部 研究機関・高等教育機関担当