深層学習とNVIDIA DGX-2で 技術とビジネスの高みを目指す
Ridge-i 様
ディープラーニングなどのAI技術を幅広い分野で活用するRidge-iは、顧客が満足するソリューションの提供を目指している。革新的な高性能でその実現をサポートするとともに、新たな可能性を切り開くのが「NVIDIA DGX-2」だ。
ディープラーニング(深層学習)や機械学習などのAI 技術を中心とした“最高峰”の先端技術を活用し、クライアントが求めるビジネスの“最高峰”をともに目指す株式会社Ridge-i。社名にある「Ridge」は「峰・山の背・尾根」などを意味するが、“最高峰”を目指す様々な想いがぶつかり合って生まれるRidgeを登りきること「クライアントの望みを叶える、革新的なソリューションが生み出せる」と、株式会社Ridge-iを立ち上げた代表取締役社長の柳原尚史様は社名の由来を説明する。「技術的な高みを目指すエンジニアは、ときにビジネス的な視点を疎かにしがちです。一方で、ビジネス寄りの経営層などは技術的なブレイクスルーの実現やそのインパクトを軽視しがちな面もあるでしょう。そういった背景から、技術的な高みを目指す人とビジネス的な高みを目指す人が切磋琢磨しながらぶつかり合って生まれてくるソリューションを提供したい。そんなイメージも、“Ridge”には込められています」(柳原様)さらに、Ridgeの後ろに付いている「i」は、単純に考えるとAIの「intelligence」を想像しがちだ。しかし、実はプログラムで繰り返しを指示す「FORLOOP」文で使用されるループカウンター「i」をイメージしたとのこと。1つのRidgeを登りきることで、次に登るべき新たなRidgeが見えてくることから、「繰り返しでRidgeを登り続ける」という柳原様の強い信念や意気込みが隠されている。
金融よりも他の分野で活用した方が面白い!
カスタムメイドで顧客が求めるクオリティを目指す
これまでにRidge-iは、ディープラーニングを活用して「ごみ焼却工場でのAI活用(セグメンテーション)」や「外観検査・キズ・不良箇所検出」、「衛星データ(SAR)によるオイル流出検出」、「白黒画像のカラー化」などのプロジェクトを手掛けてきた。市場としても、最近はこれまで以上にAIやディープラーニングに関心を示す企業が増えており、プロジェクトの依頼やAIなどに関する相談が増加傾向にあるほか、プロジェクト自体の規模も拡大しているそうだ。そういった状況にあって、柳原氏が重視するのは、単にディープラーニングを利用したソリューションを提供するのではなく、ビジネスの視点から「顧客の要望を可能な限り叶える」ようなソリューションを提供するという点だ。
「マーケティングの面から見ると、汎用的なシステムを広範囲に提供する方が効率はいいでしょう。しかし、ディープラーニング自体がまだ黎明期ということもあり、カスタムメイドでなければビジネスで求められる高いクオリティは出せません。実際、汎用的なシステムで画像の認識・分類を試みたこともありましたが、顧客の満足度は決して高いものではありませんでした。まさに『多目的は無目的』なのです」(柳原氏) 拡大する市場とともに、質の高いカスタムメイドに対応すべく、Ridge-iではこれまで各エンジニアそれぞれにGeForce GTX 1080 Ti×2基のGPUコンピューティング環境を提供するとともに、共用としてGeForce GTX 1080 Ti×4基を搭載するサーバー×2台を用意してきた。しかし、その環境も去年の時点ですでにオーバーフロー気味。性能の高い共用サーバーが取り合いになる状況で「余裕を持って作業ができているとは言えませんでした」とRidge-iエンジニアの阿部大志氏は当時を振り返る。
さらに、近年は扱う画像枚数が増加し、高解像度画像や動画の需要も増えていることから、ハイスペックな環境があるに越したことはない。また、Ridge-iではディープラーニングに関する新しい論文や文献が掲載されるとその実装と再現を試みるが、現在の環境では計算リソースの制約によって実現できないケースも出始めてきた。状況的に「GeForce GTX 1080 Tiの環境では力不足が否めなかった」(阿部氏)ことから、NVIDIA Tesla V100を16枚搭載する「NVIDIA DGX-2」を2018年12月に導入することとなった。
処理能力は4.5倍に高速化 心理的な部分もメリットに
以前に手掛けた異常検知のプロジェクトにおいて、GAN(Generative Adversarial Network)やVAE(Variational Autoencoder)に近い画像生成をGeForce GTX 1080 Ti×4基のサーバーで処理したところ、約180時間かかったそうだ。しかし、同じ画像生成をNVIDIA DGX-2で処理したところ、わずか40時間ほどで終了。柳原氏は「複数GPUの分散処理環境の構築に手間取っていたが、NVSwitchですぐにそのメリットを享受できた。入出力の環境などが異なるので純粋なGPUの性能比較ではないが、単純に比較して4.5倍も高速化できたのは非常に大きい」と絶賛し、「1週間かかっていたものが1日半で終わるわけですから、その時間で別のクリエイティブな作業ができるのは非常に魅力的です」と笑みをこぼす。
一方で、阿部氏はエンジニアの観点から、自社で高性能なGPUコンピューティングの環境を用意するメリットを指摘する。というのも、NVIDIA DGX-2の導入にあたっては、GPU環境をクラウドで提供するサービスの利用も候補のひとつとして検討していたからだ。
「クラウドサービスは便利な部分も多いですが、GPUを『利用した分だけ課金される』という仕組みは、エンジニアにとっては意外にネックでした。そもそも、GPUのクラウドサービスの利用料は、決して低価格とはいえません。それだけに、仮にチャレンジしたいことがあっても、課金による心理的な影響がブレーキになってしまう懸念があったのです。そういった背景も踏まえると、試したいことを可能な限りチャレンジできるNVIDIA DGX-2は、コスト面からも運用面からもベストでした」(阿部氏)
今後も、さらなる活用が見込まれるディープラーニング。Ridge-iとしては「経済的・社会的に大きなインパクトが見込める分野」「技術的に相性がよく、すぐに効果が出せる分野」「未開拓で、新しい技術を生み出せる分野」という3つを今後の軸に据えている。例えば、「宇宙」はディープラーニングとの相性が良いことから注力している分野のひとつで、2019年4月からはJAXAとのプロジェクトも始まっている。
「衛星画像の解析は、プレーヤーがまだ少ないのでチャンスだと感じています。とはいえ、この分野に限らず、試してみないとわからないことが多いのも事実。NVIDIADGX-2でより多くのトライ&エラーを重ね、今後も顧客にとってのベストなソリューションを提供していきます」(柳原氏)。
Ridge-iの使用モデル
NVIDIA DGX-2
最新アーキテクチャVolta世代のGPU「TeslaV100」を16基搭載するAIシステム。NVIDIAのバス規格「NVLink」を拡張した革新的なテクノロジー「NVSwit ch」を実装し、16基のGPUを同時に2.4TB/sの超高速で相互接続することにより、2PFLOPSの演算性能を実現する。