DeepLearning BOX/Alphaが海洋ゴミ問題の解決を後押し
海洋研究開発機構 付加価値情報創生部門 様
海洋研究開発機構の松岡氏と日髙氏は、世界レベルで深刻な問題となっている海洋ゴミの研究に挑んでいる。この研究で重要なポイントとなるのが、GPUを利用したAIの学習と画像解析。最新アーキテクチャの高性能GPUを搭載する「DeepLearning BOX/Alpha」が、これらの作業を強力にバックアップする。
神奈川県横須賀市に本部を置く国立研究開発法人海洋研究開発機構(Japan Agency for Marine-Earth Science and Technology :JAMSTEC)は、「新たな科学技術で海洋立国日本の実現を支え、国民、人間社会、そして地球の持続的発展・維持に貢献する」ことを使命に掲げる海洋科学技術の総合研究機関。「地球環境変動の統合的理解とその予測」「地球内部ダイナミクスの統一像の構築と地震・津波の防災研究」「生命の進化と海洋地球生命史」「資源研究・海洋地球生命工学の新たな展開」を長期ビジョンにおける課題として設定し、さまざまな研究開発に取り組んでいる。
JAMSTECにおいて、人工知能(AI)の研究開発を一手に引き受けているのが、付加価値情報創生部門にある組織の1つ「情報エンジニアリングプログラム(IEP)」である。そのIEPに所属する副主任研究員の松岡大祐氏は、世界有数の性能を誇るJAMSTECのスーパーコンピュータシステム「地球シミュレータ」から得られたシミュレーション結果をCGで可視化する研究に長年携わってきた一方で、近年はAIや画像認識などを用いた地球規模の流体現象の検出や予測手法を研究。2020年には、気象ビッグデータとAIで発生前の台風を高精度に検出する研究論文が地球惑星科学分野の学術論文誌「Progress in Earth and Planetary Science(PEPS)」のPEPS Most Downloaded Paper Award 2020を受賞するなど、世界的にも評価される成果を上げてきた。
「JAMSTECには情報系の研究者や技術者が少なかったことから、以前はAIの研究があまり進んでいませんでした。そこで私は、さまざまな分野の人を集めて2016年にAIの勉強会を立ち上げたほか、2018年秋には自身のAI研究をベースとしたオンラインコンペティションを開催し、日本中のAI技術者や研究者に参加してもらいました。これらの活動が注目を集めたのか、現在はAIが活用できそうな多彩な研究プロジェクトから声をかけてもらっています」(松岡氏)
その松岡氏の下、ともにAIの研究開発に携わっているのが2019年に入職した日髙弥子氏。日髙氏は、学生時代は深海性のクラゲ類をメインとする生物分類学の研究に没頭してきたが、その研究の中でAIを活用した画像解析の重要性に着目。「生物×AI」に大きな可能性を感じたことから、JAMSTECでAIの研究開発を手掛けるようになった経緯がある。
「クラゲなどの脆弱な深海生物の生態は、基本的に深海探査機などで撮影された動画や静止画からでしか情報が得られません。そのため、これまではその動画や静止画を目視で確認し、地道に情報の種を見つけるしか方法がありませんでした。私自身、この作業には本当に苦労してきただけに『どうにかして自動化できないか』と痛感し、AIの技術を身につけたいと思ったわけです」(日髙氏)
サイズの大きい画像も解析できる優れた性能に確かな手ごたえ
現在、松岡氏と日髙氏がメインの研究内容として取り組んでいるのは、AIによる画像処理技術を利用した「海洋ゴミの自動検出」である。そもそも、海洋ゴミの増加は世界レベルの深刻な問題となっており、その対応には行政も頭を悩ませている状況にある。また、海岸にあるプラスチックゴミは日光による劣化や波などの影響で破砕化するため、最終的に回収が難しいマイクロプラスチックゴミとして海に流出してしまう原因にもなっている。さらに、海岸に多くのゴミがたまってしまうとダイレクトに景観を損ねるため、観光業やそのための清掃作業などにも大きく影響する点も見逃せないポイントだ。
そこで松岡氏と日髙氏は、研究の第一歩として「海岸にあるゴミの分類と数値化」を実現させるための技術開発を2019年からスタート。この技術の確立によって「清掃コストなどの見積りに役立つとともに、海岸のゴミが海へ流出していく行程やその科学的な理解にも大きく貢献する」と日髙氏は説明する。
この研究では、海岸の写真データをAIで画像解析する手法を取っており、具体的には「セマンティック・セグメンテーション」という技術が用いられている。このセマンティック・セグメンテーションでは、AIが画像に写っているそれぞれの物体の種類を識別するとともに、輪郭までも解析して細かく領域分けすることが可能。将来的には、「海岸全体に対するゴミの被覆面積などを算出する」(日髙氏)ような技術の研究開発にもつなげていく予定だ。
「現在は『人工漂着物』や『自然物』、あるいは『空』や『海』などの8種類に分類し、それぞれに色分けして領域を推定できるAIを開発しています。ディープラーニングの応用に長けた技術者である同僚の杉山大祐氏の尽力のおかげで、現状での正解率は約8割とかなり高い精度まで上がってきており、領域の推定もかなり細かい部分まで検出できるようになってきました。なお、今回の研究で使用した写真データは約3500枚。約2800枚をAIの学習(ディープラーニング)に利用し、残り約700枚で画像解析のテストを実施しました」(日髙氏)
このAIの学習や画像解析において、必要不可欠となるのがGPUである。松岡氏はディープラーニングや画像解析の研究において「GPUは切っても切れない存在」と考えており、2010年頃からCG・可視化研究にGPUを利用してきたほか、2015年頃からはディープラーニングにもGPUを利用してきた。そのような背景とともに、研究者として「可能な限り最新かつ快適なGPU環境を導入したい」という思いから、2021年2月に最新のNVIDIA Ampereアーキテクチャを採用したGPU「NVIDIA RTX A6000」を搭載するEPYC搭載ディープラーニングマシン「DeepLearning BOX/Alpha」を、専用マシンとして導入した。
その結果、従来のGPUマシンでは画像サイズが800×600ピクセル程度でないと解析作業を上手く実行できなかったのに対してDeepLearningBOX/Alphaでは1600×1200ピクセルでも実行可能になったとのこと。元々、セマンティック・セグメンテーションは大きな負荷のかかる処理なだけに、画像サイズを大きくしても「手元のマシンでしっかり対応できるのはとても魅力的」と、松岡氏はその優れた性能に確かな手ごたえを感じている。
AIの画像解析をアプリ化して海洋ゴミ問題を知るきっかけに
松岡氏がDeepLearning BOX/Alphaを導入した理由は、他にもいくつかある。例えば、JAMSTECの地球シミュレータは2021年3月に第三世代から更新されたが、第四世代にして初めてGPUノードが搭載されることとなった。その際に採用されたのがNVIDIA RTX A6000と同じNVIDIA Ampereアーキテクチャの最上位機種「NVIDIA A100」である(GPUノードは2021年6月から稼働開始)。そこで松岡氏は「NVIDIA AmpereアーキテクチャGPUの性能や使い勝手を、地球シミュレータで利用する前にチェックしておきたい」と考えたことも、理由の1つに挙げられる。
また、地球シミュレータは非常に優れた性能を有するスパコンだが、JAMSTEC全体で利用するため、必ずしも「自分の希望するタイミングや性能で利用できるわけではない」(松岡氏)という悩みがある。しかし、今回のDeepLearning BOX/Alphaは自分たちのために導入した専用GPUマシンであることから、制限されることなく利用する点は大きなメリット。高性能なGPUを搭載するマシンが自分の手元にあるという「安心感」の観点からも、松岡氏はその価値を高く評価する。
そのほか、松岡氏はDeepLearning BOX/Alphaの「使い勝手に良さ」を、魅力の1つとして挙げる。というのも、これまでの研究では日髙氏がメインでDeepLearning BOX/Alphaを利用してきたが、少し前から作業をサポートしてくれる大学院生も利用するようになったとのこと。スーパーコンピュータのような大型計算機を利用する場合、通常であれば事前にスクリプトなどを用意する必要があるため何かと面倒な作業が必要となるのだが、DeepLearning BOX/Alphaは1台で作業が完結することから学生でも扱いやすく、「学生がAI研究のきっかけとして扱う機材としても優れている」と松岡氏は実感している。
最後に今後の展望について聞くと、日髙氏はさまざまなビジョンを持っているようだ。1つは、現在研究中のAIによる画像解析技術の「アプリ化」。将来的には「スマートフォンなどでの利用を可能にしたい」と考えており、例えば海岸を訪れた住民や観光客がスマホで海岸の写真を撮ると、その場ですぐに「その海岸の綺麗さ(=汚れ具合)がわかる」(日髙氏)というシステムを想定。実装には「アプリの継続利用を促す機能や施策」などが必要となってくるが、実現すれば 多くの人に海洋ゴミの現状を知ってもらうきっかけとなるだろう。さらに、このシステムは膨大な画像データの蓄積にも貢献できることから、「継続的なAI開発やモニタリングにも役立てたい」と日髙氏は構想する。
一方で「NVIDIA Jetson」のような組込みAIエッジシステムにも注目しており、監視カメラと組み合わせた現場観察ツールとしての利用や、学生向けのAI学習ツールとしての活用などにも期待している。海洋ゴミの研究にとどまらず、多彩な取り組みに携わっていくことで「AIのすそ野を広げるとともに、若い人材の育成などにつなげたていきたい」(日髙氏)という思いだ。
海洋研究開発機構 付加価値情報 創生部門の使用モデル
DeepLearning BOX/Alpha
NVIDIA AmpereアーキテクチャのGPU「NVIDIA RTX A6000」と水冷の第二世代AMD EPYCプロセッサを搭載したDeeplearningモデル。GPUは複数枚の搭載が可能で、メモリは8チャンネルまで対応する。また、ストレージはNVMeを標準搭載するほか、ECC RegisterdメモリやIPMIも標準採用する。