数十もの人工衛星が軌道を周回し、今後 10 年でさらに多くの衛星が新規に予定されている状況の下、地理空間画像はどんどん大きく複雑化しており、それを管理して価値ある知見を引き出すことが次第に難しくなっています。

そうした中、無料で公開されている衛星画像のうち、最も重要な Landsat と Sentinel-2 の 2 つの衛星によって記録されたパブリック データセットが Google Cloud で利用できるようになったことを、私たち Google はうれしく思います。
Landsat は、米国地質調査所(USGS)NASA の共同プロジェクトとして開発された人工衛星のミッションです。1972 年の 1 号機以来、最も長い期間にわたって宇宙から継続的に地球上の土地のありのままの姿を記録しています。

そのミッションの長さとマルチスペクトル センサーから得られる豊かなデータから、Landsat によって記録されたイメージ セットは地球観測データの標準と考えられています。Landsat のデータは、農業や地質学、林業、地域計画、教育、地図作成、地球変動と大災害への対応などの分野で、その価値が実証されています。

Landsat の画像コレクションは、4、5、7、8 号機の完全な USGS アーカイブを含み、データは 7、8 号機から新しいデータが届くたびに更新されます。コレクションは毎日更新され、1984 年から現在に至る 400 万の光景と 1.3 ペタバイトのデータを形成しています。35 年以上にわたって蓄積された地球の姿がすぐに分析できる形で用意されているのです。

一方、Sentinel-2 は欧州連合(EU)の壮大なコペルニクス地球観測計画の一環として打ち上げられた衛星です。ピクセルあたり 10 メートル未満という、Landsat よりもはるかに鮮明な解像度で地球のイメージを生み出すマルチスペクトル撮像装置(MSI)が投入されており、この分野の標準を引き上げました。

Sentinel-2 のデータは農業や林業、土地管理分野のアプリケーションで特に役に立っており、たとえば森林地帯の地図を作るための葉面積と葉緑素、水の量の研究や、内陸部の水路と海岸地域の監視などで使われています。洪水や噴火など自然災害の画像も、防災地図の作成や人道支援活動のために利用できます。

現在、Sentinel-2 の画像コレクションには 97 万枚のイメージが含まれ、そのデータは 430 テラバイトを超えており、日々更新されています。
Sentinel-2 によるオーストラリア ブリスベン市の衛星画像(Copernicus 2016)

私たち Google は長年にわたって Landsat と Sentinel-2 の衛星画像コレクションを扱っています。これまでも、地理空間データをペタピクセル規模で分析するクラウド ベースの Google Earth Engine を使用して、これらの衛星のパブリック データセットをスピーディに分析してきました。

Earth Engine は、数ペタバイトのパブリック データ カタログと、使いやすいスクリプティング インターフェースおよび Google の強力なインフラを組み合わせることで、地球観測の革新的な発展を支えてきました。

このたび、最も重要な 2 つのデータセットが Google Cloud で利用できるようになり、それによって Google Compute EngineGoogle Cloud Machine Learning などの Google Cloud サービスを使ったワークフローが可能になります。

衛星画像のデータセットと Google Cloud を組み合わせて活用しているお客様の 1 社が Descartes Labs です。同社は、機械学習サービスと地理空間データを組み合わせて地球規模での穀物収穫量の予測に役立てています。立ち上げたばかりのスタートアップにとって、衛星画像はとても高価で手が出なかったと語る同社 CEO の Mark Johnson 氏は、両者の組み合わせを次のように評価しています。

「主要穀物の収穫量の正確な機械学習モデルを作るためには、地球全体の数十年分の衛星画像が必要でした。Google Earth Engine がホスティングしている Landsat アーカイブが Google Cloud で公開されたおかげで、私たちはペタバイト級のデータの収集に煩わされることなくアルゴリズムに集中できます。地球観測は新しい衛星が打ち上げられるたびに進歩していき、それに伴って私たちの食糧供給予測能力も向上していくでしょう。Google が地理空間データを Google Cloud で利用できるようにしたことが、私たちのような企業が地球のことをより深く理解することにつながり、とてもうれしく思います」
Landsat 8 号機による米国アイオワ州ハンボルト郡の衛星画像(USGS)
2016 年 7 月時点のアイオワ州ハンボルト郡の土地分割と農地の境界。機械学習サービスと Google Cloud の Landsat データを使って作成
Spaceknow も、Google Cloud による Landsat データのマイニングからユニークな知見を引き出している企業です。同社は、世界の経済的動向を宇宙から追跡することで世界経済の見通しを立てています。

Spaceknow の Urban Growth Index は、中国をはじめとする地域の膨大な量のマルチスペクトル イメージを分析しています。同社は、多重的な衛星画像からセマンティック ラベルを予測できる TensorFlow ベースのディープ ラーニング フレームワークを使って、指定された地域において都市タイプに分類される土地の割合を割り出しています。

また、同社の China Satellite Manufacturing Index は、Landsat の 7、8 号機による中国全土 6,000 以上の工場地帯の画像をプロプライエタリなアルゴリズムで分析し、中国の工業生産活動の水準を計測しています。この指標は、22 億の衛星観測情報を駆使して 50 万平方キロメートルを超える面積をカバーしており、衛星から新しい画像が届くたびに即座に更新されます。

「Google Cloud は、いまだかつてない規模でニューラル ネットワークを開発、訓練、デプロイするというユニークな能力を提供してくれます。私たちの顧客企業は、私たちが提供している情報に基づいて日々の重要な意思決定を行っています」と、Spaceknow の CEO である Pavel Machalek 氏は述べています。
中国福建省福州市の衛星画像。左が 2000 年の Landsat 7 号機、右が 2016 年の Landsat 8 号機(USGS)

1 ペタバイトを超える世界最先端の衛星画像データを自在に扱えれば、それだけのデータを格納するためのコストと、巨大なデータセットのダウンロードに必要な時間とコストを削減できるとともに、顧客やユーザーのための製品 / サービスを構築するという最も大切な作業に集中できます。

Google Cloud の機械学習や計算サービスか、それとも Earth Engine のシンプルで強力な分析機能か。皆さんがどちらを利用するにせよ、ピクセルから知識を生み出し、より良い決定を下せるように、私たち Google はお手伝いをさせていただきます。

地理空間データセットの詳細は http://cloud.google.com/storage/docs/public-datasets/、Google Cloud で利用できるパブリック データセットについては http://cloud.google.com/public-datasets/ をご覧ください。


* この投稿は米国時間 10 月 4 日、Google Earth Engine の Product Manager である Peter Birch によって投稿されたもの(投稿はこちら)の抄訳です。

- Posted Peter Birch, Product Manager Google Earth Engine