JSTトッププレス一覧 > 共同発表

平成26年7月23日

理化学研究所
科学技術振興機構(JST)

「京」を使い世界最大規模の全球大気アンサンブルデータ同化に成功
~天気予報シミュレーションの高精度化に貢献~

ポイント

理化学研究所(理研、野依 良治 理事長)は、天気予報シミュレーションの高精度化を目指し、スーパーコンピュータ「京」注1)を使って、10,240個のアンサンブル注2)で3週間分という世界最大規模の「全球大気のアンサンブルデータ同化注3)」に成功しました。必要とされる計算量は、これまでの100個程度のアンサンブルを使った場合に比べて100万倍という大規模なものになります。これは、理研 計算科学研究機構(平尾 公彦 機構長)データ同化研究チームの三好 建正 チームリーダーと、近藤 圭一 特別研究員、および大規模並列数値計算技術研究チームの今村 俊幸 チームリーダーの研究グループによる成果です。

スーパーコンピュータを使った天気予報を行う方法の1つに「アンサンブル予報」があります。アンサンブル予報は、風や気温などの時間変化を物理学の法則に基づきコンピュータで計算して将来の大気の状態を予測するシミュレーションを、並行して複数実行し、同等に確からしい「パラレルワールド(並行世界)」を作ります。この平均やばらつきから、確率的な天気予報を行います。

「アンサンブルデータ同化」は、アンサンブル予報で作られたパラレルワールドに実測データを加え、すべてのパラレルワールドを誤差の範囲内に制御します。これまでのアンサンブルデータ同化では、100個程度以下のアンサンブル(パラレルワールドの数)を用いていましたが、今回、これを世界最大規模の10,240個に増やし、アンサンブルデータ同化の計算を約8倍高速化、理論ピーク性能比44%超という極めて高い実行効率を達成することで、全球大気のアンサンブルデータ同化を3週間分実行することに成功しました。これまでは観測の影響を2,000~3,000kmに限定する必要がありましたが、今回の成果により、例えば日本から1万km遠方の観測データが、瞬時に日本の大気状態の推定精度を向上する可能性が明らかとなり、天気予報シミュレーションの改善に貢献することが期待されます。

本研究成果は、米国の科学雑誌『Geophysical Research Letters』(8月15日第41号)に掲載されるに先立ち、オンライン版(7月24日付け:日本時間7月25日)に掲載予定です。

アンサンブルとは、フランス語で「一緒に」「一揃い、全体」という意味。

1.背 景

スーパーコンピュータを使った天気予報を行う方法の1つに「アンサンブル予報」があります。アンサンブル予報は、風や気温などの時間変化を物理学の法則に基づきコンピュータで計算して将来の大気の状態を予測するシミュレーションを、並行して複数実行し、同等に確からしい「パラレルワールド(並行世界)」を作ります。この平均やばらつきから、確率的な天気予報を行います。

「アンサンブルデータ同化」は、気象学の中で目覚ましく発展している研究分野の1つで、アンサンブル予報で作られたパラレルワールドに、実測データを加え、どのパラレルワールドがどの程度確からしいか(現実世界に近いか)を見つけ出します。だんだんと違う方向へ向かうそれぞれのパラレルワールドの軌道を修正し、現実世界に引き戻すことで、パラレルワールドを誤差の範囲内に制御し、アンサンブル天気予報の精度を高めることができます。

これまでのアンサンブルデータ同化は、通常100個程度以下のアンサンブル(パラレルワールドの数)を用いていますが、アンサンブルの数を増やすことでより高精度な予報が可能になります。その理由は下記の①・②です。

しかし、アンサンブルを1万個まで増やすことはとても難しく、途方もない挑戦だと考えられていました。シミュレーションを1万回実行することに加え、アンサンブルデータ同化の際に行う固有値計算注4)を効率的に行う必要があるためです。今回、共同研究グループはスーパーコンピュータ「京」を使って世界最大規模となる1万個以上のアンサンブルデータ同化に挑戦しました。

2.研究手法と成果

アンサンブルデータ同化は、並列して複数のシミュレーションを実行するため、「京」のような超並列型計算機が適しています。しかし、1万個を超えるアンサンブルデータ同化は世界初の試みのため、低解像度かつ単純化された全球大気シミュレーションSPEEDY(スピーディ)モデル注5)を用いることで、個々のシミュレーションをできるだけ高速なものとしました。

本研究で採用したアンサンブルデータ同化システム「局所アンサンブル変換カルマンフィルタ(LETKF)注6)」は並列計算効率に優れた現実的な手法で、アンサンブルの数を次元とする固有値計算を格子点の数だけ繰り返し行います。固有値計算の計算量は行列の次元の3乗に比例するため、アンサンブルの数を100倍に増やすと、その3乗である100万倍という膨大な計算が必要となります。そこで、LETKFの固有値計算部分に、「京」向けに最適化された高性能固有値計算ソフトウェア「EigenExa(アイゲンエクサ)注7)」を組み込み、アンサンブルデータ同化の計算を大幅に高速化、1回のLETKFの計算を125分から15分へと8倍以上高速化しました。LETKFは並列効率が非常に高いアルゴリズムで、「京」を使って高い性能が出ますが、さらにEigenExaとの相乗効果により、4,608ノード(京全体の約20分の1)を使って、理論ピーク性能比で44%超にあたる263テラFLOPS(1テラFLOPSは1秒間に1兆回の浮動小数点演算ができる性能)という極めて高い実効性能を達成しました。これにより、3週間分の10,240個のアンサンブルデータ同化に成功しました。

10,240個のアンサンブルで見えた誤差相関やヒストグラム(統計グラフの一種)などの統計は、これまでの100個のアンサンブルとは比較にならないほど高精度なものでした。100個のアンサンブルでは、図1上に示すように図の中心付近の北部太平洋にある黄色い星の場所にある観測データの影響が、北半球全体にランダムに広がります。このほとんどは、物理的に意味のない統計上のノイズによるものだと考えられ、図1中のように、観測の影響を2,000~3,000km以下に限定して扱う必要がありました。このような局所化を行わないと、データ同化がうまく働きません。一方、10,240個のアンサンブルでは、図1下のように統計ノイズが抑えられ、実際は北部太平洋にある観測データの影響が、遠くロシア西部にまで及ぶことが分かります。

また、10,240個のアンサンブルを使うことで、高次の統計量をはっきりと見ることができるようになりました。図2は、ある地点のある時刻における水蒸気量のヒストグラムですが、100個のアンサンブルでは全く確認できない2つの山が、10,240個では誤差を表現する解像度が増えて、はっきりと確認できます。図2の実線にはガウス分布(正規分布)関数を示していますが、このような大気状態のばらつきがガウス分布と異なる構造を持つこと(非ガウス性)をこれほど精細に直接確認するのは初めてのことです。

3.今後の期待

本研究によって明らかにされた1万km以上も遠くの大気の誤差相関は、これまでは存在しないか、あるいは存在したとしても無視できるものだと考えられてきました。このような1万kmを超える遠方の観測の影響が考慮できるとすれば、日本から1万km以上離れた場所の観測データを使って、瞬時に日本の大気状態の推定誤差を減らすことができることを意味します。本成果により、より遠くの観測を有効に活用して大気状態の推定誤差を減らし、天気予報シミュレーションの精度向上が期待できます。また、大気状態のばらつきがガウス分布と異なる構造を持つことを直接確認したことにより、このような非ガウス性を考慮したさらに高度なデータ同化手法の開発が進む可能性があります。

本研究は、理研 計算科学研究機構の学際的な研究環境を生かして、2つの全く異なる基盤技術(データ同化と大規模並列数値計算技術)を組み合わせることで、効果的に進められたものです。このような学際連携は、スーパーコンピュータを使ったさまざまなシミュレーションにおけるデータ同化の研究で、今後重要な役割を果たしていくと予想されます。今回の研究成果はその最初の成功例です。

本研究は、低解像度の単純化されたSPEEDYモデルを用いたシミュレーション研究で、現実大気の実際の観測データを用いたものではありません。このため、本研究の成果がそのまま現実大気に適用できるかどうかは明らかではなく、今後のさらなる研究の発展が待たれます。

なお、本研究の一部は、科学技術振興機構(JST) 戦略的創造研究推進事業(CREST)「科学的発見・社会的課題解決に向けた各分野のビッグデータ利活用推進のための次世代アプリケーション技術の創出・高度化」(研究総括:北海道大学・田中 譲)における研究課題「「ビッグデータ同化」の技術革新の創出によるゲリラ豪雨予測の実証」(研究代表者:三好 建正)、「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化」(研究統括:国立情報学研究所・喜連川 優)における研究課題「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術」(研究代表者:東京工業大学・松岡 聡、共同研究者:三好 建正)および「ポストペタスケール高性能計算に資するシステムソフトウェア技術の創出」(研究総括:理研 計算科学研究機構・米澤 明憲)における研究課題「ポストペタスケールに対応した階層モデルによる超並列固有値解析エンジンの開発」(研究代表者:筑波大学・櫻井 鉄也、共同研究者:今村 俊幸)の一環として行われました。

<参考図>

図1 アンサンブルデータ同化による18日目の水蒸気量の相関マップ

黄色い星の水蒸気量に対する各地点の水蒸気量の相関係数を色で示している。

上:100個のアンサンブルを使った場合。
中:上図に局所化関数を適用した場合。
下:10,240個のアンサンブルを使った場合。

図2 アンサンブルデータ同化による18日目の水蒸気量の誤差を表すヒストグラム

18日目の北緯16.7度、東経150度における水蒸気量の誤差を表すヒストグラム。実線はガウス分布(正規分布)関数を示しているが、このような大気状態のばらつきの非ガウス性を直接確認するのは初めてである。

左:100個のアンサンブル使った場合。
右:10,240個のアンサンブルを使った場合。

<用語解説>

注1) スーパーコンピュータ「京」
文部科学省が推進する「革新的ハイパフォーマンス・コンピューティング・インフラ(HPCI)の構築」プログラムの中核システムとして、理研と富士通が共同で開発を行い、2012年9月に共用を開始した計算速度10ペタFLOPS級のスーパーコンピュータ。
注2) アンサンブル
アンサンブル予報では、誤差の範囲内にある複数のシミュレーションを実行して、同等に確からしい「パラレルワールド」を作り、予報のばらつき(不確実性)を表現する。例えば、100個のアンサンブル予報では、100個の独立なシミュレーションを並行して実行する。
注3) アンサンブルデータ同化
データ同化は、シミュレーションと現実世界とを結びつける統計数理に基づいた学際的科学で、スーパーコンピュータを用いた天気予報の精度を左右する根幹的な役割を果たす。アンサンブルデータ同化は、複数のシミュレーションによるアンサンブル予報を用いて、日々変動する誤差を考慮する高度なデータ同化手法。アンサンブルとは、フランス語で「一緒に」「一揃い、全体」という意味。
注4) 固有値計算
正方行列を固有値および固有ベクトルに分解する計算。LETKFでは、行列の平方根や逆行の計算を効率的に行うために必要となる。
注5) 全球大気シミュレーションSPEEDY(スピーディ)モデル
2003年にMolteniらによって開発された低解像度で単純化された全球大気シミュレーションモデル。全球を東西96×南北48×鉛直7の格子に区切って、各格子の気象要素(水平風、気温、水蒸気量、表面気圧、降水量など)をシミュレーションする。水平格子数は、4,608個。
注6) 局所アンサンブル変換カルマンフィルタ(LETKF)
LETKFはLocal Ensemble Transform Kalman Filterの略。アンサンブルデータ同化手法の一種で、特に並列計算効率に優れた現実的な手法。メリーランド大学との協力により、データ同化研究チームが開発した。
注7) EigenExa(アイゲンエクサ)
ビッグデータにおけるデータ相関関係の解析などに必要な固有値計算が高速に行える高性能ソフトウェア。大規模並列数値計算技術研究チームが開発した。

<原論文情報>

T. Miyoshi, K. Kondo, and T. Imamura “The 10240-member ensemble Kalman filtering with an intermediate AGCM”.Geophysical Research Letters, 2014,
doi: 10.1002/2014GL060863

問い合わせ先>

<研究に関すること>

理化学研究所 計算科学研究機構 データ同化研究チーム
チームリーダー 三好 建正(みよし たけまさ)
Tel:078-940-5810 Fax:078-304-4961

<JST事業に関すること>

科学技術振興機構 戦略研究推進部 ICTグループ
松尾 浩司(まつお こうじ)
Tel:03-3512-3526 Fax:03-3222-2064
E-mail:

<報道担当>

理化学研究所 計算科学研究機構 広報国際室
担当 岡田 昭彦(おかだ あきひこ)
Tel:078-940-5625 Fax:078-304-4964
E-mail:

理化学研究所 広報室 報道担当
Tel:048-467-9272 Fax:048-462-4715

科学技術振興機構 広報課
Tel:03-5214-8404 Fax:03-5214-8432

(英文)“K computer runs largest ever ensemble simulation of global weather”