衛星データと陸域モデルのデータ同化:気候変動研究におけるモデル精度向上の実践的アプローチ
はじめに
気候変動研究において、地球システムの理解と将来予測には物理モデルが不可欠です。特に陸域モデルは、水循環、炭素循環、エネルギー交換といった重要なプロセスをシミュレートし、気候システムにおける陸域の役割を評価するために用いられます。しかし、モデルは依然として構造的・パラメータ的な不確実性を抱えており、現実世界の観測データを用いてその精度を向上させることが求められています。
宇宙からの地球観測衛星は、広範囲かつ周期的に陸域の状態に関する多様な情報を提供します。これらの衛星データを陸域モデルに統合する技術として「データ同化」が注目されています。データ同化は、観測データとモデル予測を統計的に最適に組み合わせることで、モデルの状態やパラメータをより現実に近い値に調整する手法です。本稿では、衛星データを用いた陸域モデルへのデータ同化の基本的な考え方、主要な手法、そして気候変動研究への応用と実践的な課題について解説します。
陸域モデルにおけるデータ同化の重要性
陸域モデルは、降水、放射、気温などの気候強制力を入力として、土壌水分、地表面温度、植生状態、河川流量などを計算します。しかし、モデルのパラメータ(例:土壌の物理特性、植生の光合成効率)は不確実であり、また初期状態も完全に既知ではありません。これにより、モデル出力は現実から乖離する可能性があります。
衛星データ同化は、この乖離を減らす強力なツールです。衛星から観測される陸域の状態変数(例:表面土壌水分、地表面温度、植生指数、積雪深度、表面リフレクタンスなど)をモデルの状態変数やパラメータに同化することで、モデルの予測精度を向上させることができます。これは、過去の観測を用いてモデルの状態推定精度を高めること(分析)、そしてその分析状態を初期値として将来の予測を行うこと(予測)の両方において重要です。
データ同化の主要な手法
データ同化の手法は多岐にわたりますが、陸域モデリングでよく用いられる代表的な手法には以下のようなものがあります。
カルマンフィルタ系
- 概要: モデルの状態を線形、誤差をガウス分布と仮定し、モデル予測と観測値から最適な状態推定値を逐次的に計算します。
- 拡張カルマンフィルタ (EKF): 非線形モデルに対して適用可能にしたものですが、線形化誤差が生じます。
- アンサンブルカルマンフィルタ (EnKF): 多数のモデル実行(アンサンブル)を用いて状態の誤差共分散を推定する手法です。非線形性が強いシステムにも適用しやすく、大規模なシステムに適しています。計算コストが問題となる場合があります。
変分法
- 概要: モデル予測と観測値の差を表すコスト関数を最小化することで最適な状態推定値(分析値)を求めます。
- 3次元変分法 (3D-Var): 特定の時点の観測データを用いて、その時点のモデル状態を修正します。時間的な関連性は考慮しません。
- 4次元変分法 (4D-Var): ある時間窓内の観測データを用いて、その時間窓の初期状態を最適化します。モデルのダイナミクスをコスト関数に組み込むため、物理的に整合性の高い分析値が得られやすいですが、計算コストが高く、 adjoint モデル(随伴モデル)の開発が必要です。
陸域モデルへのデータ同化では、モデルの強い非線形性や状態変数の非ガウス的な分布特性から、EnKFが比較的よく用いられる傾向にあります。
陸域モデルデータ同化に利用される主要な衛星データ例
陸域モデルへのデータ同化では、モデルがシミュレートする変数に対応する衛星観測データが利用されます。
- 土壌水分: SMAP (Soil Moisture Active Passive), SMOS (Soil Moisture and Ocean Salinity) 衛星によるマイクロ波放射計データは、地表面数cmの土壌水分情報を提供します。
- 地表面温度 (LST): MODIS (Moderate Resolution Imaging Spectroradiometer), Sentinel-3 SLSTR (Sea and Land Surface Temperature Radiometer) などの熱赤外データからLSTが導出されます。
- 植生情報: MODIS, Sentinel-2 MSI (MultiSpectral Imager) データから、正規化植生指数 (NDVI) や葉面積指数 (LAI) といった植生指数が得られます。これらのデータは、モデルの光合成や蒸散プロセスに関わるパラメータや状態変数の同化に利用可能です。
- 積雪情報: 可視・近赤外データからの積雪域、マイクロ波データからの積雪水当量 (SWE)、ICESat-2のようなLiDARデータからの積雪深度など、様々な衛星データが積雪モデルへの同化に利用されます。
これらの衛星データは、それぞれ異なる空間・時間分解能、観測深さ、不確実性特性を持っています。データ同化においては、これらの特性を適切に評価し、同化スキームに組み込むことが重要です。
実践的なアプローチと課題
陸域モデルへの衛星データ同化を実践する上で、若手研究者が直面しやすい課題と、それに対するアプローチをいくつか示します。
1. 衛星データの準備と不確実性評価
- 課題: 衛星データはそのままではモデルの状態変数に対応しないことが多く、スケール変換やプロダクトに応じた不確実性の評価が必要です。また、雲や降水による欠損、センサーバイアスなども考慮する必要があります。
- アプローチ:
- モデルの空間・時間解像度に合わせたデータの集約・補間を行います。
xarray
やrasterio
といったPythonライブラリがデータ処理に有用です。 - 衛星プロダクトに付随する品質フラグや不確実性情報を利用し、観測誤差共分散行列を適切に設計します。誤差の自己相関や相互相関を考慮することも重要です。
- 他の観測データ(例:地上観測ネットワークデータ)との比較によるバイアス補正手法を検討します。
- モデルの空間・時間解像度に合わせたデータの集約・補間を行います。
2. モデルと観測の関係性の理解
- 課題: データ同化では、モデルの状態空間と観測空間を結びつける「観測演算子(Observation Operator)」が必要です。これはモデルの状態変数から衛星が観測する値をシミュレートする関数です。例えば、モデルの地下数層を含む土壌水分状態から、衛星が観測する表面数cmの土壌水分を導出する物理モデルが必要になります。
- アプローチ: 衛星プロダクトの定義を理解し、陸域モデルの物理プロセスに基づいて観測演算子を構築または既存のものを利用します。熱赤外データからのLST同化であれば、モデルの地表面温度や地中温度勾配からLSTを計算する物理モデル(放射伝達モデルなど)が必要になる場合があります。
3. 同化手法の実装とチューニング
- 課題: 選択したデータ同化手法(例:EnKF)を陸域モデルに組み込むための実装、および同化スキームのパラメータ(例:アンサンブルサイズ、局所化スケール、同化頻度)のチューニングが必要です。
- アプローチ:
- 既存のデータ同化フレームワーク(例:NASA LISなど)の利用を検討します。これにより、一から実装する手間を省き、多くの衛星データインターフェースや同化手法の実装を利用できます。
- Pythonで基本的なデータ同化の概念を実装する練習(例:簡単な線形モデルへのカルマンフィルタ適用)から始め、徐々に複雑なシステムへ拡張していきます。
NumPy
,SciPy
は基本的な線形代数や統計計算に役立ちます。 - データ同化スキームのパラメータは、試行錯誤やクロスバリデーション、あるいは最適化手法を用いて決定します。
4. 同化結果の検証と評価
- 課題: データ同化がモデル精度をどの程度向上させたかを定量的に評価する必要があります。
- アプローチ:
- 同化に使用していない独立した観測データセット(例:高密度の地上観測データ)を用いて、同化後のモデル出力と比較します。
- 二乗平均平方根誤差 (RMSE)、相関係数、バイアスなどの統計指標を用いて評価します。
- 特定の気候イベント(例:干ばつ、熱波)におけるモデル再現性の改善を評価します。
気候変動研究への応用事例
衛星データ同化によって精度が向上した陸域モデルは、様々な気候変動研究に貢献します。
- 水循環変動の理解: 土壌水分や河川流量データの同化により、干ばつや洪水のメカニズム解明、将来予測の精度向上に役立ちます。
- 陸域炭素吸収量評価: 植生情報や土壌水分の同化により、陸域生態系によるCO2吸収量の変動をより正確に推定し、炭素循環モデルの不確実性を低減できます。
- 極端現象の解析: 地表面温度データの同化は、熱波発生時の陸面応答の理解や、モデルによる再現性評価に貢献します。
まとめ
衛星データと陸域モデルのデータ同化は、気候変動研究におけるモデルベースの解析・予測精度を向上させるための重要な技術です。多様な衛星データが利用可能となるにつれて、その重要性はますます高まっています。データ同化の理論的理解に加え、衛星データの特性把握、適切な手法の選択、そして検証・評価といった実践的なスキルは、この分野で研究を進める上で不可欠です。既存のデータ同化フレームワークの活用や、Pythonを用いたデータ処理・解析の習得は、研究を効率的に進める上で有効な手段となります。今後の研究では、異なる衛星データの統合、AI技術との融合など、さらなる発展が期待されています。