xLSTM-Mixer — 天气预测项目复现与实现总结

本项目基于 xLSTM-Mixer 框架，面向上海 ERA5 再分析数据，完成 t2m（2 米气温） 的长时间序列预测任务。项目从上游框架出发，逐步适配到具体的上海天气数据场景，构建了完整的数据清洗 → 训练 → 滚动评估 → 优化实验的工作流。

维度	详情
框架	xLSTM-Mixer（基于 xLSTM + MLP-Mixer）
数据	ERA5 再分析数据（2020–2025 上海）
目标	t2m（2 米气温），单位：开尔文
任务	长期预测：seq_len=168（7 天），pred_len=24（1 天）
评估	2025 年滚动验证，每日滑动窗口

对应仓库：seraphim522/xlstm-mixer_exploration

xLSTM-Mixer 将 xLSTM（扩展长短期记忆）与 MLP-Mixer 的通道混合思想结合：

上海 ERA5 数据说明：

项目中最重要的经验教训之一：

原则	说明
清洗 = 纯合法性校验	清理非法时间戳、非有限值、非物理值
保留 `tp == 0`	零降水量是合法物理值，不可删除
窗口级跳过	通过 `valid_start_indices` 跳过含 NaN 的窗口
不混合策略	分割策略、权重、OOD 特征作为显式开关，不下沉到清洗层

参数	值
模型	xLSTM-Mixer（ShanghaiERA5Merged）
seq_len	168（7 天小时级）
pred_len	24（1 天小时级）
训练集	2020–2023
验证集	2024
测试集	2025（滚动评估）
损失函数	L1Loss
执行方式	Docker 优先（Windows PowerShell）

项目设计了三个可组合的实验变量：

默认方案：A1B1C1

夏季预测最好，冬季和春季波动较大，与气温变化幅度正相关。

夏季（7-8 月）MAE 低于 1.0，模型在温度高且稳定的时段表现最优。

t2m_ood（气温偏离信号）作为额外特征输入：

A1B1C1 方案（日历分割 + 春季加权 + t2m_ood）：

指标	值
MAE_target	1.3097
MSE_target	3.3485

在 E:\dl_learning\xlstm\优化结果\ 下保存了 A/B/C 组合的波形对比图（A0B0C0 到 A1B1C1），展示了不同配置下模型预测轨迹的差异。

交付件	位置
训练配置	`configs/long_term_forecasting/shanghai_era5_2020_2025.yaml`
滚动评估输出	`outputs/shanghai_rolling_validation_2020_2025_formal/`
评估报告	`summary_report.md`
处理调整记录	`processing_adjustments.md`
A/B/C 波形对比	`E:\dl_learning\xlstm\优化结果\`