整合生物学期刊网 登录      注册

南京林业大学学报(自然版) ›› 2024, Vol. 48 ›› Issue (03): 268-274.

• • 上一篇    下一篇

基于EMD和CatBoost算法的改进时间序列模型——以大连市PM2.5预测为例

赵凌霄, 李智扬, 屈磊磊   

  1. 大连海洋大学海洋与土木工程学院
    复旦大学大气与海洋科学系
    重庆大学土木工程学院
    大连海洋大学信息工程学院
  • 发布日期:2024-10-18
  • 基金资助:
    辽宁省博士科研启动基金项目(2020-BS-216); 国家级大学生创新创业训练计划(202110158002); 辽宁省大学生创新创业训练计划(S202210158006)

  • Published:2024-10-18

摘要: 【目的】解决传统大气PM2.5浓度时序预测时精度较低问题,减少PM2.5时间序列的非线性、高噪声、不平稳与波动性对预测的影响,从而更精确地预测PM2.5浓度。【方法】以2014年1月1日至2022年1月31日大连市雾霾天气时PM2.5数据为例,提出了经验模态分解(EMD)、分类提升(CatBoost)、自回归综合移动平均模型(ARIMA)组合的混合机器学习时间序列模型,并与传统自回归模型(AR)、ARIMA,以及只加入EMD方法后的混合模型进行比较。【结果】混合模型EMD-CatBoost-ARIMA较原始序列均方根误差(RMSE)改进20.76%,平均绝对值误差(MAE)改进17.40%,希尔不等系数(TIC)改进29.17%。【结论】对于高熵值的重构序列,EMD分解方法和CatBoost算法能够显著提升PM2.5时间序列模型的预测性能。相比较传统时间序列模型,EMD-CatBoost-ARIMA模型对大气PM2.5浓度预测性能较高。

关键词: PM2.5浓度, 经验模态分解(EMD), 时间序列模型, 混合模型, CatBoost算法, 机器学习, 大连市

中图分类号: