2024大数据挑战赛全国六强团队获奖经验+ppt分享（二）

数据派THU · 公众号 · 大数据 · 2024-09-14 17:00

正文

团队名称

会萤的

团队成员

周文骞（上海第二工业大学）

陈凯（上海第二工业大学）

潘瑞珺（上海第二工业大学）

团队名次

全国第五名

赛题描述说明介绍

报名 | 2024中国高校计算机大赛——大数据挑战赛报名启动！

关注微信公众号“数据派THU”，后台回复“20240615”，即可获取“赛题描述”

参赛分享与收获

1. 数据处理与特征工程

针对原始数据的处理至关重要。通过对站点周围的气象数据进行特征提取，包括矢量风速的合成、差分和时间序列的引入，有效提升了模型捕捉局部气象特征的能力。增加了特征维度中的均值和方差等统计量，增强了模型对数据模式的泛化能力。这使得模型在面对复杂的时间序列时表现更加稳定。

2. 模型设计与优化

使用 iTransformer，并对其进行改进，去除decoder部分，替换为RNN系列模型，强化了模型对局部时序信息的捕捉能力。在长短期时间序列的处理上，该结构能有效平衡复杂性和预测性能。LSTM被引入作为decoder，通过逐步解码时间序列，提升了模型在面对复杂变化时的适应能力，减少了预测的波动性。该方法证明了在应对长时间预测中的有效性。

3. 模型集成

比赛中，模型在长期预测时表现不如短期预测准确。为此，通过将短期（24小时）的预测结果复制并加权平均，融合为72小时的预测结果。这样做有效减少了长期预测的不稳定性，提高了长时间跨度内的准确性。

4. 总结

这次参赛经历充满了挑战与收获。面对庞大的气象数据和复杂的任务目标，团队深刻意识到数据预处理和分析在整个过程中的关键作用。尽管过程中遇到了许多难题，但通过不断的实验和调整，逐步掌握了如何更好地处理时间序列数据，并探索出了一些提升预测精度的有效策略。在模型设计和优化的过程中，团队始终保持开放的心态，不断尝试新思路，结合讨论和反馈，逐渐优化了模型的整体性能。同时，随着项目的推进，我们意识到在面对复杂问题时，团队合作和跨领域的交流尤为重要，每个人的不同视角都为问题的解决提供了新的可能。整个参赛过程不仅提升了我们在大数据和深度学习方面的能力，也帮助我们更加系统地思考问题。通过与其他团队的交流，我们开阔了视野，学到了很多有价值的经验，这为未来类似的项目奠定了坚实的基础。

决赛答辩ppt分享